要想做好數(shù)據(jù)分析必定要理解和熟悉掌握各類數(shù)據(jù)分析模型,但大部分文章只是給你羅列出了有哪幾種數(shù)據(jù)分析模型及對應(yīng)理論,并未用實例來輔助說明。
很多時候這些模型都進了收藏夾吃灰,大家也沒有深刻理解這種分析模型,等到下次要開始分析數(shù)據(jù)了,又是一臉懵,然后再去收藏夾里翻文章。
學(xué)東西在精不在多,今天就分享1個常用的數(shù)據(jù)分析模型——購物籃分析模型,并附上應(yīng)用實例,希望能讓大家真正掌握這個分析模型,并在之后分析數(shù)據(jù)時能自己把模型靈活用起來!
購物籃分析模型原理
據(jù)說上個世紀九十年代,沃爾瑪?shù)某泄芾砣??員分析銷售數(shù)據(jù)時發(fā)現(xiàn)了一??個令人難于理解的現(xiàn)象,嬰兒的紙尿褲和啤酒放通常會出現(xiàn)在一個訂單里,經(jīng)過數(shù)據(jù)分析發(fā)現(xiàn),買尿不濕的家長以父親居多,如果他們在買尿不濕的同時恰好看到了啤酒,就會有很大的概率購買,從而就能提高啤酒的銷售量。
當然,這個案例現(xiàn)在已被證實是虛構(gòu)的,但這個故事仍讓可以給我們很大的啟發(fā),商品之間的關(guān)聯(lián)關(guān)系是客觀存在的,這種通過研究用戶消費數(shù)據(jù),將不同商品之間進行關(guān)聯(lián),并挖掘二者之間聯(lián)系的分析方法,就叫做商品關(guān)聯(lián)分析法,也叫作“購物籃分析”。
看到這,你可能會覺得這不是常識嗎?為什么還是個數(shù)據(jù)分析模型。
其實不然。雖然這種現(xiàn)象你看過去是常識,但這種通過研究用戶消費數(shù)據(jù),將不同商品之間進行關(guān)聯(lián),并挖掘二者之間聯(lián)系的分析方法,就叫做商品關(guān)聯(lián)分析法,即購物籃分析模型。需要通過「支持度」、「置信度」、「提升度」三個指標判斷商品之間的關(guān)聯(lián)程度,常用于零售行業(yè)。
這個模型一般是用來找出顧客購買行為的模式:
①比如用戶買了A商品,是否會對B商品產(chǎn)生什么影響?
②不同的用戶是否具有不同的購買模式?
③哪些產(chǎn)品應(yīng)該放在一起進行捆綁銷售?
在分析案例前,先解釋下這三個指標分別代表的意思和計算方法。
1 「支持度」
A商品和B商品同時被購買的概率,顯然支持度越大,商品間關(guān)聯(lián)性越強。
計算公式:同時購買A和B訂單數(shù) / 總購買訂單數(shù)
今天共有10筆訂單,其中同時購買可樂和薯片的次數(shù)是7次,那么可樂+薯片組合的支持度就是7/10=70%。
2 「置信度」
因為購買了A所以購買了B的概率,注意與支持度區(qū)分。
計算公式:同時購買A和B訂單數(shù) / 購買A的訂單數(shù)
今天共有10筆訂單,其中購買可樂的次數(shù)是4,同時購買可樂和薯片的次數(shù)是3,則其置信度是3/4=75%
3 「提升度」
先購買A對購買B的提升作用,用來判斷商品組合方式是否具有實際價值,大于1說明該組合方式有效,小于1則說明無效。
計算公式:支持度 / ( (購買A次數(shù)/總購買訂單數(shù))*(購買B次數(shù)/總購買訂單數(shù)) )
今天共有10筆訂單,購買可樂的次數(shù)是8,購買薯片的次數(shù)是6,購買可樂+薯片的次數(shù)是6,那么提升度是0.6 /(0.8*0.6)>1,因此可樂+薯片的組合方式是有效的。
講完購物籃模型的原理和計算公式,只能大概掌握一些皮毛,接下來就帶你用實例來應(yīng)用一下購物籃分析模型,加深印象。
案例分析
以我們最為熟悉的超市為例。
案例背景是A集團超市最近在準備周年大促,需要根據(jù)近3個月A集團超市旗下各門店商品銷售明細,來確定哪些商品需要組合起來捆綁促銷。
先不急著分析,先理清一下思路,要解決這個問題,我們需要從以下五個步驟進行思考。
第一步
確定使用工具、數(shù)據(jù)來源
使用工具:FineBI數(shù)據(jù)分析工具
數(shù)據(jù)來源:A集團超市商品銷售總表(已脫敏處理)
▲A超市商品銷售總表▲
第二步
計算指標
根據(jù)上述計算公式可知,我們需要計算:
①總購買訂單數(shù) ②同時購買A和B的訂單數(shù) ③分別購買A和B的訂單數(shù)
接下來,我們就在FineBI的自助數(shù)據(jù)集中逐個計算。
①總購買訂單數(shù)
要計算總購買訂單數(shù),首先我們要先勾選「單據(jù)編碼」,添加分組匯總,設(shè)置匯總方式為「去重計數(shù)」,對單據(jù)編碼個數(shù)求和,從而輕松計算出總購買訂單數(shù)。
②計算同時購買A和B訂單數(shù)
要計算同時購買A和B的訂單數(shù),就需要復(fù)制一列相同的商品類別,將兩列合并在一起,就可以分出比如A+A、A+B、B+A等的商品組合。
讓表左右合并,而后選擇并集合并,合并依據(jù)為單據(jù)編碼。
將商品名稱作為A商品,集團商品總表-商品名稱作為B商品。顯然,不需要類似 A+A 的組合,因此需要將該數(shù)據(jù)過濾掉,輸入函數(shù)【商品名稱!=集團商品銷售總表-商品名稱】即可。
③計算分別購買A和B的訂單數(shù)
添加左右合并,并將合并結(jié)果命名為「購買A的次數(shù)」,B商品同理計算。
第三步
計算支持度、置信度、提升度
得到上面三個指標后,我們就可以開始計算支持度、置信度、提升度了。
支持度=同時購買A和B訂單數(shù)/總購買訂單數(shù),新增列。置信度,提升度同理,就不列舉了。
第四步
數(shù)據(jù)分析
計算得到支持度、置信度、提升度的結(jié)果后,我們就可以開始進行數(shù)據(jù)分析了。
使用FineBI的自定義圖表,分析商品間的關(guān)聯(lián)程度,用顏色的深淺和具體計算數(shù)字來表示關(guān)聯(lián)程度的高低。
▲商品關(guān)聯(lián)分析▲ ▲商品支持度分析▲ ▲商品置信度分析▲ ▲商品提升度分析▲
第五步
得出分析結(jié)論
(1)微爽日用衛(wèi)生巾和家之寓圓形夾曬架的支持度(同時購買概率)最高,為5.95。且購買家之寓圓形夾曬架后又購買微爽日用衛(wèi)生巾的置信度較高,為0.27,大于平均置信度,因此兩者被一起購買的概率很大,可放置在貨架的相鄰位置,刺激顧客購買欲。
(2)本地小白菜和香妃蜜瓜的置信度最高,為0.42。因此可將小白菜和香妃蜜瓜放在果蔬貨架的相鄰位置或捆綁銷售。
(3)青蔥和雪碧的提升度最高,為8.44。即購買雪碧后對購買青蔥有較大的提升作用,但考慮到青蔥和雪碧的購買量都較大,且都為常備品,基于實際情況來說,不適合捆綁銷售。
(4)鹽津鋪子和嘉士利威化餅的提升度較高,為4.54,大于1。兩個都為零食貨柜商品,因此可考慮捆綁銷售。
總結(jié)
經(jīng)過上述五個步驟,我們可以得出初步的分析結(jié)論。當然,最后的零售促銷方案還是得根據(jù)超市的實際情況來判斷合不合適(例如分析結(jié)論中的青蔥和雪碧),數(shù)據(jù)只能輔助我們的決策,而不能直接給予決策。
-
模型
+關(guān)注
關(guān)注
1文章
3226瀏覽量
48807 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1445瀏覽量
34050
原文標題:數(shù)分必備:購物籃分析模型實例
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論