利用关联规则进行序列分析(sequenceanalysis).ppt

上传人:ga****84 文档编号:344632 上传时间:2018-09-24 格式:PPT 页数:52 大小:1.02MB
下载 相关 举报
利用关联规则进行序列分析(sequenceanalysis).ppt_第1页
第1页 / 共52页
利用关联规则进行序列分析(sequenceanalysis).ppt_第2页
第2页 / 共52页
利用关联规则进行序列分析(sequenceanalysis).ppt_第3页
第3页 / 共52页
利用关联规则进行序列分析(sequenceanalysis).ppt_第4页
第4页 / 共52页
利用关联规则进行序列分析(sequenceanalysis).ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

1、CHAPTER 9 Market Basket Analysis and Association Rules購物籃分析與關聯規則,吳欣潔 張啟帆 國立中興大學行銷研究所,2,前言,圖9.1,一公升的柳橙汁、一些香蕉、洗碗精、窗戶清潔劑、6包裝的蘇打水,蘇打水是否會和香蕉一起買?品牌是否會造成蘇打水銷售的差異?,有什麼是應該在購物籃裡卻沒有的?,洗碗精和柳橙汁一起被買時,窗戶清潔劑是否也一起買了?,不同的人口特質會如何影響顧客的消費?,3,前言,購物籃分析的主要資料來源是零售業,藉由分析銷售點(Point-of-Sale)的資料,以找出哪些商品會一起售出的規則。其中最常使用的方法是關聯規則(As

2、sociation Rules)。除了零售業外,購物籃分析也可以應用在其他領域:信用卡消費電話使用者的附加功能消費者的常用銀行服務保險配套方式醫院病患的歷史資料,4,購物籃分析資料架構,圖9.2,5,訂單(orders)的基本衡量方式,每個顧客的平均有多少order每一個order的平均有多少品項每一個order的平均有多少特殊品項針對某產品,曾購買這項產品的顧客佔多少比例針對某產品,曾購買這項產品的顧客平均會購買幾次針對某產品,這項產品被購買時的平均數量,購物籃分析資料架構(2),6,圖 9.3,購物籃分析資料架構(3),7,訂單特性,購物籃分析資料架構(4),8,品項的受歡迎程度,要用存貨

3、曲線來找出最受歡迎的商品並不難,不過,只知道商品的銷售量是不夠的,下面還有幾個相關的問題:在one-item order中,最受歡迎的品項是什麼?在multi-item order中,最受歡迎的品項是什麼?在重覆購買的顧客心中,最受歡迎的品項是什麼?特定品項的受歡迎程度如何隨時間改變?某一品項的受歡迎程度如何隨區域改變?,購物籃分析資料架構(5),9,追蹤行銷干擾事件,Mail drop,購物籃分析資料架構(6),10,利用用途將產品分群,通常還有很多關於產品的敘述性的資料,例如衣服的顏色等,這些資料可以幫助產品的分級,還能類似解決以下的問題瘦身產品是否傾向一起賣出?消費者是否同時會買類似顏色

4、的衣服?買有框的明信片的消費者是否會同時買其他產品?,購物籃分析資料架構(7),11,利用用途將產品分群(圖 9.6),購物籃分析資料架構(8),12,關聯規則(Association Rule),購物籃分析會找出應該放在一起的產品或服務。利用關聯規則找到的結果很清楚,但卻未必有用。以下是關聯規則的三種典型例子。可行的規則(Actionable Rule) 明顯的規則(Trivial Rule)無法解釋的規則(Inexplicable Rule),13,可行的規則(Actionable Rules),有用的規則必須包含高品質的,可行的資訊。業者一旦找到模式,必須要能夠配合這個模式來調整。 Ex

5、1.芭比娃娃與糖果條Ex2.尿布與啤酒,關聯規則(2),14,明顯的規則(Trivial Rules),明顯的規則可能在該行業中都已經知道了,在行銷上沒有太大的價值。Ex.維修協定與大型家電用品Ex.油漆與油漆刷,關聯規則(3),15,無法解釋的規則(Inexplicable Rule),這種規則似乎沒有任何原因,也無法作為行銷活動的參考,可以只是某個時空下的一種巧合。Ex.五金賣場開幕時,銷售最好的是馬桶清潔劑,關聯規則(4),16,關聯規則的運作方式,表9.1 雜貨銷售點交易狀況,17,表9.2 Co-occurrence Table,關聯規則的運作方式(2),18,信心水準(Degree

6、 of Confidence),if蘇打飲料,then柳橙汁 信心水準=67%(2/3)if柳橙汁,then蘇打飲料 信心水準=50%(2/4),關聯規則的運作方式(3),19,增益(Improvement/Lift),if蘇打飲料,then柳橙汁 lift=0.83 (0.67/0.8)if柳橙汁,then蘇打飲料 lift=0.83 (0.5/0.6)一般來說,lift 1的模式才有行銷上的價值。,關聯規則的運作方式(4),20,建立關聯規則,基本步驟(圖9.9)決定商品的集合與等級 例:pizza是一個商品還是配料商品?計算商品的機率和聯合機率,也許限制在交易佔有率超過某一門檻的商品分析

7、機率來決定規則例:如果蘑菇,則義大利辣味香腸,21,圖9.9,決定商品的集合與等級,計算商品的機率和聯合機率,分析機率來決定規則,22,建立關聯規則,注意事項選擇正確的項目組合從矩陣中的數字產生規則克服龐大資料帶來的現實限制,23,選擇正確的項目組合(1),用來找出關聯規則的資料,通常來自銷售點(point of sale)中的詳細交易資料選什麼資料、蒐集和運用這些資料,對購物籃分析是很重要的部份特殊的物件由什麼組成,是視各行業的需要而定例:雜貨店 VS. 披薩店,建立關聯法則(3),24,表9.3,25,表9.4,26,選擇正確的項目組合(2),我們感興趣的商品是會隨時間而改變的問題:想用過

8、去的資料分析時,不同的層級無法一起分析選擇適當的精細程度是這個分析的關鍵,建立關聯規則(4),27,選擇正確的項目組合(3),產品階層(Product Hierarchies)可幫助歸納商品在現實生活中,每件產品都有自己的生產和倉儲序號(stock-keeping unit, SKUs),也就是產品階層或分類學(taxonomy)圖9.10要用怎樣的分類階層才最適合?,建立關聯規則(5),28,圖9.10,品牌、尺寸、倉儲序號,冷凍食品,冷凍晚餐,冷凍蔬菜,冷凍甜點,其他,混合,胡蘿蔔,豌豆,水果吧,冰淇淋,冷凍優格,其他,櫻桃,核桃,香草,草莓,巧克力,更籠統,更詳細,部份產品分類法,29,

9、選擇正確的項目組合(4),產品階層可幫助歸納商品要考慮的組合隨著分析商品數量的增加而快速成長項目分得越精細,分析的結果越實用一項規則的複雜度,取決於它包含了多少項商品分類階層越上層,所列出的項目越少適合的層級應該由商品本身來決定,建立關聯規則(6),30,選擇正確的項目組合(5),小秘訣在含有特定目標的交易數量約等於分析母體資料數時,購物籃分析可發揮到最大效果這可以避免讓最常見的物品支配大多數的規則將少見的商品用高階的階層,這樣出現的頻率比較高,建立關聯規則(7),31,選擇正確的項目組合(6),跨越產品階層的虛擬項目虛擬項目的目的在於從跨越產品階層的訊息中得到好處虛擬項目不會出現在原始的產品

10、階層虛擬項目有時甚至會包含交易的資訊不一定要加入虛擬項目虛擬項目可能造成明顯的規則,建立關聯規則(8),32,選擇正確的項目組合(7),資料品質購物籃分析所用的資料,品質通常不高通常都在與顧客直接接觸時獲得,且主要用途是在運作目的上(例:倉儲管理)資料需要額外處理後,才能拿來分析,建立關聯規則(9),33,選擇正確的項目組合(8),具名或匿名零售業-現金交易匿名網路交易、信用卡、消費者俱樂部具名,建立關聯規則(10),34,從這些資料中產生規則(1),項目的組合並非規則規則:如果條件句,則結論句。 例:如果芭比娃娃,則糖果條。具實用性的規則,在結論句只包含一項商品,建立關聯規則(11),35,

11、從這些資料中產生規則(2),計算信心水準(confidence)信心水準= P(條件句與結論句)/ P(條件句)以三種商品、結論句只有一種商品的組合為例:如果A和B,則C如果A和C,則B如果B和C,則A,建立關聯規則(12),36,表9.5,37,表9.6,38,從這些資料中產生規則(3),計算LiftLift = (P(條件句與結論句)/ P(條件句)/ P(結論句) = 信心水準/ P(結論句) = (P(條件句與結論句)/ P(條件句)* P(結論句)當Lift大於1時,最後的結果會比單純亂數好當Lift小於1時,效果則比較差否定規則,建立關聯規則(13),39,表9.7,40,圖9.1

12、1(1),41,圖9.11(2),42,克服現實的限制(1),產生關聯規則是一個多步驟的過程隨著商品數的增加,計算的複雜度會成幾何級數增加解決方法:修剪(pruning) 例:最低交易佔有率修剪(minimum support pruning)門檻數也可以根據運算過程修正,建立關聯規則(14),43,克服現實的限制(2),龐大資料的問題:假設某店有100種商品,建立關聯法則(15),44,觀念延伸(1),用關聯規則比較各分店購物籃分析常用來比較連鎖店中的各分店用虛擬項目協助分析,一把榔頭一盒釘子超細砂紙,一把榔頭一盒釘子超細砂紙在一家舊分店買的,45,觀念延伸(2),比較兩家分店的程序蒐集開幕

13、後特定期間的資料,用虛擬項目說明這是新店的資料自舊分店蒐集相同數目的資料,也用虛擬項目標是這是舊分店的資料找出各組的關聯規則特別注意有虛擬項目的規則其它應用:促銷期間vs.平時、都會區vs.郊區、不同季節、不同地理區,46,觀念延伸(3),無關規則(Dissociation Rules)條件句中可以包含且非的陳述加入一個逆轉商品(Inverse Items),47,觀念延伸(4),無關規則的缺點分析對象增加一倍交易數量增加逆轉商品出現頻率比原始商品高實用性不高 例:如果沒有A也沒有B,則沒有C,48,利用關聯規則進行序列分析(sequence analysis),相對於購物籃分析,序列分析希望

14、找到某段時間內特定的消費者的消費行為。Ex1.割草機水管Ex2.清點(和解)帳戶取消帳戶,49,序列分析的附加條件,時間序列資料(time-series data)必定建立在顧客的基本資料上。如果無法追蹤顧客的長期行為,便無法建立序列分析。每筆交易記錄都必須有註記或序號決定交易順序。Ex.信用卡交易、銀行服務、醫療服務,50,購物籃分析的優點,能產生簡單明瞭的結論能運用在非監督式資料採礦上能分析不同形式的原始資料所採用的計算模式簡單易懂,51,購物籃分析的缺點,當商品數量增加,必需進行的運算會成幾何級數增加對於資料的個別特性不甚重視難以決定組合的適當的商品數容易剔除罕見商品,The end.Thanks for your listening.,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。