项目布景 随着电商行业的成长度过盈利期,获得新客的流量本钱高居不下,抵消耗品牌的间接影响表示为销售增量削减。为了填补乏力的增加,各个品牌越来越重视对存量人群停止邃密化运营,由于与获得新客相比,对存量老客的运营保护本钱更低,且能带来更高的转化率。 此次项目实战以国内头部电商淘宝为例,基于对用户行为数据的挖掘,构成数据结论,终极输出一套能进步运营效力的战略倡议从而赋能营业增加。 分析方针:进步销售支出 分析时候范围:2021年11月25日 – 12月3日 数听说明 数据来历 此案例中的用户行为数据集来历以下: https://tianchi.aliyun.com/dataset/dataDetail?dataId=649 字段说明 此数据集合已有的字段及behavior_type(行为范例)值域以下: 分析思绪 明白题目 — 分析缘由 — 落地倡议 明白题目:经过对整体数据的分析,透视营业现状,连系分析框架明白营业题目。 分析缘由:将复杂的营业题目经过量维度分析方式拆解成多个具体小题目,并挑选合适的分析方式、分析模子逐一对题目停止分析。 落地倡议:汇总各分析部分获得的数据结论,以营业方针为中心同时连系营业场景,提出可落地履行的战略倡议,帮助赋能营业增加。 在起头项目分析前,首先要完成数据清洗,找出数据出的异常值,离群值并处置它们,这一步调的目标是使数据加倍切近实在营业情况,从而使终极的数据结论尽能够的复原营业究竟。 异常值: 不标准的数据,如空值、反复数据等 不合适分析要求的数据,如此案例中,需要分析11月25日-12月3日之间的用户行为,在此时候段之外的行为都不应当被归入此次分析 处置异常值: 一般情况下,间接删除即可,本案例中将采纳此方式停止异常值处置; 特别情况应连系营业情况特别分析。 数据清洗—异常值查找及处置(反复数据/空值/时候戳处置) 1) 查找能否存在反复数据 在表中利用挑选条件间接删除反复行 或查询语句 (以下图)将反复的行找到并删除 2) 查找能否存在空值 该表中不存在空值 3) 查找能否存在超越分析时候的记录 由于给定的数据中,时候相关的字段是时候戳范例,而时候戳是指格林威治时候1970年01月01日00时00分00秒(北京时候1970年01月01日08时00分00秒)起至现在的总秒数,没法间接与日期停止比力,是以,需要对其停止格式化转换成以下几个时候格式,才能方便于后续分析。 ¨ dates 字段:行为发生的日期 ¨ hours 字段:行为发生的小不时候 ¨ datetime 字段:行为发生的日期时候 ¨ weekday 字段:行为发生在星期几 时候戳的处置 此处,为了方便后文的日期分析,这里用函数 from_unixtime(时候戳,时候格式) 和weekday()两个时候函数将时候戳转为分歧格式的时候对表格增加,查询以下: 转换成果如图所示:表中多出了dates,hours,datetime,weekday四列 挑选超越时候范围的数据(成果部分截图) 有了日期字段后,便可以间接将超越指按时候范围的数据剔撤除。 至此,已完成数据清洗工作,残剩的数据即是可以间接用来分析的“清洁”数据。 完成数据清洗,获得可用的真是数据后,起头分析的第一步——明白题目。 I. 明白题目 目标:基于现稀有据,透过营业框架来对营业现状停止观察分解,将笼统的综合的分析需求拆解成一个一个具体的可落地的分析方针。 电商行业中,明白题目阶段最常用AIPL漏斗模子对现状停止分析明白题目点在哪。 本阶段需要对营业工具与情况有个整体的熟悉; 在此案例中,大旨是停止用户分析,所以要晓得用户人数、他们的散布情况若何等。 用户总数 按以下语句,即可统计出现有营业中,共有983名用户在2021年11月25日-12月3日时代发生了行动。 查询成果: AIPL漏斗分析: 晓得整体有几多用户后,接下来要进一步对他们的行为停止观察,由于分析的是淘宝行为,在电商范畴比力常用的方式是阿里提出的AIPL营销模子: A - Awareness 认知:阅读 I - Interested 爱好:收藏、加购 P - Purchase 采办:采办 L - Loyalty 虔诚:复购 AIPL营销模子可以很好地将用户行为与响应地运营周期关联起来。 例如 【A→I】: 运营中的拉新:处于AI阶段阅读、收藏、加购的用户数越多,运营拉新目标就完成得越好,但此部分一样意味着拉新本钱的支出; 【I→P】: 用户在发生爱好后初次停止采办(此步可用于参考用户行为分析) 【P→L】: 对应着运营的收割环节,行将前期推行引进的新客变现,以此接管拉新本钱,具体表现在ROI。 这样,我们便可以将用户的阅读(A)、收藏+加购(I)、采办消耗(P)划入到AIPL的各个流程中,便于我们按照分歧的流转情况,对运营现状有整体的把握。 今朝的数据是一维结构,为了方便停止复杂分析,需要对表结构停止【行列交换】(相当于将behavior行动具体分类显现),此操纵经过【建立视图】来完成: 查询成果:(部分节选) ¨ AIP计较 由于AIPL中的“L”为用户的复购行为,需要零丁计较。 所以这里先对A、I、P 阶段的行为停止统计,查询如图: 查询成果: L计较: 对于用户复购行为,计较思绪是: 1) 经过【窗口函数】,将用户的每一次消耗行动按时候顺序标号,即记录第n次消耗 2) 有了每个用户的第n次消耗记录字段后,即可将第一次消耗 列为初次消耗,而第二次起头的一切消耗行为挑选出,皆为【复购消耗】,统计复购消耗为“L”即可 ¨ 第N次消耗计较: 以下语句,经过dense_rank() 窗口函数对对用户按每次消耗时候停止排序,即可获得每个用户的第n次消耗,将字段命名为 n_consume;并用查询语句新建视图consume 查询成果:(部分节选) ¨ 统计L行为 从consume中提取复购的次数,即 n_consume 大于1的行为都算进L中,查询如图: 查询成果: 按照前几步求出的AIPL值可获得以下的漏斗图来分析营业现状: 整体分析目标:找出用户运营存在的题目或特点,提出接下来的分析方针。 在整体分析→提出方针的进程中,利用【象限思维】,即按轻重缓急列出题目标重要性排序。有序地分析,才能将营业在有限资本的条件下挑选分析结论停止落地理论。 一般来说,需要利用对照分析来判定用户运营成果的黑白,如同比、环比等,是以案例中缺少了相关数据,故没法利用对照分析,仅从营业经历动身停止判定。 回到此项目中,有了AIPL漏斗图后,我们即可直观地发现用户运营的情况: 1. 【拉新环节 A→I】 转化率仅为9%,较差,拉新完成率较低。将该题目列为优先级:重要告急 P0; 2. 【收割之客户复购 P→L】 部分做得很好好,64%转化,可以据此总结营业经历或复购纪律,进一步推行利用。将该事项列为优先级:重要不告急 P1; 3. 【收割之客户首购 I→P 】部分结果还可以,23%转化,可以一步挖掘用户采办转化途径。将该事项列为优先级:不重要不告急 P2; II. 分析缘由 获得分析方针后,从实战落地角度,操纵重要象限思维,对分歧的分析方针,赋予分歧的重要性水平,优先处理告急的重要题目;再综合各类分析方式,以分歧的维度透视数据,在数据中挖掘新的概念。 分析思绪 此部分,需按照第一部分——明白题目中得出的分析方针,指定细分的分析战略: 1. 【P0: A→I 】部分是转化率低的题目,重视整体店肆运营战略的制定,在零售行业中,【人货场】分析是最常用且有用的分析方式, 2. 【P1: P→L】部分是用户复购表示很好,所以可以经过【用户复购分析】,挖掘、总结复购特征; 3. 【P2: I→P】部分目标在与进一步透析用户采办行为,可以采用【采办特征分析+ RFM模子】停止分析:对高采办率人群的特征停止挖掘分析,找到纪律后利用到促进采办的环节;做RFM用户代价分析,针对代价人群停止有目标的邃密的转化运营行动。 i. 【P0: A→I 】拉新环节 — 人货场分析 此部分经过【人货场】分析,处理认知用户(A)到爱好用户(I)行为转化率低的题目。 【人货场】分析 ¨ 人 【人】的部分首要在于观察用户行为特点,以总结经历。此案例中,由于数据维度有限,用户本身行为相关的数据除了商品外就是时候,而商品计划在【货】部分停止分析,故此部分可更具体转化为 分析用户A到I高效转化的时候特征。 ¨ 各时段AI转化散布 如以下语句,连系group by 语句,即可计较各时段A→I转化情况。 A→I的转化率计较成果已获得,此时我们需要【比力的基准】(阈值),将现有的每小时转化率与阈值相比力,才能更明白的判定转化率凹凸。 这里,以常见的“均匀值”作为对照的基准(阈值),查询语句以下: 获得成果如图所示: 分析结论: 由于每个时段的阅读人数分歧,为确保分析的成果有用,所以需要挑选阅读值大于均匀值3734的时段来观察,同时,转化率大于均匀值9.1%的时段,代表该时段阅读人数多且转化率高,从成果中可挑选出同时满足两个条件的时候段为:11时、15-17时、19时、22时、23时;其中,23时的转化率为10.1%,为同时满足这两个条件的时候段中的最大转化率,即为最好投放时候。 ¨ 货 人货婚配效力分析:商品保举能否有用 目标:进步针对用户的商品保举效力 在分析之前,需要先对A,I阶段触及的总商品情况停止观察: ¨ 总商品数统计: A阶段的商品数统计 I阶段的商品数统计: 查询成果: 连系【假定考证思维】,基于有用阅读与发生爱好的商品数差别较大的情况, 提出假定:用户偏好的商品首要集合在少数商品,大部分商品被毛病地保举到用户。 考证思绪: 1. 将被阅读最多的前100款商品 以及 用户最感爱好(即加购、收藏)的前100款商品 停止穿插查询 2. 假如穿插出的商品数较少,则假定建立 (阅读量虽高,但用户并不感爱好,保举人群毛病) 3. 反之,则假定不建立 按考证思绪里说的,别离提取A(阅读量), I (用户感爱好)的前100款单品穿插,检察穿插数目(inner join) 查询成果: 分析结论: 假定建立,用户偏好的商品首要集合在少数商品,大部分商品被毛病地保举到用户,人货婚配效力低。 s 场 【场】:除了用户行为以及商品之外的内容,广义来说指的是与用户的触点, 例照实体店的场地的安插;电商铺肆页面的装修;活动的维度(场景),比如在特定的一个促销活动下; 在线上电商,则是在线店肆、平台、投放渠道等。 从这个角度,分析此段时候内能否有淘宝平台的活动对分析时代的销售发生影响: 1. 连系营业经历,数据时候段在双十一后,双十二前,即是两个大促的中心节点; 2. 进一步查询2021年双十二的相关信息以下: 活动:天猫双12年关品牌盛典 预热时候:2021年12月9日00:00:00-2021年12月11日23:59:59; 上线时候:2021年12月12日00:00:00-2017年12月14日23:59:59。 3. 由活动时候可知,分析时候段处于双十二预热时候前夜的低潮期,客观上营销结果整体比力平平,进而影响AI转化率。 分析小结(A→I拉新环节) 利用【人货场】分析: 【人】:挑选阅读量高且转化率高的时段对用户加大产物投放力度;满足阅读值>3734且转化率>9.1%,其中,23点转化率为10.1%,为最好投放时候。 【货】:按照假定检验分析获得,今朝人货婚配效力低,阅读量高的产物却并不是用户感爱好的产物,平台大部分商品为长尾商品,商品被毛病的保举给非方针用户。 【场】:蔽肪粗析的时候段处于双十二预热时候前夜的低潮期,客观上一定水平影响AI转化率。 ii. 【P1: P→L】复购环节 — 复购分析 按照此前制定的分析思绪,P→L部分计划停止【用户复购分析】以挖掘复购特征。 复购周期分析 目标:优化用户触达战略,即何时何地向哪些已购用户推送什么商品可提升复购率。将经过度析用户【复购周期】以处理营业中触达时候的题目。 现该题目转化为经过度析用户复购周期,以处理营业中何时触达、触达多久的题目。 (一) 何时触达 可经过计较用户均匀回购周期,即可在用户发生采办行为后,在均匀回购周期内对其停止营销触达。 为方便计较,这里我们新建一个记录用户第N次采办的视图取名为consume_dates 查询成果(部分节选): 计较步调: 1. 经过以下语句先计较出每个用户每次消耗的回购周期: 查询成果(部分节选): 成果说明: 如图,user_id 为100的用户 n_consume=2,回购周期=2天 即为期第二次消耗时,与第一次消耗间隔了2天,也就是说该用户在2天进步行了第一次消耗。 2. 基于以上语句,可以将每人次的回购周期停止均匀,获得终极的 均匀回购周期 : 查询成果: 触达时候相关结论: 可在用户采办行为发生后的2-3天对用户停止触达。 (二) 触达多久 题目转换思绪: 到底在联系顾客多久后,可以停止对该顾客的联系,即跨越最长采办周期时候间隔后,证适用户已经大要率不会再回购了;所以这里可经过计较分歧时段下采办的客户最长采办周期。先计较出每个顾客的最长消耗间隔,再在其根本上求均匀值。 计较思绪: a表记录每位用户第一次消耗日期,b表记录每位用户最初一次的消耗日期(max(dates),将两个时候停止datediff,即可求出每位用户的最长消耗时候间隔,再在其根本上求用户的均匀最长消耗时候间隔。 计较步调: 1. 统计每个客户“初次消耗日期”、“最初消耗日期”后,相减即可算得每个客户的消耗周期,命名为“最长消耗间隔”。 查询成果(部分节选): 2. 求用户的均匀最长消耗间隔(这里分两种方式) 1) 间接求一切用户的均匀最长消耗间隔 查询成果: 2) 基于1中语句,按日期停止分组,计较天天的客户均匀最长消耗间隔。 查询成果: 触达间隔相关结论: 顾客的均匀最优点达间隔为4.4天; 在2021年11月25日周四此日,顾客的均匀最长消耗间隔最长,为5.7天。 分析小结(P→L复购环节) 用户复购周期分析: 1. 何时触达:顾客的均匀回购周期是2.3天 2. 触达多久:顾客的均匀最长触达间隔为4.4天,在2021年11月25日周四此日,顾客的均匀最长消耗间隔最长,为5.7天 iii. 【P2: I→P】采办环节 — 采办率特征&RFM分析 淘宝平台的用户复购率(P→L)高达64%,也就是说用户只要实现0到1的消耗冲破,接下来就有64%的机遇复购,所以此部分重点应放在若何提升AI→P。 分析思绪: 1. 总结高采办率客户特征:挑选潜伏的转化用户,再经过促销优惠等方式刺激转化 2. RFM模子利用:对现有人群停止分层,针对分歧范例的用户,采纳更精准的营销方式 1. 用户首购特征 目标:进步AI客户的采办转化率P,促进用户实现0-1的消耗冲破。 思绪: 经过采办率凹凸人群的对照,挖掘高采办率用户特征,得出分歧的用户画像,经过RFM模子对用户停止分层后,给出分歧人群代价的散布及对应人群代价升级的战略倡议。 查询语句以下: 查询成果(部分节选): 采办率高 vs 采办率低 计较获得每个客户的采办率后,需要进一步界说高采办率和低采办率的界限; 连系【二八原则】, 以为前20%为高采办率客户,进献80%的代价;后20%为低采办率客户。 为求得20%的客户,间接求得最初一位采办率,在其根本上*20%即可,查询语句以下: 由此前统计可知,分析数据共有为用户,即20%分位为: 328*0.2 =65.6,即前65位客户为高采办率客户; 328-65=263,即263-386位的客户为低采办率客户。 高采办率客户 采办率特征: 查询成果: 高采办率客户 品类集合度:(该人群共买了几多种商品品类) 查询成果: 低采办率客户 特征: 留意需剔除无采办人群影响 查询成果: 低采办率客户 品类集合度: 查询成果: 结论: 1. 高采办率用户均匀阅读数33远小于低采办率用户均匀阅读数185,高采办率用户的阅读更具有目标性。 2. 高采办率用户加购率11.7%大于低采办率用户9.5%,对所阅读商品更感爱好。 3. 高采办率用户采办品类集合度360远大于低采办率用户137,采办品类更多元。 按照总结获得的人群画像结论: 高采办率人群:大要率为决议性用户,阅读商品数少,但加购率高,看准商品就下单采办 低采办率人群:纠结型顾客,阅读商品数很多单加购率低,看到商品会犹豫未定。 针对低采办率人群的倡议: 品类集合度相对较高,可以列出这些品类,让运营加倍有针对性的优化品类信息,削减用户阅读跳失率。 2. AIPL + RFM分析 为促进用户采办,需停止邃密化用户运营,即可经过RFM模子实现。 RFM模子本质:对用户停止多目标的聚类。 分析思绪: 先别离找到RFM在本项目中的对应寄义,别离对RFM的值停止计较,界说RFM的比力标准——阈值(分别人群的标准),将之作为分类的根据,将人群细分。 由于数据限制,并无用户采办金额数据,故与AIPL模子连系,重新界说R、F、M: R:客户比来一次采办离分析日期的间隔,用以判定采办用户活跃状态 F:客户消耗频次 →收藏、加购行为次数(A+I) M:客户消耗金额 →采办行为次数(P+L) 是以,RFM分群成果及人群特征以下: 1. 重要代价用户(R高F高M高):用户处于采办活跃期,感爱好商品多,采办次数多 2. 一般代价用户(R高F高M低):用户处于采办活跃期,感爱好商品多,采办次数少 3. 重要成长用户(R高F低M高):用户处于采办活跃期,感爱好商品少,采办次数多 4. 一般成长用户(R高F低M低):用户处于采办活跃期,感爱好商品少,采办次数少 5. 重要唤回用户(R低F高M高):用户已不活跃,感爱好商品多,采办次数也多 6. 一般唤回用户(R低F高M低):用户已不活跃,感爱好商品多,采办次数少 7. 重要挽留用户(R低F低M高):用户已不活跃,感爱好商品少,采办次数多 8. 一般挽留用户(R低F低M低):用户已不活跃,感爱好商品少,采办次数少 计较步调: (1)按以上界说,计较出每个客户的R、F、M值: 查询成果(部分节选): (2)为了分别R、F、M值的高 与低,这里采用常用的均匀值法作为阈值(也可采用经过营业经历自界说阈值的方式)查询语句以下: 查询成果: (3)按照以上RFM阈值,及RFM界说,将每个客户分别到分歧的用户代价族群中。 其中,R值的界说是权衡用户的消耗活跃水平,间隔上一次消耗越近,证适用户消耗处于活跃状态;消耗时候间隔越近,意味着R值越小,对应的消耗活跃的代价越大。 查询成果(部分节选): (4)统计各个族群的用户数及用户占比,对用户运营现状分析,给出运营战略偏向。 结论: 1. 重要型用户(M值高)累及占比为26.857%,合适二八原则,证实利用这个方式的分层逻辑是公道的 2. 从转化途径角度,重要代价用户占比力少,仅为7.426%,其中,RFM三项中只要一项与重要代价用户分歧的为重要成长用户12.818%,一般代价用户3.967%,重要唤回用户3.154%,这三种是最能够转化为重要代价用户的种别。若想进步重要代价用户,可从这三类动手,其中,重要成长用户基数占比力多,可以优先对该人群停止营销,促使他们消耗更多,进而转化为重要代价用户;一般代价用户与重要唤回用户基数较少,需要从其他种别补充人数,可以从基数较大的一般成长和一般挽留直达化升级为一般代价用户与重要唤回用户,再进一步使其成为重要代价用户。 III. 落地倡议 将从分歧维度获得的数据结论汇总到一路,在基于现有的营业单元给营业提倡议。 经过AIPL营销模子,对用户现状有整体的熟悉,并分析、总结出三段分析方针。 现对分析结论连系营业场景总结经历及提出倡议: I. 【P0: A→I】【人货场】优化拉新 存在题目:从“认知awareness”到“爱好interest”阶段的转化率太低 经过【人货场】分析,可得以下结论及营业倡议: 【人】:(转化时候特征)挑选阅读量高且转化率高的时段对用户加大产物投放力度;满足阅读值>3734且转化率>9.1%,其中,23点转化率为10.1%,为最好投放时候。 营业倡议:对于推行部分,优化投放战略,从A→I转化率高的时候点,特别是23点,加大投放力度,进步AI转化率,进而提升整体的转化 【货】:(人货婚配效力)按照假定检验分析获得,今朝人货婚配效力低,阅读量高的产物却并不是用户感爱好的产物,平台大部分商品为长尾商品,商品被毛病的保举给非方针用户。 营业倡议:对于产物部分,实时处置低转化率的商品,总结高转化率商品的产物特点去开辟新品,进一步优化长尾商品以及公共商品的保举逻辑。 【场】:(活动时候场景分析)蔽肪粗析的时候段处于双十二大促预热时候前夜的低潮期,客观上一定水平影响AI转化率。 营业倡议:对于运营部分,针对转化率低的题目,可参考高转化商品的描写,优化产物题目、内容描写等;针对大促前夜的低潮期,额外的给出更多促销力度来促进用户活跃从而进步该阶段的销售。 II. 【P1: P→L】【复购分析】复制经历 营业现状:从“采办purchase”到“虔诚loyalty”阶段的转化率较高。 经过【用户复购分析】,给到用户运营部分的结论及营业倡议: 1. 何时触达:顾客的均匀回购周期是2.3天 营业倡议:客户消耗后2-3天,连系回馈手段实时停止触达 2. 触达多久:顾客的均匀最长触达间隔为4.4天,在2021年11月25日周四此日,顾客的均匀最长消耗间隔最长,为5.7天 营业倡议:间隔顾客上一次消耗后的4-5天内,反复1-2次触达,以确保顾客能接收到充足的营销刺激进而提升用户复购 III. 【P2: I→P】【采办特征+RFM】深入挖掘 现存题目:转化不高不低,表示较平,深入挖掘出有用战略进一步进步转化 i. 经过【采办特征分析】,给到用户运营部分的结论及营业倡议: 人群画像结论: 高采办率人群:大要率为决议性用户,阅读商品数少,但加购率高,看准商品就下单采办。 低采办率人群:纠结型顾客,阅读商品数很多单加购率低,看到商品会犹豫未定。 针对高采办率客户的倡议: 配合精准商品保举模子,触达优良的长尾商品,进步采办率。 针对低采办率人群的倡议: 触达热门商品,进步采办率。低采办率人群的品类集合度相对较高,可以列出这些品类,让运营加倍有针对性的优化品类信息,削减用户阅读跳失率。 ii. 经过【AIPL+FRM模子分析】,给到用户运营部分的结论及营业倡议: 结论: 1. 重要型用户(M值高)总占比为26.857%,合适二八原则,该方式的分层逻辑公道 2. 从转化途径角度,重要代价用户占比力少,仅为7.426%,其中,RFM三项中只要一项与重要代价用户分歧的为重要成长用户12.818%,一般代价用户3.967%,重要唤回用户3.154%,这三种是最能够转化为重要代价用户的种别。 若进步重要代价用户,可从这三类动手,其中,重要成长用户基数占较多,可优先对该人群停止营销,促使他们消耗更多,进而转化为重要代价用户;一般代价用户与重要唤回用户基数较少,需从其他种别补充人数,可从基数较大的一般成长用户直达化升级为一般代价用户与重要唤回用户,再进一步使其成为重要代价用户。 营业倡议: 优先级P0: s 重要代价用户(R高F高M高):用户处于采办活跃期,感爱好的商品多,采办商品多;连结一定频次的触达,延续性保护该类用户。 s 重要成长用户(R高F低M高):用户处于采办活跃期,感爱好商品少,采办次数多;可以经过关联算法,找出与爱好商品关联高的商品继续保举触达,进步用户收藏加购,进而转化为重要代价用户。 s 一般代价用户(R高F高M低):用户处于采办活跃期,感爱好商品多,采办次数少;可与运营部分相同,下降利润,给出折扣促进采办,进而转化为重要代价用户。 s 重要唤回用户(R低F高M高):用户已不活跃,但感爱好商品多,采办次数也多; 对该人群停止营销,吸引该类用户的爱好使其再停止消耗。 优先级P1: s 一般成长用户(R高F低M低):用户处于采办活跃期,感爱好商品少,采办次数少;商品组合保举的形式,提升连带和采办频次,转为一般代价用户。 |