栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

电商实战-淘宝用户行为分析(Python+Mysql+Tableau)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

电商实战-淘宝用户行为分析(Python+Mysql+Tableau)

一、项目概况

本项目以淘宝电商用户真实行为数据为数据源,运用python 进行数据预处理,运用MySQL并利用AARRR模型和RFM模型对其展开数据分析,利用Tableau制作可视化图像,最后给出利用Tableau制作的一张仪表盘。

1.1数据来源

数据集-阿里云天池

虽然现在不能下载,但是可以申请获得下载链接,我申请了一天就通过了。

1.2数据集介绍

本数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、收藏)。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:

 其中行为类型有四种

1.3分析思路

二、 数据清洗 2.1选择数据子集

在python中导入需要的库

import pandas as pd
from datetime import datetime,date

读取数据,并重命名列为['user_id','item_id','category_id', 'behaviortype','timestamp'] ,由于原始数据集太大,因此本次分析只选取了500万条数据。

tb = pd.read_csv('D:/文档/数据分析/淘宝电商用户推荐/UserBehavior.csv',iterator=True,header=None,names=['user_id','item_id','category_id',
                 'behaviortype','timestamp'])
try:
    tb=tb.get_chunk(5000000)
except StopIteration:
    print("Iteration is stopped.")
# 查看数据信息
tb.info()

RangeIndex: 5000000 entries, 0 to 4999999
Data columns (total 5 columns):
user_id         int64
item_id         int64
category_id     int64
behaviortype    object
timestamp       int64
dtypes: int64(4), object(1)
memory usage: 190.7+ MB
tb.describe()

查看数据可知没有缺失值 

2.2重复值处理
# 查看有多少个重复值
tb.duplicated().sum()
# 删除重复值
tb.drop_duplicates(inplace=True)
 2.3时间戳数据类型转换
# 数据类型转换
tb["date"] = tb["timestamp"].apply(lambda x: datetime.fromtimestamp(x).date())
tb["time"] = tb["timestamp"].apply(lambda x: datetime.fromtimestamp(x).strftime('%H'))
tb.head()

data=tb.drop('timestamp',axis=1)
2.4异常值处理

根据数据集介绍,数据采集时间应该在2017年11月25日至2017年12月3日之间,检查是否存在超出时间范围的数据,作为异常值,并删除数据中存在的空值。

# 异常值处理
data['date'].value_counts()
data['date'] = data['date'][(data['date']>=date(2017,11,25)) & (data['date']<=date(2017,12,3))]
# 删除有空行的数据
# how='any'表示一行中只要有一个空值就删除这一行
data=data.dropna(axis=0,how='any')
data.shape
2.5保存清洗后的数据
data.to_csv('D:/文档/数据分析/淘宝电商用户推荐/tb.csv')
三、数据分析

接下来利用mysql进行数据分析,利用tableau进行数据可视化

3.1各字段的统计数据 
# 字段统计分析
select count(distinct (user_id))用户数,count(distinct(item_id))商品数,count(distinct(category_id))种类数,
       count(distinct(behaviortype))行为数 from tb

可以看到该数据子集包括48984个用户,1080286个商品,7352种商品数,用户的行为有点击浏览,收藏,加购和购买这四种行为。

3.2基于AARRR模型的整体情况分析 (1)用户获取(Acquisition)

模型中的用户获取一般考察渠道曝光率、渠道转换率、日新增用户数DNU、获客成本CAC等指标。由于文本字数限制,本篇分析主要考察日新增用户数DNU。

# 日新增用户数DNU
select a.date, count(b.user_id) 日新增用户数
from (select distinct date from tb) a
left join (select user_id, min(date) first_date from tb group by user_id) b 
on 
a.date=b.first_date
group by a.date
order by a.date

由下图可见,仅在11月25日-30日这六天有较多新增用户,且新增用户数在26日开始出现急剧下跌,虽然在25日当日的新增用户中有很大一部分是此前的活跃用户,而非当日新增,但在12月1日起新增用户数下降为个位数。

 (2)用户激活(Activation)

首先考察PV(页面浏览量或者点击量),UV(独立访客数),人均浏览次数(PV/UV)

#计算PV,UV,人均浏览次数
select count(distinct user_id) UV,(select count(user_id) from tb where behaviortype='pv') PV,
       (select count(user_id) from tb where behaviortype='pv')/count(distinct user_id) 人均浏览次数
from tb

这九天中独立访客数为48984,页面浏览量为4472600,人均浏览次数为91.3074。

接着,查看不同日期下的pv和uv

#不同日期的pv和uv
select date,count(distinct user_id) 日uv,count(user_id) 日pv
from tb where behaviortype='pv' group by date

从上图可以直观看到在进入12月份后,pv和uv都呈现明显的增加,由于12月1号是周五,12月2号,3号是周末,但是11月25号,26号也是周末,因此可以排除是周末原因导致pv和uv突然增加。12月份有个重要的电商节——双十二,因此我们合理推测可能是由于双十二的到来吸引了大量用户。

然后,从时间维度出发分析用户行为。

# 用户活跃时间段-日期
SELECt date,
sum(case when behaviortype = 'pv' then 1 else 0 end)as 浏览量,
sum(case when behaviortype = 'buy' then 1 else 0 end)as 购买量,
sum(case when behaviortype = 'fav' then 1 else 0 end)as 收藏量,
sum(case when behaviortype = 'cart' then 1 else 0 end)as 加购量
from tb
group by date
# 用户活跃时间段-小时
SELECt time,
sum(case when behaviortype = 'pv' then 1 else 0 end)as 浏览量,
sum(case when behaviortype = 'buy' then 1 else 0 end)as 购买量,
sum(case when behaviortype = 'fav' then 1 else 0 end)as 收藏量,
sum(case when behaviortype = 'cart' then 1 else 0 end)as 加购量
from tb
group by time
# 用户活跃时间段-周
select date_format(date,'%W') as weeks,
	   sum(case when behaviortype='pv' then 1 else 0 end) as 浏览量,
	   sum(case when behaviortype='fav' then 1 else 0 end) as 收藏量,
	   sum(case when behaviortype='cart' then 1 else 0 end) as 加购量,
	   sum(case when behaviortype='buy' then 1 else 0 end) as 购买量
from tb GROUP BY weeks order by field(weeks,'周一','周二','周三','周四','周五','周六','周日')

 

 

从每日用户行为数据中看出,从11月30日到12月2日用户的浏览量和加购量有较大的增幅,同时收藏量也有明显增大的趋势,但购买量并没有呈现出明显增大,这可能是因为双十二即将来临,用户更加倾向于选择先收藏加购物车,再在双十二当天领取优惠下单。从每小时用户行为数据中看出,从晚上18点开始,用户浏览量开始增大,一直到22点,浏览量才开始慢慢下降。18点-22点是用户活跃的高峰期。从每周的用户行为数据中看出,周末的活跃用户数明显大于工作日时的活跃用户数。

最后,考察浏览页跳失率和关键页跳失率这两个指标。

create table 各用户行为(
    user_id int(10),
	用户行为总数 int(10),
    点击量 int(10),
    购买量 int(10),
    收藏数 int(10),
    加购数 int(10)
)
insert into  各用户行为  SELECt user_id,count(behaviortype) as 用户行为总数,
		sum(case when behaviortype = 'pv' then 1 else 0 end)as 点击量,
		sum(case when behaviortype = 'buy' then 1 else 0 end)as 购买量,
		sum(case when behaviortype = 'fav' then 1 else 0 end)as 收藏数,
		sum(case when behaviortype = 'cart' then 1 else 0 end)as 加购数
	from tb
	group by user_id;

select  concat(round(100*sum(case when 点击量>=1 and 购买量=0 and 收藏数=0
                          and 加购数=0 then 1 else 0 end)/count(user_id),2),'%') 浏览页跳失率,
        concat(round(100*sum(case when 点击量>=1 and 购买量=0 and 收藏数>=1
                          or 加购数>=1 then 1 else 0 end)/count(user_id),2),'%') 关键页跳失率
from 各用户行为

浏览页跳失率:仅有点击浏览行为的用户数/用户总数(总UV),为5.86%,表示用户仅仅点击浏览,没有选择收藏、加购、购买行为,较低的浏览页面跳失率表明用户对平台推荐的商品有一定兴趣。

关键页跳失率:有收藏或加购行为但无购买行为的用户数/用户总数(总UV),为80.23%。结合前面每日用户行为特征分析,由于临近双十二,较多用户会选择收藏或加购商品,在等待优惠更大的时机再购买。另一方面,可能是由于商品的库存不足、码数颜色缺货等问题。

(3)用户留存(Retention)
# 留存率
create view time_inter as
    select a.*,b.firstday,datediff(date,firstday) dateiff
    from (select user_id,date from tb group by user_id, date)a join
        (select user_id,min(date) firstday from tb group by user_id)b on a.user_id=b.user_id
order by user_id,firstday;

create view retention_day as
    select firstday,
           sum(case when dateiff=0 then 1 else 0 end) day_0,
           sum(case when dateiff=1 then 1 else 0 end) day_1,
           sum(case when dateiff=2 then 1 else 0 end) day_2,
           sum(case when dateiff=3 then 1 else 0 end) day_3,
           sum(case when dateiff=4 then 1 else 0 end) day_4,
           sum(case when dateiff=5 then 1 else 0 end) day_5,
           sum(case when dateiff=6 then 1 else 0 end) day_6,
           sum(case when dateiff=7 then 1 else 0 end) day_7
    from time_inter
    group by firstday
    order by firstday;

create view retention_rate as
    select firstday,day_0,
           round(day_1/day_0,4) day_1,
           round(day_2/day_0,4)day_2,
           round(day_3/day_0,4)day_3,
           round(day_4/day_0,4)day_4,
           round(day_5/day_0,4)day_5,
           round(day_6/day_0,4)day_6,
           round(day_7/day_0,4)day_7
    from retention_day

由于本数据集的日期只有9天,这里主要考察次日留存率、3日留存率和7日留存。可以看到进入12月后,用户留存率有所增长,表明双十二的预热起到一定效果。

 (4)用户推荐(Referral)

主要进行用户购买路径分析

# 用户路径分析
create view c as
Select user_id,item_id,
			 sum(case when behaviortype='pv' then 1 else 0 end) as '点击',
			 sum(case when behaviortype='fav' then 1 else 0 end) as '收藏',
			 sum(case when behaviortype='cart' then 1 else 0 end) as '加入购物车',
			 sum(case when behaviortype='buy' then 1 else 0 end) as '购买'
from tb GROUP BY user_id,item_id;
# 点击浏览-购买
create table 点击_购买(
    行为方式 text,
	数量 int(10)
);
insert into 点击_购买 VALUES('点击浏览',(select count(user_id) from c where 点击>0 and 收藏=0 and 加入购物车=0 and 购买=0));
insert into 点击_购买 VALUES('购买',(select count(user_id)点击_购买用户数 from c where 点击>0 and 收藏=0 and 加入购物车=0 and 购买>0));
# 点击浏览-加购-购买
create table 点击_加购_购买(
    行为方式 text,
	数量 int(10)
);
insert into 点击_加购_购买 VALUES('点击浏览',(select count(user_id) from c where 点击>0 and 收藏=0 and 加入购物车=0 and 购买=0))
insert into 点击_加购_购买 VALUES('加购',(select count(user_id) from c where 点击>0 and 收藏=0 and 加入购物车>0 and 购买=0))
insert into 点击_加购_购买 VALUES('购买',(select count(user_id) from c where 点击>0 and 收藏=0 and 加入购物车>0 and 购买>0));
# 点击浏览-收藏-购买
create table 点击_收藏_购买(
    行为方式 text,
	数量 int(10)
);
insert into 点击_收藏_购买 VALUES('点击浏览',(select count(user_id) from c where 点击>0 and 收藏=0 and 加入购物车=0 and 购买=0))
insert into 点击_收藏_购买 VALUES('收藏',(select count(user_id) from c where 点击>0 and 收藏>0 and 加入购物车=0 and 购买=0))
insert into 点击_收藏_购买 VALUES('购买',(select count(user_id) from c where 点击>0 and 收藏>0 and 加入购物车=0 and 购买>0));
# 点击浏览-收藏-加购-购买
create table 点击_收藏_加购_购买(
    行为方式 text,
	数量 int(10)
);
insert into 点击_收藏_加购_购买 VALUES('点击浏览',(select count(user_id) from c where 点击>0 and 收藏=0 and 加入购物车=0 and 购买=0))
insert into 点击_收藏_加购_购买 VALUES('收藏',(select count(user_id) from c where 点击>0 and 收藏>0 and 加入购物车=0 and 购买=0))
insert into 点击_收藏_加购_购买 VALUES('加购',(select count(user_id) from c where 点击>0 and 收藏>0 and 加入购物车>0 and 购买=0))
insert into 点击_收藏_加购_购买 VALUES('购买',(select count(user_id) from c where 点击>0 and 收藏>0 and 加入购物车>0 and 购买>0));

 

从点击到购买的转化率为1.408%,表明很少有用户选择浏览商品之后直接下单购买该商品。

点击到加购的转化率为3.502%,加购到购买的转化率为11.339%,同时点击到收藏的转化率为1.539%,收藏到购买的转化率为8.754%,这两条路径的转化率相对于直接从点击到购买这条路径的转化率有所增大,但是转化率也并不是很高,表明用户对于平台推荐的商品的满意度不够高,平台推荐系统有待完善,较小的用户收藏转化率表明用户在该平台的心仪备选商品较少,可能平台缺乏用户满意的产品。

从这四条转化路径来看,点击-收藏-加购-购买这条路径的转化率较高,表明较多的用户是经过比较长的路径才到达购买页面。可在收藏、加购页面增加更多优惠提醒,精准的发放优惠券、满赠券来鼓励加入购物车的访客提交订单付款成功。还可与其他知名平台合作,加大优惠力度,增加免密支付、极速支付、月付等方式提高下单效率。

# 用户行为和独立访客漏斗
select behaviortype,count(behaviortype) 用户行为数,count(distinct user_id) 独立访客数
from tb
group by behaviortype

从用户行为转化漏斗看出,用户从收藏或加购到购买的转化率达到了23.58%,说明用户在最后产生购买行为之前花费了较长时间停留在点击浏览,加购物车和收藏这三个行为中。有趣的是在独立访客转化漏斗中,发现有收藏行为的独立用户占比最少,而从加购到购买的转化率达到了90.19%,说明相对于收藏功能,加购功能更受用户的青睐。

单从这些数据无法判断出各个行为的转化率是高是低,表现较好还是表现较差。需要再结合其他时间段的转换率数据综合评估,或者与竞品进行比较判断。

(5)用户收益(Revenue)
# 购买率
select (select count(user_id) from 各用户行为 where 购买量>0)/ count(user_id) 购买率
     from 各用户行为

# 复购率
select 购买量, count(user_id) 用户数, count(user_id)/(select count(user_id) from 各用户行为) 复购率
    from 各用户行为 group by 购买量 order by 用户数 desc

用户购买次数有0-84次,有44.69%的用户在9天之内完成两次以上的购买,出现8次以上的购买行为的用户可能是剁手党,但是20次以上的用户极有可能是刷单行为。整体购买率为67.95%,比较客观,可针对复购用户的喜好和习惯调整平台首页的各栏目显示顺序和展示区域,在提供更便捷的服务的同时鼓励用户尝试其他板块的体验,以便展示更多推荐商品和增加引流。

3.3基于RFM模型的用户价值分析

RFM 模型是衡量客户价值和客户创利能力的重要工具,是按照 R(Recency-近度)、F(Frequency-频度)、M(Monetary-额度)三个维度进行细分客户群体。

RFM:最近一次消费 (Recency),消费频率 (Frequency),消费金额 (Monetary),由于数据中不存在用户消费金额的信息,因此本案例只对用户的消费近度和消费频率进行分析。

(1)计算R,F值

R值:数据集的最大日期(2017-12-03)减去用户最近一次购买的日期

F值:用户在这9天中的购买频率

create table rf(
    user_id int(10),
	recency int(10),
	frecency int(10)
);
insert into rf select user_id,datediff('2017-12-03',max(date)) as recency,count(behaviortype)frecency
from tb
where behaviortype='buy'
group by user_id

通过查询可知R值在[0,8]之间,F值在[1,84]之间

(2)R,F打分
# F的中位数
select user_id, recency, frecency
from(select user_id,recency,frecency,
cast(row_number() over(order by frecency asc, user_id asc) as signed) as 'id1',
cast(row_number() over(order by frecency desc, user_id desc) as signed) as 'id2'
from rf) as newtable
where abs(id1-id2)=1 or
id1=id2;

R 的最小时间间隔为 0,最大时间间隔为 8;F 的最近一段时间购买频度最小为 1,最大的购买频度为 84,R值的平均值为2.5,中位数为2,F值的平均值为3,中位数为2,可以根据这两个指标指定一个打分表。

按值打分Recency 近度Frequency 频率
20~16~84
12~43~5
05~81~2

根据打分表给R,F打分

CREATE VIEW RF_score AS
    select user_id,case when recency between 0 and 1 then 2 when recency between 2 and 4 then 1
                        when recency between 5 and 8 then 0 else NULL end r_score,
           case when frecency between 1 and 2 then 0 when frecency between 3 and 5 then 1
           when frecency between 6 and 84 then 2 else NULL end f_score
    from rf
    order by user_id

(3)计算R,F平均值和标签

create view rf_class as
    select user_id,r_score,f_score,
           case when r_score>(select avg(r_score) from RF_score) then '高' else '低' end r_class,
           case when f_score>(select avg(f_score) from RF_score) then '高' else '低' end f_class
    from RF_score

 

 (4)用户分层

create view rf_label as
    select user_id,r_score,f_score
           ,case when r_class='高' and f_class='高' then '价值用户'
                 when r_class='高' and f_class='低' then '发展用户'
                 when r_class='低' and f_class='高' then '保持用户'
                 when r_class='低' and f_class='低' then '挽留用户'
           end as label
    from rf_class

 

根据 RFM 模型分层结果,计算各用户群所占的比例:

select label 用户类别,count(user_id) 用户数,count(user_id)/(select count(user_id) from rf_label) 用户占比
from rf_label
group by label

可以看到挽留用户占比最多达到了37.62%,价值用户次之,为25.46%,保持用户和发展用户的占比相差不多。根据用户价值分析,我们可以得到用户分层结果,可以根据每个用户群的特性,实现差异化营销:

重要价值用户:R高F高。这类用户是平台的高质量用户,他们已为平台做了较多的贡献,应给予优惠回馈性服务和个性化服务,以鼓励他们持续购买的热情。

重要发展用户:R高F低。这类用户最近有购买行为但频率不高,可向其提供忠诚度计划,推荐更符合用户喜好、性价比高的商品,吸引其购买,逐渐提高忠诚度。如果是新客户,则需要建立关系,提供新人优惠券鼓励消费。

重要保持用户:R低F高。活跃度低的用户可通过短信等场外提醒来引导其入场参与优惠活动,并提供更新产品来鼓励他们再次购买。还可以鼓励其对之前购买的商品做评价以提高商品热度和可信度。

重要挽留用户:R低F低。这类用户占比最多且容易流失,需要重点挽留,必要时可主动联系客户询问流失原因。可通过拼团打折、积分兑换、捆绑销售、热卖热点商品等活动唤起用户注意力,提升用户兴趣。

 3.4商品销售分析

主要关注商品的浏览量,加购量,收藏量以及购买量等情况

# 浏览量前十的商品id
select item_id,sum(case when behaviortype='pv' then 1 else 0 end) 浏览量
from tb group by item_id order by 浏览量 desc limit 0,10
# 加购量前十的商品id
select item_id,sum(case when behaviortype='cart' then 1 else 0 end) 加购量
from tb group by item_id order by 浏览量 desc limit 0,10
# 收藏量前十的商品id
select item_id,sum(case when behaviortype='fav' then 1 else 0 end) 收藏量
from tb group by item_id order by 浏览量 desc limit 0,10

 

# 成交量大于21的商品
select item_id,count(behaviortype) 购买次数
from tb
where behaviortype='buy'
group by item_id having count(behaviortype)>21
order by 购买次数 desc

通过以上四图发现浏览量前十的商品,没有进入销量前20,说明这些吸引用户更多注意力的商品没有很好的转化为实际销量。针对浏览量高而销量不高的这部分商品,需要提高的是用户从点击进入商品详情页到最终购买的体验。

#不同成交量的商品数
select a.成交量,count(item_id)
from(
select item_id,count(behaviortype) 成交量
from  tb
where behaviortype='buy'
group by item_id)a
group by a.成交量
order by 成交量

通过计算知有98%的商品无人购买,在剩下的2%的有成交量的商品中,有79.22%的商品的成交量为1。这可能是由于季节原因,导致98%的商品无人购买,但是也从侧面说明该平台不能把握用户的消费喜好,无法得到用户最想买的商品,或者是定价不合理导致用户即使有喜欢的也不会购买。

四、总结 4.1通过AARRR模型分析用户使用的各个环节 (1)Acquisition–用户获取

每天晚上18点到22点是活跃用户的黄金时段,用户浏览量、加购量、收藏量和购买量都在这个时间段达到最大值,平台可以利用这个时间段投放广告,加大力度宣传产品,也可以通过小游戏邀请、拼团邀请、KOL 推广、热门社交或小视频平台合作推广、淘宝app卖家推送等形式吸引用户。

(2)Activation–用户激活

找到产品和用户的切入点,找到用户的“啊哈”时刻,让用户再注册后有进行下一步的冲动。用户从挑选商品到完成购买之前是一个危险区,很多人中途会因为种种原因放弃购买,可以通过分析用户行为确定夹点(pinch point)位置,提出改善转化率的建议。

此次项目分析了用户的四种行为,包括点击、购买、加购、收藏;用户点击浏览商品,而把商品收藏或加入购物车的用户仅占9.49%,最终购买的用户只有2.24%,夹点在收藏和加入购物车这里,为什么用户浏览了那么多商品却只有9.49%的用户加入购物或收藏,可能这中间用户花了太多的时间而没有挑选到满意的商品,可以优化推荐算法,根据用户行为推送用户更可能感兴趣的商品,还可以优化购物界面使界面布局更加人性化等。

(3)Retention–提高留存

让用户养成习惯,在一定程度上增加用户对产品的依赖性,导致无法离开该平台。让用户习惯打开淘宝:①可以每日给用户推送可能感兴趣的商品;②一些签到的小游戏或者签到领积分活动,增加用户登录的频率,进而增加用户浏览时长;③对于年购买量比较大的用户,为了增加这些用户的粘性,可以推出vip服务,让这些用户享受折扣和优惠券,进而提高高价值用户的留存率和对平台的忠诚度;④大力推广淘宝直播跟用户互动,计算亲密指数并进行排行,可以让用户与店主之间建立信任,进而增加客户的忠诚度。

(4)Revenue–增加收入

提高成交转化率、复购率以及加购或收藏产品的购买率。①提高成交转化率,优化用户推荐系统,或者邀请明星/KOL做测评推广;②淘宝购物用户的购买率为67.95%,近45%的用户有超过一次的购买行为侧面反映了平台的体验感佳和用户黏性强,也说明这些用户对淘宝平台还算满意,可以通过奖励积分或者优惠券等方式鼓励用户撰写评论,或者鼓励用户去分享买到的宝贝,让用户主动去推荐商品;③通过分析找出价值用户的购买偏好,产品和类目等,给价值用户制定个性化的产品推荐,从而提高用户体验,进而提高购买率。④ 引导用户进行收藏和加入购物车,比如发放优惠券,满减活动,送礼品等给用户优惠的方式; ⑤ 对于点击量高的商品,要重点分析,优化商品的推荐机制,让用户做到点击即想购买 。⑥ 通过将畅销商品和非畅销商品进行捆绑销售,优化商品的展示,当然在做这些活动之前,可以先尝试做 A/B 测试,找到最适合的销售方式和最合适的商品类型捆绑,不断提升转化率。

(5)Referral–传播推荐

首先,要让用户自发传播,那这个产品口碑一定是好得不得了,而且能够充分满足用户的需求,甚至给用户带来期望的需求。所以,根本上来说,要好好打磨产品。其次,可以采用一些增长策略,像现在比较普遍的老带新裂变营销,把握用户心理策划一些噱头式的活动等。

4.2研究用户在不同时间尺度下的行为规律,找到用户在不同时间周期下的活跃规律

新增用户的数据不够理想,在11月26号之后新增用户数明显开始下降,应观察各渠道的用户获取情况,以及竞争平台近期是否在举行促销活动。

用户的活跃度应该结合平台的活动时段分析,考察是否符合预设目标值,同比环比等。本篇分析发现周末晚间18点-22点是用户活跃高峰期,应针对高峰期进行有效的营销活动,从而更容易触达用户。

用户对推荐商品的满意度不够高,需要优化推荐策略和搜索匹配度,为用户减少搜索和选择的时间,加速完成购买行为。

较多的用户是经过比较长的路径才到达购买页面。可在收藏、加购页面增加更多优惠提醒,精准的发放优惠券、满赠券来鼓励加入购物车的访客提交订单付款成功。还可与其他知名平台合作,加大优惠力度,增加免密支付、极速支付、月付等方式提高下单效率。

4.3找到用户对不同种类商品的偏好,找到针对不同商品的营销策略

商品售卖主要依靠长尾商品的累积效应,而非爆款商品的带动。而浏览次数前列的商品甚至没有进入销量前20,说明这些吸引用户更多注意力的商品没有很好的转化为实际销量。针对浏览量高而销量不高的这部分商品,需要提高的是用户从点击进入商品详情页到最终购买的体验。作为商家端可以从以下几个方面提高销售额:

(1) 商品详情页的实际价格是否相比展示价格偏差过大,有的商家为了吸引用户点击在商品展示页投放的价格具有较强吸引力,但实际价格偏高,在用户心中反而引起反感

(2)详情页的信息流展示是否合理,是否将用户最想看到的部分置于容易看到的位置,便于信息的获取

(3)优化商品展示的形式,利用视频等方式给用户更直观的感受,提高照片的美观程度

(4)评论区评价管理,尤其对于差评区的用户反馈进行认真对待,提高自身服务质量

4.4通过RFM模型找出最具价值的核心付费用户群,对这部分用户的行为进行分析
select avg(点击),avg(收藏),avg(加入购物车),avg(购买) from (
Select user_id,
			 sum(case when behaviortype='pv' then 1 else 0 end) as '点击',
			 sum(case when behaviortype='fav' then 1 else 0 end) as '收藏',
			 sum(case when behaviortype='cart' then 1 else 0 end) as '加入购物车',
			 sum(case when behaviortype='buy' then 1 else 0 end) as '购买'
from tb
where user_id in (select user_id from rf_label where label='价值用户')
GROUP BY user_id
order by 购买 desc,点击 desc) a;

我们提取出价值用户的行为数据,发现该这部分用户在这九天中的平均购买次数为5.5909,且平均收藏行为次数和平均加购次数远小于平均点击浏览次数,表明收藏和加购物车这两个功能的使用频率极低且收藏功能的使用频率最低,由于商品种类数据为脱敏数据,很遗憾此处无法分析该用户购买的商品类型。

五、Tableau制作的淘宝用户行为分析仪表盘

附上一张淘宝橙的仪表盘

 参考链接:

淘宝用户行为分析(python+mysql+tableau)_潘森L的博客-CSDN博客

电商用户行为数据分析实战(MySQL +PowerBI)_Lizzie Leong的博客-CSDN博客

天池-淘宝用户行为数据分析(python+Tableau)_Al厨师长的博客-CSDN博客

Python+Mysql+Tableau 电商用户行为数据分析实战_cjx_cqupt的博客-CSDN博客

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/468679.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号