用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或产品特征属性进行刻画,并对这些特征进行分析统计,挖掘潜在价值,从而抽象出用户的信息全貌。
书中的主要章节该书主要以电商网站为例。
系统架构ETL是什么
ETL,即Extract-Transform-Load的缩写,是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程。ETL是数据集成的第一步,也是构建数据仓库最重要的步骤,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。如下图所示:
举个例子,某电商公司分析人员根据订单数据进行用户特征分析。这时需要基于订单数据,计算一些相应的分析指标,如每个用户的消费频次,销售额最大的单品,用户复购时间间隔等,这些指标都要通过计算转换得到。
(1)用户信息表
(2)商品订单表
(3)PC Web日志表
(4)APP 日志表
(5)商品评论表
(6)搜索日志表
(7) 用户搜藏表
(8)购物车信息表
画像标签根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的标签体系。
标签命名规则计算出来的标签数据可以存放在Hbase,ES,MySQL等。
离线标签可以分为统计类,规则类,挖掘类(算法类)
统计类标签 规则类标签用户价值类,用户活跃度也是规则类标签
挖掘类标签(算法类标签) 流式计算标签
下面是画像系统的一些图形界面,可以看到这套系统的用法
用户查询这里查到的内容属于DWS层的
启用标签的视图 标签详情点击人口属性标签展开详情
这里查到的属于ADS层的内容,展示人群的统计信息,一般每天统计一次
元数据管理(标签管理) 当前的用户自定义分群 编辑用户人群 人群分析->新建人群 人群分析—>选择维度 人群分析—>维度分析结果 人群分析—>对比人群 业务场景用户画像在业务中的一些应用
(1)营销
营销方法包括消息推送,弹窗,推荐,短信,邮件,电话外呼等。
主动外呼
(2)风控
监控平台的不良用户,如薅羊毛、恶意刷单、借贷欺诈等,减少这类用户给平台带来的损失和风险。相关的指标如账号风险、设备风险、借贷风险等;
(3) A/B测试
(4)高价值用户实时营销
(5)商品分析
(6)渠道分析
(7)漏斗分析
(8)客服
(9)效果分析
(10)个性化推荐与服务



