栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

用StarRocks玩转用户画像-2-方法论

用StarRocks玩转用户画像-2-方法论

用户画像 - 业务特点 业务应用
  • 精准营销
    • 广告投放,个性推荐,弹窗推送
  • 群体分析
  • 风险预警
  • 效果分析
  • 渠道分析
业务难点
  • 数据体量庞大,检索方式灵活
    • 组合标签计算,开发复杂度高
  • 精确去重计算,资源消耗巨大
  • 聚合标签集合,查询并发度高
标签类型

用户画像建模最重要的是对用户「打标签」,常见的3种分类:

统计类标签
  • 基础标签类型,用户的性别、年龄、城市、星座、职业等等基础属性,可以做分布统计,
  • 也包括如活跃时长、注册用户数、访问次数、消费金额等按照某些基础维度统计出的指标
规则类标签
  • 基于确定的规则及用户行为产生。
  • 规则,通常是需要对基础维度添加前置修饰词来限定统计的口径;或者需要提前做数据调研,如通过RFM客户价值法来科学的制定规则,从而打标签。
  • 例如:时间是基础维度,天是最小粒度,而最近30天交易次数 ≥ 2就是个有修饰词限定的规则类标签
机器学习挖掘类标签
  • 该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断
  • 例如:基于客户的行为推断客户行为上的性别
  • 互联网公司花样百出的标签:
    • 「女汉子」、「文艺青年」、「宅男」…
用户标签体系

上图,列出了一些常见的用户画像标签体系分类。下面举几个例子来看:

用户属性维度

可以看到这个表里设计了几个字段:标签名称、标签主题、一级归类、标签类型等等。

其中标签归类里有诸如自然性别、RFM价值度、购物风格、平台消费情况、用户身份等归类。

标签类型可以看到,有统计型、规则型、算法型等等。

 

风险控制维度
  • 互联网用户形形色色,为了防止给平台带来损失和风险,需要在风险控制维度构建标签体系,有效监控不良用户

社交属性维度

 画像标签开发

 

标签命名方式

为了便于对诸多标签进行管理,需要对每个标签id命名,例如

  • attr_u_s_01_001表示UserID维度自然性别为男的标签
  •  attr_u_s_01_002表示UserID维度自然性别为女的标签

 

ID-Mapping

 

  • ID-Mapping

即把不同来源的身份标识通过数据手段识别为一个用户主体

同一个用户在登录和未登录的行为数据之间需要打通,用Hive做ETL,完成uid和cookieid的映射关系

组合标签计算-客群圈选场景
  • 组合标签计算,是画像开发中的一个重要模块。当业务方根据规则应用标签时,是需要组合多个标签来创建对应的用户群体的。

 

 

 

 

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/654272.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号