目前采用的物品冷启动策略,也即新视频召回策略有:
目录
一、基于新视频内容
二、基于热度
三、视频作者维度
四、用户个性化维度
五、迁移学习
一、基于新视频内容
1、特征交叉模型召回新视频
通过FM、DeepFM、DCN等模型训练得到物品特征embedding,然后加权或池化的方式得到新物品的embedding,实现i2i的召回
2、标题textsim
通过标题文本的相似度,实现老视频到新视频的召回
3、封面图片相似
通过封面图片的相似度,实现老视频到新视频的召回
4、airbnb embedding
根据新视频的先验信息,找到最相似的n个老视频,将老视频的embedding取均值,作为新视频的embedding,然后再做i2i的召回。
二、基于热度
新热视频流量爬坡:
通过运营配置新热视频,根据消费情况将其放置于不同流量池中,通过标签等trigger单独召回一路。
三、视频作者维度
关注作者倒排,将作者新上传的视频推给他的关注用户或相关度较高的用户。
四、用户个性化维度
look alike模型:
通过embedding相似或协同相似等方式,找出候选用户集合(目标用户)中与种子用户相似的用户,将物品推给这些相似用户。
更进一步,还会找到新视频所在的seq对应的相似seq,将新视频实时地推给相似seq对应的用户。
五、迁移学习
mwuf模型 (meta warm up framework)
(1)原理:
使用一个元偏移网络利用所有的交互过的用户的表示,来输出一个偏移向量,巩固ID embedding的表示(高效利用有限的交互数据)。其实本质就是,把现有所有物品学到的ID embedding做个算数平均值作为新物品的初始化ID embedding。有点类似于airbnb embedding的思想。
提出通过一个元拉伸网络从物品特征中预测一个拉伸函数,对冷启动ID embedding进行一个特征变换,将其变换到一个更好的特征空间中。本质上就是训练了一个映射函数,然后把Cold ID embedding 映射成一个新的 ID embedding,把这个叫做warmer embedding,相当于加了一层预处理或者说是数学变换。
(2)模型结构:
参考:
【1】[论文解读]微信看一看实时Look-alike推荐算法 - 云+社区 - 腾讯云



