目录
一、多路召回的融合策略
二、长短混推
三、多模态数据的融合利用
四、多任务学习
五、长短期融合
一、多路召回的融合策略
为保证召回的多样性和覆盖率,通常都会采用多路召回,然后融合的策略。
但如何将多路召回融合,不同候选集的召回结果应该如何排序,是其中的核心问题。
通常是将效果稳定、覆盖率和点击率都最高的模型(如协同过滤)作为优先级第一的召回策略,然后将能够利用用户实时行为数据的模型(如youtubeDNN实时模型)作为优先级第二的召回策略,然后将覆盖率广、能探索到用户行为隐信息、且与协同的召回结果重合度低的模型(如embedding模型)作为优先级第三的召回策略。除此之外,还有倒排策略、兴趣探索、新视频召回、userCF等召回策略。
二、长短混推
1、解决用户冷启动问题
对于只有短 / 长视频消费信息的用户,在对其进行长 / 短视频推荐时,可以根据短 / 长视频的标签、类别、作者、kis等信息来进行召回
2、在流量较小、点击率较低的底部流,由于用户的兴趣偏好不明确,通常采用长短混推的策略来进行召回,以保证召回结果的多样性
三、多模态数据的融合利用
对于一个视频,可以得到文本、图像、语音、行为历史这四个模态的数据,如果可以综合利用多模态的数据,召回结果会更为精准。
四、多任务学习
通常模型的目标有多个,包括点击率、覆盖率、用户观影时长、多样性等等,要保证多个任务都达到最优效果,就需要在模型训练的过程中对多个任务同时学习。
在排序策略中,通常会用MMOE等模型,来实现对多任务的同步学习。
五、长短期融合
1、模型
MIMN
2、策略
长短期数据计算实时协同



