栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

大数据:业务——推荐系统基本概述

大数据:业务——推荐系统基本概述

文章目录
    • 一、搜索引擎概述
    • 二、广告系统概述
      • 2.1 搜索广告
    • 三、优酷推荐系统概述

一、搜索引擎概述

理解倒排:
倒排以字或词为关键字(key)进行索引,表中关键字所对应value是(链接)url。

例如 用户输入大数据,会显示很多关于大数据的连接。
大数据 -> url1,url2…
大数据的5个v ->url1,url2…
大数据组件 -> url1,url2…

搜索引擎的组成一般:

  • 通过爬虫爬取数据到网页库;
  • 建成索引系统:分析整理爬虫收集到的资源,为检索系统提供数据;
  • 检索系统:从预处理好的资源里挑选出用户最满意的结果最快最好的展现。

二、广告系统概述

从客户、广告主、合作伙伴 收集到许多大数据,再把大数据细分成多个业务系统,例如订单系统,购物车系统、用户系统,用户投诉、用户查询等等;

这些离线的数据进行整合落实到HDFS,对接到Hadoop平台中;基于Hadoop平台上,我们会架构应用到一些基础的算法,根据不同的场景,用不同的算法;例如,对用户进行标签,会用到聚类算法,对物品进行预估的打分模型算法等等。

根据用户历史行为、本身特征,这些就是不同的策略依据,反补到不同的推荐引擎。例如根据某用户的购买习惯,他喜好够买吃的、零食等,这些特征通过算法推荐出300个商品到,其中在推荐引擎A有50个商品、推荐引擎B有150个商品、推荐引擎C有100个商品。但我们在前端展示只推荐10个商品。

那如何在300个商品中推荐10个呢?
我们业务规则过滤,去重,打分,给用户展现10个最高分的商品。


2.1 搜索广告

参与的三方:网民、广告主、搜索平台

广告触发:keyword Targeting

  • 广告主和网民通过关键词表达需求;
  • 网民输入的query(询问)和广告主购买的keyword进行匹配。

网民输入query(询问),系统进行匹配与检索,在广告库中跟query(询问)匹配的数据形成广告索引。

当匹配到200个符合条件的广告索引,那如何给用户推荐5个呢?

判断的依据有:

  • ctr(预估):针对曝光的点击率,点击率用于广告排序和推断;保护网民利益,用户体验等依据。
  • bid:广告商给广告的价格

通过 广告竞价排名规则 = ctr*bid 形成一个广告候选集,然后在诸多候选中,选出最好的5个推荐给用户。


三、优酷推荐系统概述

日志信息层:用户行为日志、视频信息、推荐请求日志、推荐点击日志;

策略层:用户特征模型物、品特征模型、结构化数据源、推荐策略库;

数据结果层:离线推荐结果、在线推荐结果

展现层:推荐结果融合、用户最近观看行为、用户推荐点击行为。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/326525.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号