实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 软件开发 > 后端开发 > Java

推荐系统——引擎技术栈

Java 更新时间：2026-03-31 02:32:58 发布时间：1637天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

典型的推荐引擎架构如下：

具体应用到的技术栈有：

目录

一、ElasticSearch

二、Kafka

三、Flink

一、ElasticSearch
1、简介：

ES是一个实时的分布式存储、搜索、分析的引擎；

2、作用：

对模糊搜索很擅长，搜索速度很快；
原生就支持排序，从ES搜索到的数据可以根据评分过滤掉大部分的，只返回评分高的；
能匹配有相关性的记录；

3、具体实现：

输入数据到ES中时，先通过分词器进行分词，然后对分词进行排序，组成term dictionary查找时可以通过二分来查；

对term dictionary再丑一层term index，只储存词的前缀，这样可以进一步加快检索速度；

一个ES集群熵会有多个ES节点，即与运行着ES进程的机器；在所有节点中，有一个Master Node，负责维护索引元数据、切换主分片和副本分片等，若主节点挂了，会选举出一个新的主节点；

一个index的数据可以分发到不同的Node上进行储存，这个操作叫分片；分片的好处在于：使写入和查询操作可以并行执行，当数据量增长时可以在不同节点上存储下数据；

为实现高可用性，避免发生数据丢失，分片会有主分片和副分片之分；

二、Kafka
1、简介：

Kafka是一个可以横向扩展、高可靠、处理速度快的实时数据处理系统，是一种消息中间件。

2、作用：

缓冲；

解耦消息的生产和消费；

3、具体实现：

消息队列可以实现消息中间件的功能，但有吞吐量低、topic混杂性能很慢的问题；

Kafka通过引入Partition，采用多条队列，实现分布存储；每条队列里的消息都是相同的topic；这样就提高了吞吐量，并且避免消费者碰到不是自己想要的topic的消息了；

通过引入Broker集群，解决了高可用性的问题；每个partition不再只有一个，而是有一个leader和多个replica，生产者根据消息的topic和key值，确定了消息要发往哪个partition之后，会找到partition对应的leader，然后将消息发给leader，leader负责消息的写入，并与其余的replica进行同步。一旦某一个partition的leader挂掉了，那么只需提拔一个replica出来，让它成为leader就ok了，系统依旧可以正常运行。

三、Flink
1、简介：

Flink核心是一个流式的数据流执行引擎，针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。

2、作用：

①提供准确的结果，甚至在出现无序或者延迟加载的数据的情况下。

②它是状态化的容错的，同时在维护一次完整的的应用状态时，能无缝修复错误。

③大规模运行，在上千个节点运行时有很好的吞吐量和低延迟。

3、具体实现：

主要分为JobManager和TaskManager；

JobManager主要负责调度task，协调checkpoint以及错误恢复等。

TaskManager是执行数据流的task，一个task通过设置并行度，可能会有多个subtask。

可以处理无界数据流和有界数据流两种格式的数据。

参考：

【1】什么是 Elasticsearch？一篇搞懂 - 云+社区 - 腾讯云

【2】Kafka简明教程 - 知乎

【3】深入理解Apache Flink核心技术 - 简书

【4】Flink(一)-基本概念 - 知乎

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/292741.html

上一篇初学C语言

下一篇 Ubuntu新增硬盘

Java相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号