栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

大数据相关框架

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

大数据相关框架

Apache Flink 是由 Apache 软件基金会开发的开源流处理框架,其核心是用 Java 和 Scala

编写的分布式流数据流引擎。 Flink 以数据并行和流水线方式执行任意流数据程序, Flink 的 流水线运行时系统可以执行批处理和流处理程序。 Apache Flink: Stateful Computations over Data Streamshttps://flink.apache.org/ Kafka 是由 Apache 软件基金会 开发的一个开源流处理平台,由 Scala 和 Java 编写。 Kafka 是一种高吞吐量的 分布式 发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据 。 Apache KafkaApache Kafka: A Distributed Streaming Platform.https://kafka.apache.org/ HBase 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable :一个结构化数据的 分布式存储系统 ” 。就像 Bigtable 利用了 Google 文件系 统( File System )所提供的分布式数据存储一样, HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力。 HBase 是 Apache 的 Hadoop 项目的子项目。 HBase 不同于一般的关系 数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是 HBase 基于列的而 不是基于行的模式 。 Apache HBase – Apache HBase™ Homehttps://hbase.apache.org/ hive 是基于 Hadoop 的一个 数据仓库 工具,用来进行数据提取、转化、加载,这是一种可以 存储、查询和分析存储在 Hadoop 中的大规模数据的机制。 hive 数据仓库工具能将结构化 的数据文件映射为一张数据库表,并提供 SQL 查询功能,能将 SQL 语句 转变成 MapReduce 任务来执行 。 Apache Hivehttps://hive.apache.org/ Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜 索引擎,基于 RESTful web 接口。 Elasticsearch 是用 Java 语言开发的,并作为 Apache 许 可条款下的开放源码发布,是一种流行的企业级搜索引擎。 Elasticsearch 用于 云计算 中,能 够 达 到 实 时 搜 索 , 稳 定 , 可 靠 , 快 速 , 安 装 使 用 方 便 ( 摘 自 百 度 百 科 ) 。 免费且开放的搜索:Elasticsearch、ELK 和 Kibana 的开发者 | Elastichttps://www.elastic.co/cn/

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/878360.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号