栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

01-Hive简介

01-Hive简介

一、什么是Hive

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。

其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更进一步可以说hive就是一个MapReduce的客户端。

二、为什么使用Hive
  • 直接使用hadoop所面临的问题

    人员学习成本太高

    项目周期要求太短

    MapReduce实现复杂查询逻辑开发难度太大

  • 为什么要使用Hive

    操作接口采用类SQL语法,提供快速开发的能力。

    避免了去写MapReduce,减少开发人员的学习成本。

    功能扩展很方便。

    三、Hive的特点
  • 可扩展: Hive可以自由的扩展集群的规模,一般情况下不需要重启服务。

  • 延展性 :Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。

  • 容错 :良好的容错性,节点出现问题SQL仍可完成执行。

四、Hive与Hadoop的关系

Hive利用HDFS存储数据,利用MapReduce查询分析数据

五、Hive与传统数据库对比

hive用于海量数据的离线数据分析

总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/601221.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号