主页 > 大数据 > hive是什么数据库?

hive是什么数据库?

一、hive是什么数据库?

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

  Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作

二、hive提供哪几种协议访问hive数据库?

两种协议访问:老版HiveClient和HiveServer2。

  1.老版HiveClient: 要求比较多,需要Hive和Hadoop的jar包,各配置环境。

   2. HiveServer2:

    使得与YARN和HDFS的连接从Client中独立出来,不需要每个Client都去配置这些连接信息。

    使用Beeline只作为输入口,最终会把语句扔到HiveServer2端来作解析。

    

三、hive元数据库编码怎么查?

表或者字段有中文的时候需要修改hive的元数据库的设置。 以mysql为例子,当mysql的字符集设置成utf8的时候使用hive会有问题,详细见hive的wiki。 所以当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1。 为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。

四、hive为什么要连数据库?

hive只是个工具,它的数据分析,依赖于mapreduce,它的数据管理,依赖于外部系统。所以hive要连数据库。

五、HIVE如何查看表和数据库?

1

进入hive之前要把hadoop给启动起来,因为hive是基于hadoop的。所有的mr计算都是在hadoop上面进行的。

2

在命令行中输入:hive。这个时候就可以顺利的进入hive了。当然了,如果你想直接执行hql脚本文件可以这样:hive-fxxxxx.hql。

3

进入hive之后一一般默认的数据库都是default。如果你切换数据库的话所建的表都会是在default数据库里面。

4

创建数据库的语法是:createdatabasedatabase_name;非常简单的,其实hive跟mysql的语法还是比较相似的。为什么呢?请继续往下

5

切换数据库的时候可以输入:usedatabase_name;

查看所有数据库的时候可以输入:showdatabases;

查看所有表的时候可以输入:showtables

6

看表结构的时候可以输入:describetab_name;

六、hive只支持mysql数据库吗?

Hive的底层可以是HBase或者HDFS上存储的文件。Hive的作用是把HQL翻译成MapReduce程序,从而减少分析人员每次都要写冗长Java程序的工作量。

单次Hive查询都需要耗费分钟级以上的时间(哪怕一个再小的表),因此无法作为web后端的数据库使用。HBase可以替代MySQL使用,至少淘宝就是这么做了。HBase是建造在HDFS基础上的分布式数据库,可以支持海量数据(比MySQL高一到两个量级)的存储和查询。还不容易丢失数据。

七、如何将hive数据入库到数据库中?

可以使用Sqoop、DataX、或者Hive存储过程来完成。搜索"lxw的大数据田地",里面有很多关于Hive的文章,肯定能找到你想要的。

八、hive数据库存储过程支持游标吗?

hive数据库存储过程支持游标的,因为系统硬件是支持的,所以支持游标

九、hive的关联数据库是什么?

答:hive的关联数据库是derby、mysql。

十、Hive数据库是哪个公司开发的?

Hive是由Facebook开源用于解决海量结构化日志的数据统计工具。在普遍的大数据应用当中,Hive是作为Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。Hive的本质是将HQL转化成MapReduce程序。

相关推荐