当前位置: 首页 / 技术干货 / 正文
Hive的本地模式和远程模式有什么区别?

2023-02-09

模式 数据 hive 使用 数据库

  Hive是大数据开发的时候必须要用到的工具之一,也是学习大数据的时候最重要的知识组件之一。因为使用Hive来进行数据的处理,可以非常简单的完成。那么使用Hive的时候,我们需要先安装Hive。Hive在安装、运行的时候,有着本地模式和远程模式的区分,那么什么是本地模式?什么又是远程模式呢?

  我们首先需要知道的是,Hive其实并不是数据库,而是对HDFS上的结构化的数据文件进行的映射,将结构化的数据映射成为一张表,然后就可以使用类似SQL的方式,对文件中的数据进行处理。那么在这个过程中,有一些信息需要被记录下来:

  ●数据文件映射成为了什么表?叫什么名字?

  ●表中有什么字段?叫什么名字?是什么类型?

  ●表存在于什么数据库中?

  ●...

  这些信息都是需要被记录下来的,否则我们下一次启动Hive的时候岂不是要重新映射?而这样的信息我们称为“元数据”。Hive需要将元数据保存起来,默认保存在derby的数据库中。不过在实际使用中,我们经常会将元数据保存在其他的数据库中,例如MySQL。因此,我们就可以将这个存储元数据的数据库为“元数据库”。

  如果你会MySQL的话,应该知道无论在Windows、macOS还是Linux中,我们想要使用MySQL数据库的话,需要先启动MySQL的服务。例如在Linux中,我们需要使用 systemctl start mysqld 来启动MySQL的服务,然后才可以使用 mysql 的命令连接到这个服务,登录到MySQL客户端进行操作。

  那么,我们在使用Hive的时候,其实也是这样的原理。如果需要使用Hive的话,必需先启动Hive的元数据服务,Hive的元数据服务分为两种:metastore 和 hiveserver2 。但是无论是哪一种元数据服务,都是要连接到元数据库的。

1

  本地模式 和 远程模式

  其实本地模式和远程模式只有一个区别:客户端和服务端是否在同一台机器上!

  ●本地模式:客户端和服务端在同一个节点上,就是本地模式

2

  ●远程模式:客户端和服务端不在同一个节点上,就是远程模式

3

  其实在实际使用中,无论是本地模式还是远程模式,基本上没有什么区别。只要能够保证连接到的是同一个元数据库,那么无论是本地模式还是远程模式,都是可以正常的使用的。

好程序员公众号

  • · 剖析行业发展趋势
  • · 汇聚企业项目源码

好程序员开班动态

More+
  • HTML5大前端 <高端班>

    开班时间:2021-04-12(深圳)

    开班盛况

    开班时间:2021-05-17(北京)

    开班盛况
  • 大数据+人工智能 <高端班>

    开班时间:2021-03-22(杭州)

    开班盛况

    开班时间:2021-04-26(北京)

    开班盛况
  • JavaEE分布式开发 <高端班>

    开班时间:2021-05-10(北京)

    开班盛况

    开班时间:2021-02-22(北京)

    开班盛况
  • Python人工智能+数据分析 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2020-09-21(上海)

    开班盛况
  • 云计算开发 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2019-07-22(北京)

    开班盛况
IT培训IT培训
在线咨询
IT培训IT培训
试听
IT培训IT培训
入学教程
IT培训IT培训
立即报名
IT培训

Copyright 2011-2023 北京千锋互联科技有限公司 .All Right 京ICP备12003911号-5 京公网安备 11010802035720号