栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

zeppelin高可用部署

zeppelin高可用部署

这边所说的zeppelin高可用不是传统意义上的HA模式,而是利用统一的配置文件,在一个zeppelin server挂掉之后,在另一个zeppelin server从统一配置文件再恢复到原有作业模式。在集群中,同时仅存在一个zeppelin server服务。

下面描述如何配置。

环境准备

服务器以及组件安装位置:

服务器名称hadoophadoop1
组件名称hdfs 3.2.1hdfs 3.2.1
组件名称zeppelin 0.10.0zeppelin 0.10.0

说明:

  • hadoop和hadoop1组成hdfs集群。

  • zeppelin位于hadoop和hadoop1上,其配置完全相同。

zeppelin配置

为了配置两台机器中,一台zeppelin server挂掉之后另一台机器能够接管上面运行的任务,需要做如下配置。

注意,两台zeppelin server配置完全相同。

修改zeppelin-site.xml,设置zeppelin.notebook.storage和zeppelin.notebook.dir为如下所示,该配置表示将notebook存储于hdfs上:


  zeppelin.notebook.storage
  org.apache.zeppelin.notebook.repo.FileSystemNotebookRepo
  Hadoop compatible file system notebook persistence layer implementation, such as local file system, hdfs, azure wasb, s3 and etc.



  zeppelin.notebook.dir
  hdfs://hadoop:9000/zeppelin-notebook
  path or URI for notebook persist


修改zeppelin-site.xml,设置zeppelin.recovery.storage.class和zeppelin.recovery.dir为如下所示,该配置表示启用zeppelin的恢复功能,并将回复信息放在hdfs上:


  zeppelin.recovery.storage.class
  org.apache.zeppelin.interpreter.recovery.FileSystemRecoveryStorage
  ReoveryStorage implementation based on hadoop FileSystem




  zeppelin.recovery.dir
  hdfs://hadoop:9000/zeppelin-recovery
  Location where recovery metadata is stored

基本测试

接下来以一个Flink SQL任务为例进行测试。

首先在hadoop主机上启动zeppelin server

提交任务

查看flink作业

停止hadoop主机上的zeppelin server

在hadoop1主机上启动zeppelin server

在hadoop1主机上查看任务情况

我们可以发现,hadoop1已经接管了hadoop之前运行的任务。

总结

基于上述方式,可以达到一台zeppelin server主机宕机,利用另一台zeppelin server主机接管原有任务,达到高可用的目的。

参考链接:

https://lrting.top/zeppelin/zeppelin-ha.html

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/335171.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号