栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Hadoop补充之Azkaban自动化调度实现

Hadoop补充之Azkaban自动化调度实现

目录

一、数据清洗调度

1.上传所需jar包

2.job文件写入

二、数据入库且数据分析调度

1.job文件写入

2.上传sql文件 

3.打包

三、实现自动化

1.开启exec服务

 2.激活exec服务

3.开启web服务 

4.登录Azkaban 

5.新建一个项目上传压缩包

 6.查看项目结构

8.运行出错 

9.重新运行无效

 10.Mr阶段运行成功

 11.Hive阶段检查出代码有误漏写分号

 12.查看结果


一、数据清洗调度

1.上传所需jar包

2.job文件写入

二、数据入库且数据分析调度

1.job文件写入

2.上传sql文件 

3.打包

三、实现自动化

在开启azkaban调度前将hive数据仓库中的weblog数据库删除

1.开启exec服务

 2.激活exec服务

curl -G "localhost: 38978/executor?action=activate" && echo

3.开启web服务 

4.登录Azkaban 

5.新建一个项目上传压缩包

 6.查看项目结构

7.开始运行

8.运行出错 

查阅多个资料,需要指定azkaban.native.lib地址

9.重新运行无效

将azkaban.properties文件中azkaban.jobtype.plugin.dir的路径改为绝对路径

 10.Mr阶段运行成功

 11.Hive阶段检查出代码有误漏写分号

修改重新打包重新运行,运行成功

 12.查看结果

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/746692.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号