Oozie在不同的“启动程序”工作中运行每个Action-实际上是具有单个映射器的YARN工作 (请参见下面的例外) 。
只要您在表单中看到“外部ID”,
job_000000000_0000就可以访问YARN日志
application_000000_0000
(是的,“ job”是Hadoop 1中的旧命名约定,仍由JobHistory服务使用,但是YARN还有另一种命名约定)。
您的应用程序输出实际上已 转储到该Oozie“启动器”的YARN日志中
- 您的StdErr原样转储,可以在“ stderr”部分中检索
- 您的StdOut会在冗长的“ stdout”部分的结尾处转储,并在每行上带有前缀 (Oozie使用该前缀来管理
<capture_output/>
Shell和Pig操作的技巧) - 没有任何东西进入“系统日志”部分AFAIK
底线:
- 运行
oozie job -info ******
以获取操作列表以及用于Oozie工作流程执行的相应“外部ID” - 对于每个
job_*****_**
旧版ID,请运行yarn logs -applicationId application_*****_** | more
以浏览全局YARN日志,然后放大您的特定应用日志 - 现在您可以尝试自动执行该操作…玩得开心
B-)
“启动器” Oozie工作原理的例外
-电子邮件操作/文件系统操作只是直接从Oozie服务器进程执行的API调用;然后MapReduce动作会生成带有多个Mappers和Reducers的常规YARN作业。



