作为工作流引擎,Oozie使您能够以指定的顺序运行一组Hadoop应用程序,称为 工作流 。您可以通过三种方式之一来配置Oozie工作流程,具体情况取决于您的具体情况。您可以使用
-
配置默认值。 xml文件: 定义不改变工作流程的参数。
-
的 作业。属性文件: 定义工作流程的特定部署通用的参数。这里的定义将覆盖在config-default中进行的定义。 xml文件。
<! - 1 - > -
命令行参数: 定义特定于工作流程调用的参数。这里的定义会覆盖那些在工作中所做的。属性文件和config-default。 xml文件。
配置详细信息将有所不同,具体取决于与其关联的操作。例如,你可以在下面的清单中的MapReduce动作(map-action)中看到,你可以在这里配置更多的东西:
… @@ 1 serverName:8021 serverName:8020 @@ 2 @@ 3 jobConfig。 xml … mapreduce。地图。班级假人。 Oozie的。 FlightMilesMapper mapreduce。减少。班级假人。 Oozie的。 FlightMilesReducer已映射。 mapoutput。键。 class org。阿帕奇。 Hadoop的。 IO。文本映射。 mapoutput。值。 class org。阿帕奇。 Hadoop的。 IO。 IntWritable mapred。输出。键。 class org。阿帕奇。 Hadoop的。 IO。文本映射。输出。值。 class org。阿帕奇。 Hadoop的。 IO。 IntWritable mapred。输入。 dir'/ usr / dirk / flightdata'mapred。输出。 dir'/ usr / dirk / flightmiles'… …
与此处显示的文件系统(fs)相反:
… …