配置历史服务器:
大家知道当MapReduce程序运行完成之后,这个任务就看不到了,为了在运行完成后还可以看到运行完成的任务情况,所以历史服务器就为了解决这个问题而提出。
内部实现的大概原理:先收集日志信息-》开启某个服务(端口);
mapred-site.xml
<property>
<name>mapreduce.jobhistory.address</name>
<value>bigdata-01.superyong.com:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>bigdata-01.superyong.com:19888</value>
</property>
日志聚集功能的配置:
当MapReduce程序在YARN上运行完成之后,将产生日志的文件上传到HDFS目录上,方便后续监控查看
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>