一、关于硬件方面的调优 :

主要使用的硬件 : CPU+memory
如果当前进程是进行存储的 , 对CPU和内存要求并不是很高。如果当前进程是进行计算的，那么对CPU和memory的要求都是很高的

硬件的主要配置有：memory 当CPU不够的话：程序执行运算会慢一点，当内存不够的：会导致heap溢出，GC。因为在内存不够的时候，Yarn里面有一个动态的线程就会检测到，然后就给你杀死了

二、Linux层面的一些调优：

1、调整Linux最大文件打开数和最大进程数
vi /etc/security/limits.conf
soft nofile 65535 单个用户可用的最大进程数量（软限制）
hard nofile 65535 单个用户可用的最大进程数量（硬限制）

soft nproc 65535 可打开的文件描述符的最大数（软限制）

hard nproc 65535 可打开的文件描述符的最大数（硬限制）

2、网络参数net.core.somaxconn（定义每一个端口最大的监听队列的长度，默认值是128）
more /etc/sysct1.conf | grep net.core.somaxconn
sysct1 -w net.core.somaxconn=37628

echo vm.swappiness=0 >> /etc/sysct1.conf

    3、设置swap（虚拟内存）分区 ->0 使用内存，这样会更快
            改成0不是禁用swap交换，而是优先考虑内存
            More /etc/sysctl.conf |vm.swappiness

Echo vm.swappiness=0 >> /etc/sysctl.conf

三、NameNode上JVM的参数调优：

假想一种情况，当namnode挂掉以后再次重启的时候，会加载元数据到内存中，那么在我们的堆存中还分年轻代和老年代。我们创建的对象之处都是在年轻带（新生代）中的。在年轻带中还分：eden、from、space、to space。最开始的对象是在eden区中，当eden区放满以后JVM会触发GC，就会将对象放在生还区1（From space）和生还区2（to space）。然后在经过多次GC以后还能存活的对象放在老年代。（下面是新生代的详解，跟本次钓友无关）

（-------新生代（转载）

新创建的对象分配的新生代中，经历多次GC之后进入老年代。新生代具体细分有分为Eden区和survivor区，survivor区又包含S0和S1两个区域。一般来说，我们创建了一个对象，它首先被放到新生代的Eden区。当Eden填满时执行一次Minor GC，此时存活下来的对象进入survivor区第一块survivor space S0，并且年龄加1。Eden被清空；等Eden区再满了，就再触发一次Minor GC，Eden和S0中的存活对象又会被复制送入第二块survivor space S1（这个过程非常重要，因为这种复制算法保证了S1中来自S0和Eden两部分的存活对象占用连续的内存空间，避免了碎片化的发生）。S0和Eden被清空，然后下一轮S0与S1交换角色，如此循环往复。如果对象的复制次数达到16次，该对象就会被送到老年代中。-------）

对于调优我们应该怎么样namenode上JVM的参数：
/etc/hadoop/hadoop-env.sh

找到 export HADOOP_NAMAENODE_OPTS="${HADOOP_NAMENODE_OPTS}
            -Xms10240m -Xmx10240m
            -XX:+UseParNewGC 设置年轻代为多线程并行收集
            -XX:+UseConcMarkSweepGC 年老代激活CMS收集器（标记算法），可以尽量减少fullGC
            -XX:+CMSConcurrentMTEnabled 当该标志被启用时，并发的CMS阶段将以多线程执行
            -XX:CMSInitiatingOccupancyFraction=70 当年老代空间被占用70%的时候触发CMS垃圾收集

-XX:+CMSClassUnloadingEnabled 设置这个参数表示对永久带进行垃圾回收，CMS默认不对永久代进行垃圾回收"

总结 : 把年轻带中的内存分配点给老年代

--XX:OldSize ：设置JVM启动分配的老年代内存大小，新生代内存的初始值大小 -XX：NewSize

我们的namenode启动后，所有的元数据信息一直加载到年老代中。name年老代的压力会比较大，同时年轻带那边会剩余很多的空间，所以有时候我们需要将年老代内存调大。官方推荐的是3/8或者（1/4--1/3）的内存给年轻带。剩下的给年老代。如果内存足够全部调大也无所谓。比如： Namenode节点分配的内存是15个G。年轻代给了5个G。年老代给了10G。实际年轻代可能1G都用不上，还空余了4G。反倒年老代已经触发了警戒线。这时候就要适当的调整。当然这是基于存储来说的

Mr/Hive的调优：这个刚好与（namenode相反）：我们做mr/hive计算时候，创建的对象就会频繁的发生在年轻代。因为年老代的对象可能就不怎么用了。而且我们经常会出现井喷式的计算，会不断的触发GC。这样就导致了频繁的垃圾回收。所以我们在mr的时候，需要将年轻代给调大了。

四、配置方面的调优：

一、core-site.xml 的调整

1、
Ipc.server.listen.queue.size 控制了服务端socket的监听队列长度，默认值128.这个要和

              net.core.somaxconn 配合使用(定义每一个端口最大的监听队列的长度，默认值是128)
            <property>
                  <name>Ipc.server.listen.queue.size</name>
                  <value>65535</value>
            </property>
      2、
            Io.file.buffer.size默认值4096（4K），作为hadoop的缓冲区，用于hdfs文件的读写。还有map的输出都用到这个缓冲区，较大的缓存能提高数据传输这是读写sequence file的buffer size，可减少I/O次数。如果集群比较大，建议把参数调到65535-131072
Name :Io.file.buffer.size
Value:65535
      3、
            Hdfs的回收站，一但操作事物，删掉了HDFS中的数据，可以找回。默认不开启
            Name：fs.trash.interval         Value：1440（分钟）1天
            恢复方式：
             Hdfs的回收站在： /user/$USER/.Trash/Current/user/$USER/目录下

Hadoop dfs -mv /xxxxxx/xxxx /oooo/oooo

二、hdfs-site.xml 配置文件的调整：

      1、#HDFS中的block块大小的设置
             #Name:dfs.blockSize
            #Value:134217728(128M)
            #但是有时候我们场景中可能出现大量小文件，这时候我们可以适当的调小，比如16M
            #虽然可以用hadoop的压缩方案，但是压缩比例太高了，几百M的东西能压缩成几百K，

#所以把block块变小

      2、带宽:默认是1M（在balancer的时候，设置hdfs中数据移动速度）
               集群一般是千M路由器，所以尽量改大
                <property>
                         <name>dfs.datanode.balance.bandwidthPerSec</name>
                        <value>1048576</value>

</property>

      3、真正datanode数据保存路径，可以写多块硬盘。主要用来实现IO平衡，因此会显著改进磁盘IO性能
                Name：dfs.datanode.data.dir
                Value:/sda,/sda2/sda3

但是这样做，会导致慢磁盘的现象。

      4、Namenode server RPC 的处理线程数，默认是10，namenode线程通过RPC的方式跟datanode通信，如果datanode数量太多时可能出现RPC timeout
                解决：
                    提升网络速度或者提高这个值。但是thread数量增多也代表着namenode消耗的内存也随着增加

Dfs.namenode.hadler.count 30

Datanode serverRPC 处理的线程数，默认10

Dfs.datanode.hadler.count 20

5、
Datanode上负责文件操作的线程数

Dfs.datanode.maxtrasfer.threads 8192

          6、
                    datanode所保留的空间大小，需要设置一些,默认是不保留
                    Name:dfs.datanode.du.reserved

Value:字节为单位

三、MapReduce层面的调优； mapred-site.xml的参数

             1、
                Mapreduce.framework.name yarn 已yarn为基础来调度
                Mapreduce.job.reduces 3 默认开启的reduce数量，多台机器分担一台机器的压力
            2、
                Mapreduce环形缓冲区所占内存大小默认100M
                Mapreduce.task.io.sort.mb 200
             3、
                环形缓冲区的阈值默认的是0.8
                Mapreduce.map.sort.spill.percent 0.6
             4、
                Reduce Task中合并小文件时，一次合并的文件数据，每次合并的时候选择最小的前10（默认值）进行合并。
                Mapreduce.task.io.sort.factor 50
            5、
               map输出是否进行压缩，如果压缩就会多耗cpu，但是减少传输时间，如果不压缩，就需要较多的传输带宽。需要配   合mapreduce.map.output.compress.codec（指定压缩方式）
                Name：Mapreduce.map.output.compress
                Value：true
                Name：Mapreduce.map.output.compress.codec
                Value：org.apache.hadoop.io.compress.SnappyCodec(牺牲CPU换IO和磁盘的方式)
             6、
                Reduce shuffle阶段并行传输的数量。根据集群大小可调（牛人做的事）
                Name：mapreduce.reduce.shuffle.parallelcopies

Value：20

            7、
                Map和reduce是通过http传输的，这个是设置传输的并行数
                Name：Mapreduce.tasktracker.http.threads
              Value：40

8、还有一点效率稳定性参数
(1) mapreduce.map.speculative: 是否为 Map Task 打开推测执行机制，默认为 true, 如果为 true，则可以并行执行一些 Map 任务的多个实例。
(2) mapreduce.reduce.speculative: 是否为 Reduce Task 打开推测执行机制，默认为 true
(3) mapreduce.input.fileinputformat.split.minsize: FileInputFormat做切片时最小切片大小，默认 1。
(5)mapreduce.input.fileinputformat.split.maxsize: FileInputFormat做切片时最大切片大小
推测执行机制（Speculative Execution）：它根据一定的法则推测出“拖后腿”的任务，并为这样的任务启动一个备份任务，让该任务与原始任务同时处理同一份数据，并最终选用最先成功运行完成任务的计算结果作为最终结果。
mapreduce的计数器 :

在实际生产代码中，常常需要将数据处理过程中遇到的不合规数据行进行全局计数，类似这种需求可以借助mapreduce 框架中提供的全局计数器来实现。

9、容错性相关的参数 ：

(1) mapreduce.map.maxattempts: 每个 Map Task 最大重试次数，一旦重试参数超过该值，则认为 Map Task 运行失败，默认值：4。
(2) mapreduce.reduce.maxattempts: 每个Reduce Task最大重试次数，一旦重试参数超过该值，则认为 Map Task 运行失败，默认值：4。
(3) mapreduce.map.failures.maxpercent: 当失败的 Map Task 失败比例超过该值，整个作业则失败，默认值为 0.
如果你的应用程序允许丢弃部分输入数据，则该该值设为一个大于0的值，比如5,表示如果有低于 5%的 Map Task 失败（如果一个 Map Task 重试次数超过mapreduce.map.maxattempts，则认为这个 Map Task 失败，其对应的输入数据将不会产生任何结果），整个作业扔认为成功。
(4) mapreduce.reduce.failures.maxpercent: 当失败的 Reduce Task 失败比例超过该值为，整个作业则失败，默认值为 0.
(5) mapreduce.task.timeout:如果一个task在一定时间内没有任何进入，即不会读取新的数据，也没有输出数据，则认为该 task 处于 block 状态，可能是临时卡住，也许永远会卡住。
为了防止因为用户程序永远 block 不退出，则强制设置了一个超时时间（单位毫秒），默认是600000，值为 0 将禁用超时。

--------------------------------重要参数配置--------------------------

1、

Map阶段，map端的内存分配多少个其实就是： Map Task 可使用的内存上限（单位:MB），默认为 1024。如果 Map Task 实际使用的资源量超过该值，则会被强制杀死。可以适当的调大

                Name：mapreduce.map.memory.mb
                Value：1280
            2、
                Map端启用JVM所占用的内存大小（官方----->200M heap over/GC）
                -XX:-UseGCOverheadLimit（禁用GC,我们使用parNew+CMS方式）
                Name:Mapreduce.map.java.opts
                Value:-Xmx1024m -XX:-UseGCOverheadLimit
             3、
                reduce阶段，reduce端的内存分配多少一个 Reduce Task 可使用的资源上限（单位:MB），默认为 1024。如果 Reduce Task 实际使用的资源量超过该值，则会被强制杀死。
                Name：mapreduce.reduce.memory.mb
                Value：1280
             4、
                reduce端启用JVM所占用的内存大小
                -XX:-UseGCOverheadLimit（禁用GC）
                Name:Mapreduce.reduce.java.opts
                Value:-Xmx1024m -XX:-UseGCOverheadLimit

【注意：java的堆栈肯定要小于memory的，因为还要考虑非堆和其他】上面最大能分配多少，还取决于yarn的配置。

mapreduce.map.cpu.vcores: 每个 Maptask 可用的最多 cpu core 数目, 默认值: 1
mapreduce.reduce.cpu.vcores: 每个 Reducetask 可用最多 cpu core 数默认值: 1
（这两个参数调整的是核数）

Yarn-site.xml配置 //以下在yarn启动之前就配置在服务器的配置文件中才能生效 :

       1、
            给nodemanager可用的物理内存
           Name：yarn.nodemanager.resource.memory-mb

Value：8192
注意，如果你的节点内存资源不够 8GB，则需要调减小这个值，而 YARN不会智能的探测节点的物理内存总量。

         2、
            单个任务可申请的最少内存 --》也就是RM 中每个容器请求的最小配置，以 MB 为单位，默认 1024。
            Name：Yarn.scheduler.minimum-allocation-mb
            Value：1024
         3、
            单个任务可申请的最大内存--》也就是RM 中每个容器请求的最大分配，以 MB 为单位，默认 8192。
            Name：yarn.scheduler.maximum-allocation-mb
            Value：8192
         4、
            Yarn这个节点可使用的虚拟CPU个数，默认是8.但我们通常配置成跟物理CPU个数一样
            Name：Yarn.nodemanager.resource.cpu-vcores

Value：4

关于MapReduce的调优

一、关于硬件方面的调优 :

二、Linux层面的一些调优：

三、NameNode上JVM的参数调优：

四、配置方面的调优：

--------------------------------重要参数配置--------------------------

Yarn-site.xml配置 //以下在yarn启动之前就配置在服务器的配置文件中才能生效 :

猜你喜欢

关于MapReduce的调优

一、关于硬件方面的调优 :

二、Linux层面的一些调优 ：

三、NameNode上JVM的参数调优 ：

四、配置方面的调优 ：

--------------------------------重要参数配置--------------------------

Yarn-site.xml配置 //以下在yarn启动之前就配置在服务器的配置文件中才能生效 :

猜你喜欢

二、Linux层面的一些调优：

三、NameNode上JVM的参数调优：

四、配置方面的调优：