centOS7 완전히 분산 구성 하둡

1. 설치 JDK
  . 1) JDK-8u65-리눅스 x64.tar.gz 다운로드

  2) / 소프트 폴더를 생성

  $> sudo를 MKDIR / 부드러운
  $> sudo는 대한 Chown의 GRJ : GRJ / 소프트

  3) 개방 타르   

  $> 타르 -xzvf JDK-8u65-리눅스 x64.tar.gz -C / 소프트

  4) 심볼릭 링크를 만듭니다


  $> -s /soft/jdk-1.8.0_65 LN / 소프트 / JDK
  5) 확인 JDK 설치 성공


  $> CD / 소프트 / JDK / 빈
  $> ./ 자바 -version

6) CentOS는 환경 변수를 구성
  A) 편집은 / etc / 프로필

  $> sudo는 나노의 / etc / 프로필
  ...
  수출 JAVA_HOME = / 소프트 / JDK의
  exprot의 PATH = $의 PATH : $ JAVA_HOME은 / 빈

  b) 환경 변수를 즉시 적용

  $> 소스의 / etc / 프로필
  C) 임의의 디렉토리를 입력, 시험은 괜찮습니다

  $> CD ~
  $> 자바 -version

2. 설치 하둡 (클러스터의 모든 호스트가 설치 필요)

1) 하둡-2.7.3.tar.gz를 다운로드


2) 오픈 타르

$> 타르 -xzvf 하둡-2.7.3.tar.gz의 -C / 소프트

3) 심볼릭 링크를 만듭니다

$> LN -s /soft/hadoop-2.7.3 / 소프트 / 하둡

4) 설치가 성공적으로 하둡되었는지 확인

$> CD / 소프트 / 하둡 / 빈
$> ./ 하둡 버전

5) 구성 하둡 환경 변수

$> sudo는 나노의 / etc / 프로필
...
수출 JAVA_HOME = / 소프트 / JDK의
exprot의 PATH = $의 PATH : $ JAVA_HOME은 / 빈

수출 HADOOP_HOME = / 소프트 / 하둡
수출 PATH = $의 PATH : $ HADOOP_HOME / 빈 : $ HADOOP_HOME이 경우 / sbin

6)生效

$> 소스의 / etc / 프로필

3. 클러스터 시스템 구성 (호스트 이름을 수정)

이 파일에있는 호스트 파일 호스트 이름을 다시 시작한 후에 적용으로 1) 각 호스트는 수정해야

은 / etc / 호스트 이름
(S201)

2) / etc / hosts 파일

127.0.0.1 localhost를
192.168.24.201 S201
192.168.24.202 S202
192.168.24.203 S203
192.168.24.204 S204

3) 각 호스트는이 문서의 IP에서 호스트 파일에 따라 변경 될 수 있습니다

/ etc / sysconfig / network-scripts에 /이 ifcfg-exxxxx

...
IPADDR = ..

네트워크 서비스를 다시 시작 $> sudo는 서비스 네트워크를 다시 시작

4) /etc/resolv.conf 파일을 수정, 모든 호스트는 같은 네임 서버로 변경

네임 서버 192.168.24.2

4. 완전히 분산 호스트는 ssh를 준비 (더 접착 S201의 클러스터에 속한 사용자 로그인 다른 호스트를 구현 없음)

1) 호스트가 S201의 키 쌍을 생성
$>를 ssh를-Keygen은 -t RSA -P ''-f ~ / 스푸핑 / id_rsa_gsg_keypair를

2) 공개 키 파일이 202 id_rsa.pub 원격 호스트 (204)에 복사 (S201).
그리고 /home/centos/.ssh/authorized_keys 배치
scp를 id_rsa.pub에 CentOS S201 @ $>을 : /home/grj/.ssh/authorized_keys
scp를 id_rsa.pub에 CentOS S202 @ $> : /home/grj/.ssh/authorized_keys
$ > SCP id_rsa.pub에 CentOS S203 @ /home/grj/.ssh/authorized_keys
$> scp를 id_rsa.pub에 CentOS S204 @ /home/grj/.ssh/authorized_keys

5. 완전히 분산 구성

1) 구성 디렉토리를 작성 (원래 구성 폴더 / 소프트 / 하둡을 넣을 수 이번에는 / 등 삭제하거나 이름 / 하둡)의 같은 이름을 방지하기 위해 심볼릭 링크를 따라

$>은 cp -r / 소프트 / 하둡은 / etc / 하둡 / 소프트 / 하둡은 / etc / 전체

2) 작성 심볼 링크
$> 에선 -s / 소프트 / 하둡 은 / etc / 전체 하둡

3) 구성 파일 ($ {hadoop_home}을 / etc / 전체 /)를 수정

[코어를 site.xml]
<? XML 버전 = "1.0"인코딩 = "UTF-8"?>
<? XML-스타일 타입 = "텍스트 / XSL"HREF = "configuration.xsl"?>
<구성>
<속성 >
<이름> fs.defaultFS </ 이름>
<값> HDFS : // S201 / </ value>를
</ 속성>
</ 구성>

[HDFS-를 site.xml]
<? XML 버전 = "1.0"인코딩 = "UTF-8"?>
<? XML-스타일 타입 = "텍스트 / XSL"HREF = "configuration.xsl"?>
<구성>
<속성 >
<이름> dfs.replication </ 이름>
<값> 3 </ value>를
</ 속성>
</ 구성>

[mapred-를 site.xml]
不变

[원사를 site.xml]
<? XML 버전 = "1.0 "?>
<구성>
<속성>
<이름> yarn.resourcemanager.hostname </ 이름>
<값> S201 </ value>를
</ 속성>
<속성>
<이름> yarn.nodemanager.aux-서비스 </ 이름>
<값>mapreduce_shuffle </ value>를
</ 속성>
</ 구성>

4)) 노예는 모든 데이터 노드의 호스트 이름을 저장 (파일을 파일 수정

[/ 연질 / 하둡은 / etc / 풀 / 슬레이브]
S202
S203
S204

5) 수정 하둡 환경 변수 파일 [/soft/hadoop/etc/full/hadoop-env.sh]

...
수출 JAVA_HOME = / 소프트 / JDK
...

6) 배포 구성

$> CD / 소프트 / 하둡 /
$> SCP -r 등 CentOS는 S202 @ : / 소프트 / 하둡
$> SCP -r 등 CentOS는 S203 @ : / 소프트 / 하둡
$> SCP -r 등 CentOS는 S204 @ : / 소프트 / 하둡

7) 파일 시스템이 동작 S201을 수행하기 위해 노드의 이름 (포맷)

$> 하둡 네임 노드의 -format

8) 프로세스 하둡을 시작합니다

$> start-all.sh

추천

출처www.cnblogs.com/grj0011/p/11697535.html