빅 데이터 프레임 워크 하둡 생태계 에피소드

1.4 하둡 출시

하둡은 오픈 소스 아파치 (지금 GitHub의) 프로젝트,하지만 하둡 산업이지만, 여전히 사람들이 더 쉽게 목표로 하둡을 사용하는 데 도움이, 새로운 회사의 큰 숫자를 보였다. 이들 기업의 대부분은 개선 모든 소프트웨어 및 기술 지원을 제공 할 수 있도록 협력, 하둡 배포판을 포장됩니다. 이제 아파치는 또한 자신의 더 많은 도구 하둡의 사용을 단순화하기 위해, 그 기능을 확장을 개발하고있다. 이 도구는 독점, 그리고 다양합니다. 일부 도구는 아파치 하둡 프로젝트의 새로운 가족을위한 기초가된다. 그 중, 그 중 일부는 아파치 GitHub의 오픈 소스 프로젝트를 통해 라이센스가 부여됩니다. 이 회사의 모든 아파치 하둡 배포판을 기반으로하지만, 그들은 모두 약간 다른 하둡의 비전을 가지고있는 동안 - 어느 방향으로 선택해야합니다, 어떻게를 완료합니다.

이 회사의 가장 큰 차이점은 다음과 같습니다 아파치 소스 코드를 사용하여. MapR 회사뿐만 아니라, 모두가 소스 아파치 하둡 프로젝트에 의해 정의되어야한다. 대신, MapR은 아파치 코드 참조 구현을 기반 API 아파치가 자신의 요구를 충족하기 위해 제공 할 수 있다고 생각합니다. 이 방법은 MapR 특히 HDFS와 HBase와, 이들 두 가지 기본 하둡보다 안정적인,보다 높은 성능 때문에 MapR 저장 메커니즘의 측면에서 큰 혁신을 만들 수 있습니다. MapR은 고속 네트워크 파일 시스템 (NFS)이, 당신은 크게 엔터프라이즈 애플리케이션의 숫자의 통합을 단순화 HDFS에 액세스 할 수 있습니다 시작했다.

관심 하둡 배포판의 두 높은 수준의가있다, 아마존과 마이크로 소프트가 발표되었다. 모두 PaaS를 서비스를 제공, 해당 클라우드 서비스 플랫폼 (아마존이나 푸른)에서 실행, 하둡의 사전 설치된 버전을 제공합니다. 그들은뿐만 아니라 지역 HDFS 하둡의, HDFS는 마이크로 소프트와 야후 매핑 데이터 저장 메커니즘 (아마존의 S3, 푸른와 윈도우 Azure 저장 메커니즘)을 활용할 수있는 개발자가 활용할 수있는 확장 서비스를 제공합니다. 아마존은 또한 저장 제공 이상 S3의 기능을 HBase와 컨텐츠를 복원 할 수 있습니다.

표 1-1 주요 하둡 릴리스의 주요 기능을 보여줍니다.

표 1 : 다른 하둡 업체

물론, 릴리스의 많은 수는 회사 / 부서가 특정 버전을 채택하기로 결정했을 때, 다음과 같은 사항이 고려되어야한다 의문 "나는 사용해야 어떤 배포판?"

기술 세부 사항 - 독점적 인 기능과 같은 하둡 버전, 구성 요소를 포함.

쉽게 배포 할 수 - 등, 관리를 업그레이드 패치 및 배포를 달성하기 위해 도구 상자를 사용합니다.

간편한 유지 보수 - 등등 클러스터 관리, 멀티 센터, 재해 복구 지원 및 지원을 포함.

비용 - 바늘 릴리스 구현 비용, 과금 모델과 라이센스를 포함.

기업 통합 지원 - 다른 부분과 기업 애플리케이션 통합에 하둡.

선택은 당신이 어떤 문제를 해결하기 위해 하둡을 사용하려는 버전에 따라 다릅니다. 나는 각 릴리스에서 제공하는 값이다보기 때문에 책 버전은 토론과는 아무 상관이 없습니다.

높은 기사를 읽고 추천

40 + 모두 여기에 빅 데이터 개발 [W] 튜토리얼의 연봉!

제로 기반 빅 데이터 퀵 스타트 자습서

자바 기본 과정

웹 프론트 엔드 개발을 기반으로 자습서

빅 데이터 엔지니어는 일곱의 개념을 이해한다

클라우드 컴퓨팅 및 빅 데이터 다섯 동향의 미래

빠르게 대용량 데이터의 자신의 지식을 구축하는 방법

추천

출처blog.csdn.net/chengxvsyu/article/details/92430886