아홉 자식 / GitHub의 프로젝트 데이터 분석 도구를 권장

나인 권장 자식 / GitHub의 프로젝트 데이터 분석 도구를

모든 중요한 결정은 데이터, 프로젝트 및 소프트웨어 개발뿐만 아니라 정보를 기반으로해야합니다. 오늘은 왕 Jiong 잔디는 당신에게주고 그들에게 배울 수있는 힘내 / GitHub의 오픈 소스 분석 도구를.

1, GitHub의 API를

말에 우선한다는 것입니다 Github에서 공식 API는이 상세한 창고 GitHub의에서 얻을 수있는 가장 좋은 방법입니다. API는 매우 쉽게 사용하는 것입니다, 당신은 컬 라이브러리 또는 다른 언어 팩을 사용할 수 있습니다 (플랫폼 또는 자체 내장 Gitlab 비슷한 API를 호스팅 온라인 힘내 기타 공공) 모든 정보 저장소를 얻을. 그러나 이며 , 시간당 요청의 수는 제한되어 제한했다 Github에서 API 호출 하면, 대규모 프로젝트를 분석을 사용하려면 API를.

 

으로 Github의 API를, 당신은 기본적으로 당신이 Github의 저장소 브라우저 프로젝트를 방문 할 때 당신이 보는 모든 정보를 얻을 수 있지만, 힘내 저장소 정보 내부 정보가 제한되어, 당신은 필요가 자식 명령에 의해 완전한 정보를 얻기 위해 복제 창고.

2, GHCrawler

자사의 검색 및 추적을 GHCrawler는 Microsoft에서 강력한 GitHub의 API를 파충류를 개발하고, 메시지는 GitHub의 실체를 탐색 할 수 있습니다. 당신이 조직이나 프로젝트의 활동을 분석 할 경우, GHCrawler 특히 유용합니다. 요청의 수를 제한하지만, 토큰 수영장과 회전에 의해 토큰을 이용 GHCrawler API를 최적화하여도 GHCrawler Github에서의 API. GHCrawler 또한 웹 인터페이스 작업 종료를 지원하는 명령 행 호출을 지원합니다

3, GH 보관

GH 아카이브 프로젝트 오픈 소스, 그것을 보관, 기록 공개 GitHub의 타임 라인이며, 추가 분석을 위해 쉽게 접근 할 수 있도록. GitHub의 아카이브 GitHub의 이벤트는 모든 정보가 JSON 파일 세트에 저장하고 오프라인 처리에 필요에 따라 다운로드 인수했다.

또한, GitHub의 아카이브는 구글의 BigQuery에 사용되는 일반적인 데이터 세트로 사용할 수 있습니다. 데이터 세트가 자동으로 매 시간마다 업데이트되며, SQL은 같은 쿼리를 몇 초에 설정되어있는 전체 데이터의에서 실행할 수 있습니다.

4 GHTorren

그리고 GH 아카이브 마찬가지로, GHTorrent Github의 프로젝트도 공개 행사 일정 정보를 모니터링하는 데 사용됩니다. 각 이벤트의 경우, 세부 사항 및 상호 의존성의 내용을 검색 할 수 있습니다. 또한 MySQL 데이터베이스 구조로 추출 동안 생성 된 정보는, JSON MongoDB를 데이터베이스에 저장된다.

GHTorrent와 다소 유사한 GH 아카이브, 모두 GH 보관이 이벤트에 대한 자세한 세트를 제공 시간당 주파수에 대한 정보를 얻을 수 있도록 설계되었습니다 것을 제외하고. 성장 호르몬 토런트 장소가 쉽게 이벤트와 관련된 모든 이벤트에 대한 정보를 얻을 수 있도록 좀 더 구조화 된 패션 이벤트 데이터를 제공, 데이터 수집 주파수는 매월입니다.

5, 두레박

아파치 첨가 된 사료는 프로젝트 활동에 대한 수집, 집계 및 시각화 소프트웨어 도구의 집합입니다. 첨가 된 사료 첨가 된 사료 아키텍처는 중앙 서버와 첨가 된 사료 푸시 서버 컴파일 된 자원 객체 및 데이터의 특정 유형에 사용하도록 설계된 응용 프로그램을 스캔 복수로 구성되어 있습니다.

이들 데이터에 기초하여, 상기 표시 부재는 다수의 작은 데이터 항목을 포함하는 것을 특징으로하는 대시 보드를 정의 할 수있다. 이러한 의미에서, 첨가 된 사료는 도움에 도구입니다 웹 프로젝트 데이터의 끝을 보여 만듭니다.

6 chaoss는

chaoss는 건강한 오픈 소스 커뮤니티를 정의하는 데 도움에 대한 데이터 분석 및 지표를 만들 수있는 리눅스 재단의 프로젝트입니다. chaoss는 프로젝트는 프로젝트를 계산하는 데 필요한 지표와 데이터를 도청 할 수있는 많은 도구가 있습니다 :

점술가는 A는 오픈 소스 소프트웨어 개발 프로젝트와 관련된 건강과 지속 가능성 지표를 제공하기위한 파이썬 라이브러리, 플라스크 웹 응용 프로그램 및 REST 서버입니다.

Cregit는 변경 사항을 표시 할 수있는 뷰를 생성하는 소스 코드에 초점을 맞추고있다

** GrimoireLab ** Bitergia 훨씬 성숙하고 야심 찬 도구를 최대한입니다. 자동 풍부한 데이터 정리 및 데이터 시각화, 위의 데이터 수집을 확장은, 시간 프레임, 프로젝트, 저장에 따라 거의 자동 증분 데이터의 오픈 소스 개발과 관련된 도구 중 하나에서 수집 할 수 있습니다 GrimoireLab의 목적은 오픈 소스 플랫폼을 제공합니다 도서관, 참여자 및 기타 검색 필터.

7 원천

라이프 사이클 데이터 플랫폼의 개발을위한 주장 공급. 이전 도구에 비해, 그것은 더보다는 협력적인 사회보다, 프로젝트의 코드에 대해 우려됩니다. 일반적인 AST를 사용하여 소스 프로젝트 방식으로 코드베이스 쿼리 정보의 언어를 아무 달성 할 수 없다.

에서 원천 프로젝트 조직, 당신은 몇 가지 흥미로운 데이터 분석 도구를 찾을 수 있습니다. 포함 :

자식-이동 : 순수 확장 성이 뛰어난 자식 저장소를 달성하기 위해 Golang 언어입니다.

에르 : golang 전체 저장소에 제출 이력 분석 도구를 얻을 수 있습니다.

gitbase : 힘내 저장소 Golang SQL 데이터베이스 인터페이스의 구현입니다.

8, 허블

허블 시각화 GitHub의 기업 협업, 사용 현황 및 상태 데이터. 그것은 자신의 내부 조직을 이해하기 위해 대기업을 돕는 방법과 함께 참여자의 분포와 협력을 프로젝트에 최선을 다하고 있습니다.

허블 기업은 두 가지 구성 요소로 구성되어 있습니다. 업데이트 구성 요소에서, 힘내 저장소에 저장 결과 GitHub의 엔터프라이즈 장치 관련 데이터에서 하루에 조회하는 파이썬 스크립트입니다. 문서의 구성 요소는 GitHub의 페이지 호스팅에 의해 수집 된 데이터 시각화를위한 웹 응용 프로그램입니다.

9 Onefetch

마지막으로, 매우 강력한 언급 세 이하 명령 줄 , 50 개 언어에 대한 자식 프로젝트 정보를 시각화 도구, 지원이 녹 언어를 부각되고 있기 때문에 그것을 언급.

추천

출처www.cnblogs.com/heqingxiaohuo/p/12158363.html