R 소프트웨어
- R은 무료입니다
- R은 다양한 데이터 분석 기술을 제공하는 포괄적 인 통계 연구 플랫폼입니다.
- R에는 최고의 그리기 기능이 있습니다.
데이터 분석
데이터 란?
데이터는 객관적인 사건을 기록하고 식별 할 수있는 상징이며, 객관적인 사물의 성격, 상태 및 관계를 기록하는 물리적 상징 또는 이러한 물리적 상징의 조합입니다.
데이터 분석을하는 이유는 무엇입니까?
데이터 분석 결과를 사용하여 의사 결정을 내립니다.
데이터 분석 프로세스
데이터 수집 → 데이터 저장 → 데이터 분석 → 데이터 마이닝 → 데이터 시각화 → 의사 결정
데이터 수집
수집 된 데이터를 원본 데이터라고합니다.
데이터를 파일로 저장
통계
통계적 방법을 사용하여 수집 된 데이터를 의도적으로 분석 및 처리하고 분석 결과를 해석합니다.
데이터 수집
데이터 탐색 및 데이터 마이닝이라고도하는 영어로 데이터 마이닝이라고하는 데이터 마이닝은 일반적으로 알고리즘을 통해 대량의 데이터에 숨겨진 정보를 검색하는 프로세스를 말합니다.
데이터 마이닝과 데이터 통계의 차이점
- 데이터 마이닝은 무엇을 파 낼지 결정할 수 없습니다. 그것은 알려지지 않은 것을 탐구하는 데 사용되며 구체적인 방법은 알려져 있지 않습니다. 데이터 통계의 목표는 일반적으로 명확하며 합산, 평균 계산 등과 같은 계산할 값을 알고 있습니다. ., 적절한 통계 방법 만 사용하면됩니다.
- 데이터 마이닝은 일반적으로 컴퓨터 과학과 관련이 있으며 데이터 마이닝의 목표는 통계 온라인 분석 및 처리, 정보 검색, 기계 학습, 인공 지능, 전문가 시스템 및 패턴 인식과 같은 다양한 방법을 통해 달성됩니다.
- 데이터 통계, 다른 통계학자는 동일한 결과를 계산하기 위해 다른 방법을 사용합니다. 데이터 마이닝, 동일한 데이터, 다른 사람은 다른 결과를 얻을 수 있습니다.
- 데이터 마이닝과 데이터 통계는 서로 독립적이지 않으며 데이터 마이닝 과정에서도 통계 지식이 필요합니다.
데이터 마이닝과 세 가지 주요 사고 변화
1. 적은 수의 데이터 샘플을 분석하는 대신 무언가와 관련된 모든 데이터를 분석하기 위해
2. 우리는 데이터의 복잡성을 기꺼이 받아들이고 더 이상 정확성을 추구하지 않습니다
3. 더 이상 애매한 인과 관계를 추구하지 않습니다. 사물에 집중
데이터 시각화
그래픽은 종종 숫자보다 더 명확합니다. 예를 들어 GPS 위치 확인을 통해 얻은 위도 및 경도 정보가지도에 더 잘 표시됩니다.