수박 책 : 첫 번째 장

1.1 용어는 실질적으로
우리 박의 수에 대해서는, 예를 들면 데이터를 수집 가정
(= 컬링 유경, 컬러 = 녹색 = 유성음가 큰 노크)
(컬러 블랙 =; 척추 경 : 약간 만곡, 사운드 지루한 노킹을 =),
(; t 척추 경 강성, 얕은 컬러 = 두드리는 음을 선명)
......

괄호의 각 쌍은 기록이다,

  • 설정 기록은 "이라고도 데이터 세트 "(데이터 세트);

  • 이벤트 또는 개체의 레코드 (이하 본원 수박) 설명하는 "이라고마다 샘플 "(예) 또는 " 샘플 "(샘플);

  • 물질 또는 특성은 성능 이벤트 객체 또는 특정 영역에서, "라고 반영 속성 (속성)"또는 " 특징 "(기능)을, 실시 예를, "컬러", "척추 경"

  • 속성 값 "이라 속성 값 "(속성 값), 예, "녹색", "블랙";

  • 속성에 의해 스팬 된 공간은 "이라 특성 공간 "(공간 속성) " 샘플 공간 "(샘플 공간) 또는 " 입력 공간 ." 각각이 좌표 공간에서 자신의 위치를 찾을 수 박 예 "칼라", "척추 경"의 세 개의 축으로 "소리 노킹", 그들은 박을 설명하기위한 3 차원 공간에 걸쳐;

  • 벡터를 조정하고, 따라서 또한 하나의 예는 "라고 할 때마다 포인트에 대응 보낸 특징 벡터 "(특징 벡터);

  • 예 "로 지칭되는 플래그 정보가 샘플 "(예);

예측은 이산 값 "이라는 등의 학습 과제의 경우 종류 와 같은"좋은 멜론 ","나쁜 멜론 "로"(분류);

예측 지속적인 가치 경우, 이러한 학습 작업 "이라고 회귀 수박 만기 0.95,0.37로"(회귀);

수박 "할 수있는 클러스터 "(클러스터링), 수박 곧 훈련 세트가 여러 그룹으로 나누어 각 그룹은 "이라고 클러스터 "(클러스터)이 클러스터가 자동으로 해당 분류의 잠재적 인 개념의 숫자를 형성 할 수있다, 예 : "얕은로 컬러 멜론 ","어두운 멜론. " 이 학습 과정은 데이터의보다 심층적 인 분석을위한 기반을 구축, 데이터의 고유 한 법칙을 이해하는 데 도움이 될 것입니다. 참고 클러스터링은 "밝은 색의 멜론", 이러한 개념이 사전에 알려져 있지 않다 "어두운 멜론", 일반적으로 학습 과정없이 태그 정보에 사용되는 훈련 샘플. 물론, 예외가 있습니다.

작업을 학습하는 것은 크게 두 범주로 나눌 수 있습니다 태그 정보를 기반으로 학습 데이터가있다 : " 감독 학습 '(감독 학습) 및" 자율 학습 "(자율 학습), 전자 대신 분류 및 회귀를, 후자의 클러스터링 대표 .

새로운 모델 "이라고 샘플에 적용 배울 수있는 능력을 얻기 일반화 아니라 전체 표본 공간에 적합 모델의 강력한 일반화의 능력, (일반화) 용량을".

发布了70 篇原创文章 · 获赞 29 · 访问量 4万+

추천

출처blog.csdn.net/LOVEYSUXIN/article/details/104055142