sklearn 연구 노트 (1) - make_blobs는 기능과 해당 매개 변수 소개

make_blobs 방법 :

sklearn.datasets.make_blobs (N_SAMPLES = 100, n_features = 2, 센터 = 3, cluster_std = 1.0, center_box = (- 10.0,10.0), 셔플 = 사실, random_state = 없음)

make_blobs 기능은 데이터 세트의 클러스터를 생성하고, 태그에 대응하는 데이터 세트를 생성
N_SAMPLES 것은 : 데이터 샘플 포인트, 디폴트 값의 수를 나타내는 100
n_features 각 샘플 (또는 특성) 번호, 또한, 상기 데이터 사이즈를 나타내고, 디폴트 값은 2 개
센터 : 다수의 종류 (태그의 종류 수)를 나타낸다 기본값 . (3)는
다른 아날로그와 큰 차이가 cluster_std 수있다 상기 예를 들어, 우리는 제 2 데이터 유형을 생성하려면, 각각의 카테고리의 분산을 cluster_std [1.0, 3.0]로 설정되어, 플로트 또는 부동 소수점 시퀀스는, 디폴트 값은 1.0
center_box : 데이터 경계 중심 기본값 (-10.0 10.0) 결정 후
셔플 : 셔플 데이터를 디폴트 값은 참이다
random_state : 홈페이지 해석은 랜덤 발생기의 씨앗이며, 상기 생성 된 데이터를 소정의 수 후에, 데이터 세트가 모든 고정 생성되고 고정 될 수있다. 주어진 값 경우, 임의성 때문에 당신이 프로그램이 다를 수 있습니다 실행할 때마다 얻은 결과로 이어질 것입니다. 데이터 생성기를 사용하거나 컴퓨터 알고리즘 파이썬 연습을 배울 때 실제로 값을 주어 권장.

예를 들어 : jupyter 노트북에서 간단한 운동을 할 수있다.

                                       

추천

출처www.cnblogs.com/qfwmy/p/12085357.html