품질 도구의 산점도

Yunzhi QMS의 원본 재판에 대한 출처를 표시하십시오.

저자: 왕홍시

1. 산점도란?

산점도(Scatter Plot 또는 Scatter Chart)는 이름에서 알 수 있듯이 분산된 점들로 구성된 차트입니다. 이러한 점의 위치는 X 및 Y 값에 의해 결정됩니다. 따라서 XY 산점도라고도 합니다. 모든 데이터를 데카르트 좌표계에 점 형태로 표시하여 변수 간의 상호작용 정도를 나타내며, 변수의 값에 따라 점의 위치가 결정됩니다.

독립적인 데이터를 분석할 때는 히스토그램과 Plato를 이용하여 개선점을 직접 찾을 수 있지만 두 변수 X와 Y의 상관관계를 분석하고자 할 때는 산점도를 이용해야 합니다. 강철의 담금질 온도 및 경도, 나사의 토크 및 인장 강도, 오일의 온도 및 점도, 유리의 납 함량 및 방사선 저항 등

사람들은 종종 산점도를 사용하여 두 연속 변수 X와 Y 사이의 관계를 표현합니다. 그림의 각 점은 대상 데이터 세트의 각 샘플을 나타냅니다. 데카르트 좌표 평면과 종속 변수의 데이터 점 분포는 일반적으로 변수의 추세. 이러한 추세에서 실증적 분포에 맞는 적절한 함수를 선택할 수 있으며, 동시에 일부 직선과 곡선은 특정 모델을 나타내기 위해 종종 산포도에 맞춰지고 변수 간의 기능적 관계를 찾습니다.

2. 산점도의 역할

산점도는 계열을 일련의 점으로 표시하며, 차트에서 점의 위치로 표시되는 값과 차트에서 고유한 마커로 표시되는 범주가 있습니다. 산점도는 집계된 데이터를 범주별로 비교하는 데 자주 사용됩니다. 많은 응용 프로그램이 있습니다. 두 가지 일반적인 응용 프로그램은 다음과 같이 요약됩니다.

2.1 회귀 분석

회귀분석에 사용되는 산포도 직교좌표계의 평면상 데이터 점의 분포도 산포도는 종속변수가 독립변수에 따라 변하는 일반적인 경향을 나타내는 것으로 이를 바탕으로 적절한 함수를 정할 수 있다. 데이터 포인트에 맞게 선택되었습니다.

회귀 분석 후 산점도는 관련 개체를 예측하고 분석할 수 있으므로 변수 간의 숨겨진 관계를 발견한 다음 모호성 대신 과학적 결정을 내릴 수 있습니다. 예를 들어, 아래 집값 산포도는 다른 도시의 집값 상승을 직관적으로 보여줄 수 있으며 후속 집값 정책 조정에 중요한 지원을 제공합니다.

2.2 상관관계 분석

산점도는 상관관계 분석에 사용되며 두 개의 데이터 집합을 사용하여 여러 좌표점을 형성하고 좌표점의 분포를 조사하여 두 변수 사이에 일정한 관계가 있는지 또는 분포 패턴을 요약합니다. 좌표점.

산점도에서 데이터 포인트의 분포를 보면 변수 간의 상관 관계를 추론할 수 있습니다. 변수 사이에 상관관계가 없으면 산점도는 무작위로 분포된 불연속 점으로 나타나며, 특정 상관관계가 있으면 대부분의 데이터 포인트가 상대적으로 밀집되어 특정 추세에 나타납니다.

산점도의 핵심 가치는 변수들 간의 관계를 발견하는 데 있으며, 이 관계를 단순히 선형 회귀 관계로 이해하지 마십시오. 선형 관계, 지수 관계, 대수 관계 등과 같이 변수 사이에는 많은 관계가 있습니다. 물론 관계가 없는 것도 중요한 관계입니다.

데이터의 상관 관계는 주로 양의 상관(두 변수 값이 동시에 증가), 음의 상관(한 변수 값이 증가하고 다른 변수 값은 감소), 무상관, 선형 상관, 지수 상관 등으로 나뉩니다. , 산포도에 표시됩니다. 대략적인 분포는 아래 그림과 같습니다. 포인트 클러스터에서 멀리 떨어져 있는 포인트를 이상값 또는 비정상 포인트라고 합니다.

PDCA의 관점에서 산점도의 적용은 다음과 같이 요약됩니다.

3. 산점도의 변형

다양한 응용 시나리오를 기반으로 산점도에는 많은 변형이 있으며 몇 가지 일반적인 변형이 아래에 나열되어 있습니다.

  • 산점도 행렬

여러 변수 간의 상관관계를 동시에 알아보고자 할 때 이들 사이에 간단한 산포도를 하나씩 그리는 것은 매우 번거로운 일입니다. 이때 산점도 행렬을 이용하여 각 변수 간의 산점도를 동시에 그릴 수 있으므로 여러 변수 간의 주요 상관 관계를 빠르게 찾을 수 있으며 이는 다중 선형 회귀를 수행할 때 특히 중요합니다. 아래의 산점도 매트릭스는 팀 총점, 승률, 패스 성공률 및 슛 간의 관계를 보여줍니다.

  • 3D 산점도

산점도 행렬에서 여러 변수 간의 관계를 동시에 관찰할 수 있지만 평면 산점도의 2x2 관찰을 수행하면 몇 가지 중요한 정보가 누락될 수 있습니다. 3차원 산점도는 3개의 변수에 의해 결정되는 3차원 공간에서 변수 간의 관계를 연구하는 것으로 3개의 변수가 동시에 고려되기 때문에 2차원 그래프에서 찾을 수 없는 정보가 종종 나타날 수 있습니다. 설립하다. 아래의 3차원 산점도는 팀의 총점, 승수, 유효 슈팅 간의 관계를 보여줍니다.

  • 버블 차트

거품형 차트를 사용하여 세 변수 간의 관계를 표시할 수 있습니다. 워크시트의 열에 배열된 데이터(첫 번째 열에 나열된 x 값, 인접한 열에 해당 y 값 및 거품 크기 값)를 거품형 차트로 그릴 수 있습니다.

거품형 차트는 차트에 추가 크기 변수를 포함할 수 있다는 점을 제외하면 분산형 차트와 유사합니다. 사실상 이것은 2차원에 세 변수의 그래프를 그리는 것과 같습니다. 거품은 다양한 크기의 마커로 표시됩니다(상대적 중요도 표시).

4. 산점도 적용

산점도를 적용하면 많은 이점이 있으며 일반적으로 사용되는 포인트는 다음과 같이 요약됩니다.

  • 원인과 결과의 관계를 찾을 수 있습니다. 원인 데이터와 결과 데이터를 수집하고 비교합니다.
  • 결과를 한눈에 볼 수 있는 산점도 그리기: 산점도에서 원인과 결과의 데이터 포인트는 X 및 Y 좌표로 표시됩니다.
  • 관계가 있는지 여부를 판단할 수 있습니다. 두 데이터 세트 간의 관계는 산점도에서 명확하게 이해할 수 있습니다.

참고: 수집된 데이터를 그래프로 판단할 수 없는 경우 먼저 레이어에서 분리한 후 클릭하여 산포도 그래프를 그려야 합니다.

아래 표에 나열된 데이터는 수집된 특정 강편의 담금질 온도 X 및 경도 Y의 기록 테이블입니다. 담금질 온도 X와 경도 Y라는 두 변수 사이에 상관관계가 있습니까?

위 표의 데이터만 보면 위 데이터의 특징이 무엇인지 알 수 있습니까? 확실히 그렇지는 않지만 산점도로 표시하고 데이터에 특정 추세가 있음이 분명합니다.

추세선을 추가하면 더 분명해집니다.

 

추천

출처blog.csdn.net/weixin_60220317/article/details/129591412