보간, 고정 가설, 고유 가설, 바리오 그램, 어 버트먼트, 너깃, 크리깅, 선형 비 편향 최적 ... 지구 과학 계산의 주요 개념 및 공식의 전체 솔루션

보간, 고정 가설, 고유 가설, 바리오 그램, 어 버트먼트, 너깃, 크리깅, 선형 비 편향 최적 ... 지구 과학 계산의 주요 개념 및 공식의 전체 솔루션

1. 소개

다중 스펙트럼하이퍼 스펙트럼 원격 감지의 실제 응용   에서 시작된 여러 최근 블로그에서 각각 이미지의 전처리 및 관련 알고리즘 및 반전 작업을 자세히 소개했습니다. 원격 탐사를 통해 다양한 유형의 표면 정보 데이터를 획득 한 후 어떻게하면 좋은 수학적 처리와 데이터의 과학적 분석을 수행 할 수 있는지도 우리가 주목해야 할 문제입니다. 따라서 저는이 블로그에서 시작하여 지구과학 계산의 내용에 대한 예비 요약을 하나씩 제공하는 새 열을 만들 것입니다.
  우선, 우리는 지구과학 컴퓨팅의 몇 가지 기본 개념으로 시작하여 관련 이론적 내용에 대해 어느 정도 이해하게 될 것입니다.
  아래 내용은 따로 보면 이해하기 조금 어려울 수 있지만, 실제 응용과 결합하면 갑자기 명확 해집니다. 그 중에서 구체적인 실제 적용 부분은 다음 블로그에서 다룰 것입니다.

2 공간 보간

  공간 데이터의 수집은 공간 분석의 기초이자 원점입니다. 연구 결론의 정확성을 높이기 위해 우리는 항상 연구 분야에서보다 포괄적이고 정확한 공간 속성 데이터 정보를 얻기를 희망합니다. 그러나 실제 연구 및 작업에서는 인력, 비용, 자원 등과 같은 외부 제약으로 인해 알려지지 않은 모든 영역을 샘플링하고 측정하는 것이 불가능하지만 종종 제한된 수의 샘플링 지점 및 관련 속성 데이터 만 연구 영역을 얻을 수 있습니다. 따라서 특정 수학적 모델을 사용하여 적절한 공간 샘플링 포인트를 선택하고 알려진 샘플링 포인트의 해당 속성 데이터를 기반으로 연구 영역 내 모든 위치의 알려지지 않은 속성 정보를 예측하는 것을 고려하는 것이 종종 가능합니다.
  공간 보간은이 요구 사항을 충족 할 수 있습니다. 이산 샘플링 포인트의 측정 데이터를 보간 및 외삽의 두 가지 응용 프로그램 형식을 포함하여 연속 데이터 표면으로 변환하는 일반적인 방법입니다. 일반적으로 샘플 포인트 범위 내의 공간 (즉, 모든 샘플 포인트의 가장 큰 외접 사각형 내부)을 "보간"이라고 할 수 있습니다 (일부 문서에서는 "보간"대신 "보간"을 직접 사용하기도합니다). 그 반대의 경우 : "외삽"또는 "예측"은 종종 외삽 결과에 큰 오류가있는 것으로 간주됩니다.
  공간 보간 이론과 그 방법은 유명한 "Tobler의 지리 제 1 법칙"을 기반으로합니다. 즉, 일반적으로 거리가 가까울수록 상관 관계가 높아집니다. 광범위한 영향을 미친이 지질 법은 1970 년 미국 스위스 지리학자 인 Waldo R. Tobler 교수가 처음 제안했습니다.
  각 방법에 해당하는 수학적 계산 원리의 수준에서 공간 보간은 일반적으로 결정 론적 보간 방법 (결정적 보간)과 지리 통계적 보간 방법 (비 결정적 보간 방법이라고도 알려진 지리 통계)으로 나눌 수 있습니다. 그 중에서 결정 론적 보간법은 연구 영역의 정보 점 간의 유사성 또는 전체 표면의 평활도를 기반으로 연속 피팅 표면을 생성하는 방법으로 전체 보간법과 로컬 보간법으로 더 나눌 수 있습니다. 지구 통계 보간법은 변동 함수 이론 (Variogram)과 구조 분석을 기반으로 연구 분야의 각 정보 점에 대한 종합 통계 법칙을 기반으로 속성의 공간적 자기 상관의 정량화를 실현하여 연속적인 보간 표면.
  생성 된 연속 보간 표면이 모든 샘플링 지점을 통과하는지 여부 수준에서 공간 보간은 일반적으로 정밀 보간과 비 정밀 보간의 두 가지 유형으로 나눌 수 있습니다. 이 중 전자 예측 샘플의 속성 값은 각각의 실제 측정 값과 동일합니다. 즉, 샘플링 포인트의 모든 속성 데이터가 예측 결과 표면에 속합니다. 후자의 예측 샘플의 속성 값 종종 각각의 실제 측정 값, 즉 샘플링 포인트의 속성과 같지 않습니다. 데이터는 일반적으로 예측 결과 표면에 속하지 않습니다. 따라서 부정확 한 보간 방법을 사용하면 예측 표면에 명백한 최고점 또는 최저점이 나타나는 것을 방지 할 수 있으며 전체적인 추세는 완만합니다.

3 몇 가지 중요한 가정

  지구과학 계산에서 몇 가지 중요한 가정이 핵심의 핵심이라고 할 수 있으며 종종 이해하기 어렵습니다. 두려워하지 말고 천천히 아래를 살펴 보겠습니다.

3.1 고정 가설

  고정 가정 (고정 가정)은 관측 값 세트의 평균값이 항상 고정되어 있으며 관측치의 위치와 관련이 없음을 의미합니다. 설정된 점 세트가 연구 영역의 한 위치에서 다른 위치로 이동할 때 , 임의 기능의 특성은 변경되지 않습니다. 즉, 랜덤 함수의 분포 법칙은 위치의 변화로 인해 변하지 않고 엄격한 안정성을 가지고있다.
정상 가설의 공식은 다음과 같이 표현됩니다.
여기에 사진 설명 삽입
  여기서 F_ (x_1, ..., x_n) (z_1, ..., z_n)은 ( x_1, ..., x_n).

3.2 2 차 정상 성 가정

  약한 고정 가정이라고도하는 2 차 고정 가정 (2 차 고정 가정)은 공분산 함수와 관련이 있습니다. 이 가설은 랜덤 함수의 평균이 상수이고 두 랜덤 변수 사이의 공분산은 둘 사이의 거리와 방향에만 의존하며 특정 위치와는 아무 관련이 없다는 가정입니다.
  위의 두 조건은 다음과 같은 공식으로 표현됩니다.이
여기에 사진 설명 삽입
  중 E [Z (x)]는 지역화 변수 Z (x)의 수학적 기대 값이고 Cov [Z (x), Z (x + h)]는 다음과 같습니다. 지역화 된 변수 Z (x) 및 Z (x + h)에 해당하는 공분산 함수, C (h)는 h에만 관련된 공분산 값이고, m은 상수이고, h는 시차입니다.
  위에서 언급 한 2 차 정상 가설은 전체 연구 영역에 대한 것입니다. 지역화 변수가 전체 연구 영역의 제한된 영역에서만 위의 조건을 충족하는 경우, 즉 조건이 로컬 영역에서만 유효하면 지역화 변수는 준 2 차 고정 가정을 충족한다고합니다. 준 2 차 정상 성 가설은 정상 범위의 크기와 유효한 데이터 수를 모두 고려하는 절충 솔루션으로 간주 할 수 있습니다.

3.3 내재 가설

  내재 가설이라고도하는 내재 가설은 변량 도와 관련이 있습니다. 이 가설은 지역화 된 변수의 증분이 다음 두 가지 조건을 충족한다고 믿습니다. 전체 연구 영역에서 지역화 된 변수의 증분에 대한 수학적 기대 값은 0이고 분산 함수가 존재하며 시차에만 의존합니다. 위치는 무관합니다.
  위의 두 가지 조건은 다음과 같은 공식으로 표현됩니다.
여기에 사진 설명 삽입
  E (x)가 존재하면 위의 첫 번째 공식은 다음과 같이 작성할 수 있습니다.
여기에 사진 설명 삽입
  그중 Var [Z (x) -Z (x + h)]는 지역화 된 변수 Z ( x) Z (x + h)에 해당하는 분산 함수이고, γ (h)는 지연 거리가 h이고, m이 상수이고, h가 지연 거리이고, 다른 기호가 위에서 언급 한 것과 같은 의미입니다.
  마찬가지로, 위에서 언급 한 내재 가설은 전체 연구 분야에도 적용됩니다. 지역화 변수가 전체 연구 영역의 제한된 영역에서 위의 조건 만 충족하면 지역화 변수가 준 내재 가설 (Quasi Intrinsic Hypothesis)을 충족한다고합니다. 준 2 차 정상 가설과 유사하게, 준 고유 가설은 고유 가설의 해당 범위 크기와 유효한 데이터 수를 고려하는 절충 솔루션으로 간주 될 수도 있습니다.
  또한 내재 가설은 지구 통계학에서 무작위 함수에 대한 기본 가설입니다.

3.4 다른 가설의 비교

  위에서 언급 한 2 차 정상 가설과 내재 가설의 관련 원리를 결합하면 두 가설의 토론 대상이 특정 차이가 있음을 알 수 있습니다. 특정 연구 영역 [즉, Z (x)], 내재 가설은 지역화 변수에 해당하는 증분 [즉 Z (x) -Z (x + h)]의 특성을 연구하는 것입니다.
  일반적으로 2 차 정상 가설은 내재적 가정보다 지역화 변수에 대한 요구 사항이 더 엄격하다고 믿어집니다. 즉, 연구 분야의 특정 지역화 변수가 2 차 정상 가설을 충족하는 경우 내재 가설을 충족해야합니다. , 지역화 변수 만 내재 가설을 충족하는 것으로 알려진 경우 반드시 2 차 정상 가설을 충족하는 것은 아닙니다.
  고정 가설과 결합하여 위의 세 가설의 엄격 성은 고정 가설, 2 차 정상 가설 및 내재 가설의 내림차순으로 정렬됩니다.
  또한 2 차 정상 성 가설의 두 가지 조건을 결합하여 공분산 함수와 분산도 사이의 관계를 도출 할 수 있습니다.이
여기에 사진 설명 삽입
  중 γ (h)는 지역화 변수에 해당하는 분산도 이고 C (0)은 다음과 같습니다. 거리 0이 지역화 된 변수에 해당하는 공분산 값이 [즉, 씰 값 γ (∞)] 일 때, C (h)는 거리가 h 일 때이 지역화 된 변수의 해당 공분산 값입니다.
  이 관계에서 공분산 함수와 h로 구분 된 두 공간 위치에서 특정 지역 변수의 자기 상관을 측정하는 데 사용되는 인덱스 인 variogram 사이에 상관 관계가 있음을 알 수 있습니다. 따라서 2 차 정상 성 가설을 만족하는 조건에서 공분산 함수가 안정적이면 변동 함수가 안정적이라는 것을 알 수있다. 즉, 그 값은 시차 거리 h 와만 관련이 있음을 알 수있다.

4 변주 기능

  Kriging 보간 방법은 공간 데이터의 실험적 variogram과 그 산점도 특성에 의존해야하므로 variogram의 계산은 Kriging 보간 과정에서 중요한 역할을합니다. variogram과 모델 피팅은 Kriging 보간 결과에서 중요한 역할을합니다. 정확도는 더 큰 영향을 미칩니다.
  semi-variogram, semi-variogram 등으로도 알려진 Variogram은 지역화 된 변수의 공간 변화 특성과 강도를 설명하는 데 사용되며 지역화 된 변수 증분의 제곱에 대한 수학적 기대 값으로 정의됩니다.
  1 차원 조건에서 위치 (x) 및 (x + h)에서 지역화 변수 Z의 값 Z (x) 및 Z (x + h) 간의 차이의 분산을 가변 도로 직접 정의하고, 종속 변수는 거리 h이고, 2 차원 또는 3 차원 조건 하에서, 위에서 언급 한 1 차원에서 단일 방향의 거리 h는 임의의 방향 α에서 거리 | h |까지 더 확장 될 수 있습니다. 구체적인 공식은 다음과 같이 표현됩니다.
여기에 사진 설명 삽입
  그중 γ (x, h)는 변이 함수입니다. 수식 앞에 계수 "2"가 있으므로 반 변량이라고도합니다. (준) 2 차 정상 가설 및 (준) 고유 가설과 같은 기본적인 지질 학적 가정과 결합 된 가변성 함수의 값은 지역화 된 변수의 표본 지점 x 위치와 관련이 없지만 다음과 만 관련이 있습니다. 샘플 점 사이의 거리 (h)는, 그 편차가 함수는 다음과 같이 쓸 수있다 :
여기에 사진 설명 삽입
  여기서 〖γ (H)〗 ^ # N (H)는 지점 쌍의 수는 지역적인 변수 Z (X)의 변화의 함수이다 지역화 된 변수의 샘플 포인트에서 h의 거리, x_i는 거리 h 시간에 해당하는 i 번째 포인트입니다. 여기서 거리 h는 지연 거리 (Lag Distance) 라고도합니다 .
  일반적으로 지역화 된 가변 배리도의 이미지는 종종 "처음에 빠르게 상승한 다음 느려진 다음 안정되는 경향"이라는 곡선 특성을 나타냅니다. 세 가지 매우 중요한 관련 개념, 즉 너깃 상수 (Nugget), (Sill) 및 변수 범위 (Range)가 있습니다.
  너겟 상수지역화 변수의 무작위성을 나타냅니다. 이론적 관점에서 간격이 0 (즉, 지연 거리가 0)이면 지역화 된 변수의 샘플링 지점 값이 같아야하며 간격이 0에 무한히 가까울 때 값은 다음과 같아야합니다. 해당 변량도 역시 0에 가까워 야합니다. 그러나 실제 연구에서 테스트 변동 함수의 지연 거리가 0 인 경우 그 값은 0이 아니라 0보다 큰 값입니다. 이 값을 너깃 상수라고합니다. 일반적으로 위에서 언급 한 너깃 효과는 측정 오류 또는 샘플링 간격의 거리보다 작은 공간 변동에 기인 할 수 있습니다.
  씰 값은 지역화 변수의 변화 크기를 측정하는 데 사용됩니다. 지연 거리가 무한히 증가하여 일정 수준에 도달하면 테스트 변동 함수가 안정된 경향이있는 경우이 안정 수준에 해당하는 값이 기지국 값입니다. 그러나 모든 지역화 된 변수에 씰 값이없는 모델에 해당하는 variogram과 같은 씰 값이있는 것은 아닙니다.
  변수 범위는 지역화 된 변수의 자기 상관 범위 크기를 측정하는 데 사용됩니다. 지연 거리가 무한히 증가하여 일정 수준에 도달하면 테스트 변동 함수가 안정된 경향이있는 경우이 시점에 해당하는 지연 거리가 가변 범위입니다. 여기서, 가변 범위보다 작은 거리에 해당하는 샘플 위치는 공간과 자기 상관되고, 가변 범위보다 큰 거리에 해당하는 샘플 위치는 공간 자기 상관을 갖지 않는다.
  또한, 베리오 그램은 등의 차이와 같은 다른 관련 지표 갖는다 문턱 값과 너깃 정수 - 부분 창턱, 씰에 너깃 상수의 비율 부가가치 공간 variability-의 정도를 측정하는 데 사용되는 - 너겟 계수 등.
  지역화 된 변수에 해당하는 변량도의 특성에 따라 여러 범주로 나눌 수 있습니다. 변형 함수의 실값 유무에 따라 실값 모델 , 비 접합 값 모델 , 캐비테이션 효과 모델 로 나눌 수 있습니다 .
  그중에 는 기지국 가치 모델이 있습니다.variogram의 특성에 따라 순수 너깃 효과 모델 (Pure Nugget Effect Model), 구형 모델 (Spherical Model), 지수 모델 (Exponential Model), Gaussian 모델 (Cubic Model 또는 Gaussian Model) 및 선형으로 더 나눌 수 있습니다. 어 버트먼트 모델 (Linear with Sill Model) 등. 위의 모델 중에서 가장 일반적으로 사용되는 모델에는 구형 모델, 지수 모델 및 가우스 모델이 있습니다.
  또한 variogram의 특성에 따라 비 기지국 값 모델 은 선형 비 기지국 값 모델, 전력 지수 모델 및 로그 모델로 더 나눌 수 있습니다. 유사하게 캐비테이션 효과 모델은 어 버트먼트 값 모델과 어 버트먼트 값이없는 모델로 나눌 수 있습니다.
  동시에 특정 지역화 된 변수의 경우 다른 방향과 다른 지연 거리의 다른 요인에 의해 영향을받을 수 있습니다. 중첩 구조 는이 문제를 잘 해결할 수 있습니다. 중첩 구조는 지역화 된 변수의 특성을보다 잘 일반화하기 위해 특정 방향 또는 특정 척도의 변동성을 나타내는 다중 변수의 합으로 표현할 수 있습니다.

5 Kriging 보간

  공간 국부 보간이라고도하는 Kriging Method (Kriging Method)는 위에서 언급 한 변량 이론과 그 구조 분석을 기반으로 제한된 영역의 지역화 된 변수에 대한 선형 편향되지 않은 최적 추정을 수행합니다 (Best Linear Unbiased Prediction)., BLUP )는 지리 통계학에서 공간 최적의 편향되지 않은 추정기 (Spatial BLUP)로도 알려져 있습니다.
그 중에서 위의 " 선형 "은 선형 추정을 이용하여 미 지점의 속성 값을 추정하는 Kriging 보간법을 말하며, 공식은 다음과 같습니다.
여기에 사진 설명 삽입
  여기서 (z_0) ̂는 해당 지점에서 지역화 된 변수의 예측값입니다. x_0, y_0), Λ_i는 i 번째 알려진 지점의 가중치 계수이고 z_i는 i 번째 알려진 지점의 측정 된 값입니다.
  위의 가중치 λ_i는 각 지점에서 예측값과 측정 값 간의 편차를 최소화 할 수 있으며,이 가중치를 얻는 것이 Kriging 보간의 주요 내용입니다.
  위에서 언급 한 " 편향되지 않음"은 지역화 된 변수의 각 지점에서 추정 자의 수학적 기대치가 동일한 위치에서 실제 값과 동일 함을 의미합니다. 공식은 다음과 같습니다.
여기에 사진 설명 삽입
  내재적 가정과 결합하여 편향성을 표현할 수 있습니다. 로 다음
여기에 사진 설명 삽입
  , 상기 언급 된 " 최적 "인 각 점에서의 지역적인 변수 추정량과 동일한 위치의 진정한 값의 작은 변동을 참조하는 수식은 그대로 다음과 같다.
여기에 사진 설명 삽입
  그중 한 상기 분산은 추정의 정확도를 정량적으로 표현하는 추정 분산 또는 추정 분산이라고합니다. Kriging 보간 방법에서는 Kriging 분산이라고도합니다. kriging 분산은 나중에 σ_k ^ 2로 기록됩니다.
  통계 관련 유도 후 Kriging 분산은 다음과 같이 작성할 수 있습니다.
여기에 사진 설명 삽입
  이것은 편향되지 않은 조건의 제약 하에서 최소값 문제 변환 될 수 있습니다 . Lagrangian 곱셈기 φ를 도입하여 Lagrangian 함수를 생성합니다
여기에 사진 설명 삽입
  . 가중치와 라그랑 지 곱셈기의 1 차 편미분 찾기 :
여기에 사진 설명 삽입
  편미분 솔루션 결과는 다음과 같습니다.
여기에 사진 설명 삽입
  위의 합산 부분을 확장합니다.
여기에 사진 설명 삽입
  위의 공식은 행렬 곱셈의 형태로 추가로 작성 될 수 있으며 다음 과 같이 변환됩니다.
여기에 사진 설명 삽입
  그 중에서 A는 원래 바리 그램 행렬에 모든 1 행과 1 열을 더한 것을 나타냅니다 (접합 1은 0으로 변경) 후자 행렬 λ는 각 가중치로 구성된 열 벡터, φ는 이전 분석에서 도입 된 라그랑 지 승수, B는 각 위치와 위치 사이의 거리에 해당하는 바리 그램 값으로 구성된 열 벡터입니다. 해결해야하며 A 1 열 끝에 추가됩니다.
  따라서 위의 함수는 (n + 1) 개의 미지수와 (n + 1) 개의 표현식으로 구성된 방정식 시스템으로 변환됩니다. 행렬 반전을 통해 방정식 시스템을 풀고 풀어야 할 위치와 다른 알려진 위치의 가중치를 얻을 수 있습니다. 포인트. 삽입 할 각 점에 대해 동일한 작업을 수행하여 Kriging 보간을 완료합니다.

6 크리거에게 돌아 가기

  위의 분석과 마찬가지로 Ordinary Kriging 방법은 선택한 샘플링 포인트 데이터에 더 많이 의존하여 공간을 보간하고 보간 효과는 샘플링 포인트의 수와 밀도, 데이터의 정확도에 더 많이 의존합니다. ,, 많은 공간 속성은 종종 다른 환경 변수의 영향을받습니다. 예를 들어, 토양 유기 탄소 함량은 0.05 수준에서 온도, 고도, 강수 및 경사와 같은 다양한 환경 요인과 유의 한 상관 관계가 있습니다 [3, 4]; 지표 근처 온도는 고도, 토지와 같은 환경 요인과 유의 한 상관 관계가 있습니다. 해면 거리 및 0.01 수준의 NDVI [3, 4] 5]. 이러한 관점에서 보간의 공간적 속성에 대한 환경 적 요인의 영향을 단순히 무시하면 최종 보간 결과의 정확도가 떨어질 수 있습니다.
  이러한 고려 사항을 바탕으로 Regression Kriging 방법을 사용하여 환경 요인을 고려할 수 있습니다. 회귀 Kriging 보간을 적용하려면 먼저 대상 변수와 보조 환경 변수 간의 상관 관계를 결정해야합니다. 상관 관계가 요구 사항을 충족하는지 확인한 후 대상 변수와 제거 할 환경 변수의 일 변량 또는 다중 회귀 모델을 설정합니다. 공간 트렌드 아이템. 그 후, 샘플링 포인트의 측정 데이터와 회귀 모델에 의해 계산 된 해당 위치 값에 따라 목표 변수의 결정적 추세 항목이 획득됩니다. 일반 Kriging 방법을 사용하여 잔차를 보간하고 마지막으로 회귀 예측의 추세 항목을 일반 Kriging의 보간 결과에 추가하여 목표 변수의 추정 값을 얻습니다.
  최종 공간 보간 결과의 공식은 다음과 같이 표현됩니다.
여기에 사진 설명 삽입

  그 중에서 Z (x_0)는 회귀 분석의 결과입니다. x_0 위치에서 Kriging 추정값, m̂ (x_0)은이 위치에서 결정 론적 추세 항의 값이고, ê (x_0)은 잔차 일반 Kriging 보간입니다. 위치. 회귀 Kriging 보간을 완료하기 위해 연구 영역의 각 위치에 대해 동일한 작업을 수행합니다.
  일반적으로 외부 세계의 영향을 많이받는 공간 속성의 경우 회귀 Kriging 보간 효과가 일반 Kriging 보간 효과보다 낫습니다 [6].
  반면에 앞서 언급했듯이 회귀 Kriging 방법은 여전히 ​​일반 Kriging 보간법을 사용하여 잔차 항을 계산하지만 환경 요인에 의해 결정된 공간보다 최종 목표 변수 보간 결과에 더 큰 영향을 미칩니다. 여전히 낮기 때문에 회귀 Kriging 방법의 결과는 일반 Kriging 방법의 결과에 비해 거칠고 깨질 것입니다. 또한 방법에 의해 고려되는 요인의 관점에서 회귀 Kriging 방법과 Cokriging 방법은 특정 유사점이 있습니다. 즉, 둘 다 대상 변수의 공간 분포를 추정하기 위해 관련 환경 요인을 사용합니다. 회귀 크리깅의 데이터는 래스터 레이어와 같은 영역에 분산되고, 코 크리깅의 보조 데이터는 포인트로 분산됩니다. 그러나 어떤 방법을 채택하더라도 최종 보간 결과는 완전한 표면입니다.

공개 계정에 관심을 기울이는 것을 환영합니다 : 미친 학습 GIS

여기에 사진 설명 삽입

추천

출처blog.csdn.net/zhebushibiaoshifu/article/details/113943720