상관 관계

상관 관계 란 무엇입니까?

상호 관계는 두 가지 사물, 사람 또는 아이디어 간의 유사성 또는 관계를 의미합니다. 이것은 두 가지 가설, 상황 또는 대상간에 존재하는 유사성 또는 동등성입니다.

통계 및 수학 분야에서 상관 관계는 두 개 이상의 관련 변수 사이의 척도를 나타냅니다.

상관 관계라는 용어는 라틴어의 상관 관계 에서 유래 된 여성 명사입니다 .

correlation이라는 단어는 relation, equation, nexus, correspondence, analogy 및 connection과 같은 동의어로 바꿀 수 있습니다.

상관 계수

통계에서 제품 - 순간 상관 계수라고도하는 피어슨 상관 계수 (r)는 동일한 지표에서 두 변수 간의 관계를 측정합니다.

상관 계수의 함수는 알려진 데이터 또는 정보 집합 사이에 존재하는 관계의 강도를 결정하는 것입니다.

상관 계수 값은 -1과 1 사이에서 달라질 수 있으며 결과는 상관 관계가 음인지 양수인지를 정의합니다.

계수를 해석하기 위해서는 변수 사이의 상관 관계가 완전한 양수 이고 -1은 완전한 음수 라는 것을 알아야합니다. 계수가 0이면 변수가 서로 의존하지 않는다는 의미입니다.

통계에는 스피어 만 (Spearman) 상관 계수 가 있으며 통계학자인 찰스 스피어 먼 (Charles Spearman)에게 경의를 표합니다. 이 계수의 기능은 선형인지 여부에 관계없이 두 변수 간의 관계의 강도를 측정하는 것입니다.

스피어 만 (Spearman) 상관 관계 분석은 두 개의 분석 된 변수 간 관계의 강도가 단조 함수 (초기 순서 관계를 보존하거나 반전시키는 수학 함수)로 측정 할 수 있는지 평가하는 역할을합니다.

피어슨 상관 계수 계산

방법 1) 공분산과 표준 편차를 사용하여 피어슨 상관 계수 계산.

어디서?

S XY 는 공분산이다.

S xS y 는 각각 변수 x와 y의 표준 편차를 나타냅니다.

이 경우 계산은 변수 사이의 공분산과 각 변수의 표준 편차를 먼저 찾습니다. 그런 다음 공분산을 표준 편차의 곱으로 나눕니다.

이 명령문은 수식을 적용하여 변수의 표준 편차 또는 변수의 공분산을 제공합니다.

방법 2) 원시 데이터와의 피어슨 상관 계수 계산 (공분산 또는 표준 편차없이).

이 방법을 사용하면 가장 직접적인 수식은 다음과 같습니다.

예를 들어 포도당 수준 (y)과 연령 (x)의 두 변수를 n = 6으로 관측 한 데이터가 있다고 가정하면 계산은 다음 단계를 따릅니다.

1 단계) 기존 데이터로 테이블을 구성합니다 : i, x, y 및 xy, x² 및 y²에 대한 빈 열 추가 :

2 단계 : x와 y를 곱해서 "xy"열을 채 웁니다. 예를 들어, 라인 1에서 우리는 : x1y1 = 43x99 = 4257을 가질 것입니다.

3 단계 : 열 x의 값을 올리고 열 x²에 결과를 기록합니다. 예를 들어, 첫 번째 줄에는 x 1 2 = 43 x 43 = 1849가 있습니다.

4 단계 : 3 단계와 동일한 작업을 수행하십시오. 이제 y 열을 사용하고 y² 열에 값의 제곱을 기록하십시오. 예를 들어, 첫 번째 줄에는 y 1 2 = 99 × 99 = 9801이 표시됩니다.

5 단계 : 모든 열 번호의 합을 가져 와서 열 바닥 글에 결과를 배치합니다. 예를 들어, Age X 열의 합계는 43 + 21 + 25 + 42 + 57 + 59 = 247입니다.

6 단계 : 위의 공식을 사용하여 상관 계수를 얻습니다.

따라서, 우리는 :

스피어 먼의 상관 계수

스피 어맨 상관 계수 계산은 다소 다릅니다. 이를 위해 다음 표에서 데이터를 정리해야합니다.

1. 2 쌍의 데이터를 표현한 후 표에 소개해야합니다. 예 :

2. "Ranking A"열에는 "날짜 A"에있는 관측치가 "1"이 열에 가장 낮은 값으로, en (총 관측 수), "Date A"열의 가장 높은 값 ". 이 예에서는 다음과 같습니다.

3. "데이터 B"열의 관측치를 사용하여 "Ranking B"열을 얻는 방법도 같습니다.

4. 열 "d"에서 우리는 두 순위 (A - B) 사이에 차이를 두었습니다. 여기서 신호는 중요하지 않습니다.

5. 열 "d"의 각 값을 올리고 열 d²에 기록하십시오.

6. 열 "d²"의 모든 데이터를 추가하십시오. 이 값은 Σd²입니다. 예제에서 Σd² = 0 + 1 + 0 + 1 = 2

7. 이제 스피어 만 (Spearman)의 공식을 사용합니다.

우리의 경우, 데이터의 행 수 (관측 수에 해당)를 살펴볼 때 n은 4와 같습니다.

8. 마지막으로 이전 공식의 데이터를 대체합니다.

선형 회귀 분석

선형 회귀는 다른 변수 (x)의 값을 알고있을 때 변수의 가능한 값 (y)을 추정하는 데 사용되는 공식입니다. "x"값은 독립 변수 또는 설명 변수이고 "y"는 종속 변수 또는 응답입니다.

선형 회귀는 "y"의 값이 변수 "x"의 함수로 어떻게 달라질 수 있는지 확인하는 데 사용됩니다. 분산 검사 값이 포함 된 선을 선형 회귀선이라고합니다.

설명 변수 "x"에 단일 값이있는 경우 회귀를 단순 선형 회귀 라고 합니다 .