분산공분산 행렬 [ variance-covariance matrix ]

다변량 자료를 분석할때 분산이 하나의 값으로 표현이 되지 않으므로 variance-covariance matrix를 사용

여러 개의 변수를 동시에 고려할 때, 각 변수의 분산과 변수 사이의 공분산을 요소로 구성된 행렬을 말한다. X1, X2, ..., Xk와 같이 k개 변수를 고려하면, k×k분산-공분산 행렬을 생성할 수 있다.

대각선 행렬 값은 각 변수의 분산이고, 대각선 이외의 행렬 값들은 변수 사이의 공분산이다.


Variance-Covariance Matrix

1. Variance

정의 : a measure of the variability or spread in a set of data.

계산법 : it is the average squared deviation from the mean score.

Var(X) = Σ ( Xi - X )^2 / N = Σ x_i^2 / N

2. Covariance

정의 : 같이 변화 하는 요소 찾기, 관련도 높은것,

- `a measure of the extent to which corresponding elements from two sets of ordered data move in the same direction. `
- `covariance is a measure of how much two random variables change to gether`

3. Variance-Covariance Matrix (=covariance matrix)

정의

  • 정방 행렬의 값을 각 변수의 분산과 공분산으로 채운 것이 바로 공분산 행렬입니
  • Variance and covariance are often displayed together in a variance-covariance matrix

The variances appear along the diagonal and covariances appear in the off-diagonal elements, as shown below.

  • 대각선 행렬 값은 각 변수의 분산이고,
  • 대각선 이외의 행렬 값들은 변수 사이의 공분산이다.

correlation matrix

correlation coefficient도 여러개가 되며 이것을 행렬로 정리한 것이 correlation matrix

results matching ""

    No results matching ""