2 연속확률 분포

2.1 균등분포


2.2 정규분포

  • 완벽한 좌우 대칭으로 양꼬리 부분에는 자료가 거의 존재 하지 않음
  • 정규분포는 평균($$\mu$$)과 표준편차($$\sigma$$)로 결정된다.
  • 즉, 정규 분포를 띠는 자료라면 평균, 표준편차만 같다면 동일한 정규 분포가 된다.
  • 이항분포 中 횟수n이 크고 성공확률 p가 아주 작지 않은 경우 정규 분포에 근사

z값

  • 정규분포의 x측 좌표 값 - 그래프의 면적 구할때 필요
  • z값을 구한다 = 정규분포 표준화
  • 정규분포의 확률을 구하기 위해서는 z값을 구해야 함 = 표준화 $$ z = \frac{x-\mu}{\sigma} $$

가우시안 정규 분포와 통계량 분포의 용도


2.3 표준정규분포 or Z-분포

  • 평균이 0이고, 표준편차가 1인것
  • Z검정 = 어떤 집단이 정규 분포를 따른다고 가정하고 그 평균을 비교 하는 것

2.4 t-분포(유사정규분포) or Student T분포

  • 표본수가 어설프게 클때는 t-분포를 따름 (충분히 크면 정규분포)
  • 비용/시간의 제약으로 표본을 많이 뽑지 못할경우의 대응책으로 정규분포보다 한단계 예측범위가 넓은 t분포 사용
  • 정규분포와 유사한 모양이지만, 양꼬리 부분이 더 길다.
  • 자유도에 따라 모양이 달라지며, 자유도가 증가할수록 정규분포형태가 된다.
  • 독립표본 T검정(Student T-test) = 독립인 두 군의 평균을 비교하는 방법

2.5 카이제곱($$\chi^2$$)분포

  • 데이터의 분산(치우침)을 추정하고 검정 할때 사용
  • 표준편차도 치우침을 표현하지만 (-)로 인해 분산을 더 사용
  • 분산이 퍼져 있는 모습을 분포로 만든것이 가이제곱 분포이다.
  • 오른쪽으로 길게 늘어진 모양
  • 제곱된 값 분산을 사용하여 음수(-)가 존재 하지 않고 양수(+)만 표기 하므로
  • 왼쪽이 쳐져 있는 이유는 어느정도의 치우침이 발생 하기때문 [참고]
  • 자유도에 따라 모양이 달라지며, 자유도가 증가할수록 좌우대칭(외쪽으로 이동)형태가 된다.
  • 카이제곱 검정 = 두 집단간의 비율을 비교하는 방법
  • 적합도 검정, 동질성 검정, 독립성 검정등에도 활용

2.6 F분포

  • 데이터의 분산(치우침)을 추정하고 검정 할때 사용
  • 카이제곱 분포와 다른점 = 카이제곱은 한집단의 분산 파악, F분포는 두집단의 분산 비교 시
  • cf. 세집단 이상의 분석시에는 분산분석(ANOVA)이용
  • 왼쪽으로 길게 늘어진 모양
  • ??? 분산이면 (+)의 값만 가져서 오른쪽으로 길게 늘어 선거 아닌가?
  • 비율에 의해 정의 되는 분포
  • 2개의 모집단 각각의 분산 추정치의 비(변동의 평균의 비)로 정의되는데, 그 분포는 분자와 분모 각각 자유도에 따라 형태가 결정된다.
  • ANOVA(Analysis of Variance:분산분석)에 흔히 사용

2.7 지수분포


2.8 감마 분포, 베타분포,

results matching ""

    No results matching ""