평균 차이 검정
- 집단간 평균차이 검정
- eg : 평균검정(t-test), ANOVA, ANCOVA, MANOVA
1. t-Test
1.1. One sample T test
- 하나의 집단의 평균이 얼마인지를 검정(eg. 베스킨 라빈스 A파인트컵 30개)
1.2. Independent Sample T test
- 두 집단간의 차이가 있는지 비교
1.3. Paired Sample T test
- 하나의 집단이지만 사건 전/후로 나누어서 비교 (eg. 다이어트 효과)
2. ANOVA
2.1. One way ANOVA
- 한 개의 집단 구분변수
- Independent Sample T test의 확장(2 -> 3개)
2.2. Two way ANOVA
- 두 개의 집단 구분 변수를 동시에 비교
- One Sample T Test 두번하는것과 다른점은 2-way Anova는 상호 작용을 고려 할수 있음
2.3. Repeated Measures ANOVA
- 집단이 세 개이면서 반복 측정
- Paired Sample T test의 확장
2.4. Two way repeated Measured ANOVA
- 시간을 전/후로 나누어서 측정
그룹과 변수는 다름, Way는 변수의 갯수를 의미 함, 그룹은 많아도 됨
- 변수 = 온도, 그룹은 1000도, 2000도, 3000도
- Three way, Four way 도 있음
관계 검정
- 변수화 변수의 관계를 검정
- eg: 상관분석, 회귀분석, 교차분석, 정분상관분석, 로지스틱회귀
1. 상관분석(Correlation Test)
- 연속 변수 + 연속 변수
상관 관계
: 두 변수가 서로 동등한 입장에서 관계를 분석 (원인-결과 관계 아님)- 1:1로 관계를 봄, 여러개일 경우 하나씩(토너먼트형식) 비교
- 여러개일 경우 한번에 모두 비교하면 회귀분석(단, 원인/결과관계시)
- eg: 키가 크면 몸무게가 많이 나간다.
평상관분석(Parial Correlation) : 중간에 다른 변수의 영향력이 있을 때 이를 통제
2. 회귀분석(Regression)
- 연속 변수 + 연속 변수
인과관계
: 하나의 변수가 원인 되어 다른 변수에 영향을 미치는 관계 (원인-결과 관계)
2.1. Multiple Linear Regression
2.2. Logistic Regression
2.3. Hierarchical Regression
- 조절 효과
- 간접적 영향을 미치는 경우
2.4. Structural Equation model
3.교차분석(test)
- 질적분석 + 질적 변수
- 카이스퀘어 분석
3. 신뢰도와 타당도
- 신뢰도 분석, 요인분석
4. 기타
- 군집분석, 다차원척도법, 생존분석, 데이터 마이닝 기법
참고 : 이상철의 Youtube 강의
데이터 속성에 따른 분석 기법 선택
- 검정 통계량(test Statistics)을 이용해 가설의 검증 시행
- 대표적인 검정 통계량 : 스튜던트 t, 피셔의F, 피어슨의 카이제곱
- p값은 검정 통계량의 크기에 대한 개념
연속형 | 연속형(서열형) | 명목형(이분변수) | 명목형(수준3이상) | |
---|---|---|---|---|
연속형 | Pearson's R | Point-Biserial(양분상관계수) | ||
연속형(서열형) | Spearman’s rho/Kendall’s rau | |||
명목형(이분변수) | Cramer’s phi | |||
명목형(수준3이상) | Goodman, Kruskal’s lambda |
정규성 여부에 따른 분석 기법 선택
정규성 검증 방법 = 데이터가 10~30이면 Kolmogorov-Smirnov test & Shapiro-Wilk test
- 표본수가 30이 넘으면 정규분포를 따른다고 가정
- 표본수가 10 미만이면 정규분포를 따르지 않는다고 가정 그래프를 이용한 정규성 검증 : 분위수 -분위수 플롯(Q-Q plot)
- 정규성 = 직선의 형태
- 비정규성 = 비선형, S, 바나나 모양 왜도 / 첨도를 이용한 정규성 검증
- 왜도 : 좌우로 치우침, 0, skwe()함수 사용
- 첨도 : 윗부분이 뾰족한가, 0,
모수적 방법
- 정규성 따를 경우
- 일반적으로 데이터가 많은면(=모수)
중심극한정리
에 위해 정규분포를 따름
비모수적 방법
- 정규분포를 따르지 않거나 , 10명 미만의 소규모
- 순위척도(계열상관) - 시계열 분석
t 검정
- 두 집단 간 평균 차이가 있는 여부 검정
- 독립표집
- 종속 표집
카이제곱 검정
- 카이제곱 확률 분포를 활용하는 기법
요인분석
- 여러 변인으로 구성된 측정도구의 내용을 몇 개의 요인으로 줄이거나 여러 변인들간의 상호관계를 파악하기 위한 통계적 기법
탐색적 요인분석(EFA)
- Exploratory factor analysis
- 귀납적 접근 방법
- 아직 밝혀 지지 않은 요인을 탐색하기 위해 경험적 자료를 이용하여 요인을 찾아가는 과정
확인 요인분석(CFA)
- Confirmatory factor analysis
- 연역적 접근 방법
- 이론적으로 밝혀진 요인을 실제자료를 활용하여 확인할 수 있는지 밝히는 과정
상관분석
- 두변인 간 직선적인 관련 정보를 나타내는 상관계수(correlation coefficient)를 이용하여 분석
단순 회귀분석
- 독립변인과 종속 변인이 각각 하나씩인 경우
다중 회귀분석
- 독립변인이 2개 이상, 종속변인이 하나인 경우
변량 분석(분산분석, ANOVA, F검정)
- Analysis of variance
- 두개 이상의 집단에서 얻어진 평균치들의 차이가 전집의 본질적 차이에 의한 것인지, 표집에 따른 우연한 차이인지를 검정
일원 변량분석(One-way ANOVA)
- 연구 집단이 3개 이상일 경우, 집단 간 평균차이 여부 검정
다원 변량분석(Three-way ANOVA)
- 독립변인이 2개 이상일 경우에 각 독립변인을 이루는 집단간 차이검정(주 효과분석)
- 독립변인들 간 상호작용 효과 검정
- 이원변량 분석 : 독립변인 2개
- 삼원변량 분석 : 독립변인 3개
공변량분석(ANCOVA)
- Analysis of covariance
- 특정 독립변인을 이용하여 이질적인 집단을 통계적으로 돌질(??)화한 다음 그 독립변인을 제외한 변인의 집단간 평균 차이를 검정
- 이질 집단을 사전검사 점수를 이용하여 돌질(??)화한 다음 집단 간 평균차이 검정
다변량분석(Unvariate ANOVA)
- 종속변인 1개
- 일원 분량 분석
- 다원 변량 분석
다변량분석(MANOVA)
- Multivariate analysis of variance
- 종속변인 2개 이상 이론 : http://jindog2929.blog.me/10121270996 실습 : http://jindog2929.blog.me/10099389583 http://egloos.zum.com/zaduplum/v/1935095 http://blog.naver.com/gracestock_1/120200450793 R commander : http://blog.naver.com/medicalstat/110169894552
[별첨]
|비교군|목적|방법|함수| |-|-|-|-| |1표본|평균값||| | |표본의 평균과 모집단 평균의 유의성||| | |평균 추정치의 불확실성 수준||| |2표본 |두 분산의 비교|피셔의 F검정|var.test| | |(정규성)두 표본의 비교|스튜던트 T검정|t.test| | |(비정규성)두 표본의 비교|윌콕스 검정|wilcox.test| | |두 비율의 비교|이항검정|prop.test| | |두 변수의 상관성|피어슨 or 스피어만상관|cor.test| | |독립성 검정|카이제곱 분활표|chisq.test| | |(작은)표본의 상관성|피셔의 정확 검정|fisher.test| |3+표본||사후분석, 일원배치분산분석||