2020.02.11(화) 가설검정 : 이론편

2.1 통계적 가설검정

 2.1.1 통계적 가설검정이란

표본에서 얻은 사실을 근거로 하여모집단에 대한 가설이 맞는지 틀린지 통계적으로 
검정하는 분석방법


[그림2-1] 모집단과 표본

Image result for 표본과 모집단


[그림2-2] 모집단과 표본 : 통계량 비교 

Image result for 표본과 모집단 통계량

 

표본에서 얻은 사실을 근거로 하여모집단에 대한 가설이 맞는지 틀린지 통계적으로 
검정하는 분석방법


[그림2-3] 가설 검정 예시 : "신약 완치율"



"표본 10개에서 7개가 성공하면 모집단의 성공확률이 0.5보다 크다고 말할 수 있는가?


* 의료, 동전던지기 사례는 한림대학교 경영학과 이종석 교수님 강의 자료에서 발췌 (2011)

2.1.2 통계적 가설검정의 절차

  • step#1 가설설정
  • step#2 유의수준 설정
  • step#3 검정통계량 결정
  • step#4 유의수준과 검정통계량 비교                                   (유의수준과 유의력을 비교)
  • step#5 결론 


2.2 가설(Hyphothesis)


2.2.1 귀무가설(Null Hypothesis) H0

검정대상이 되는 가설 기각하길 바라면서 세운 가설

2.2.2 대립가설(Alternative Hypothesis) H1

귀무가설이 기각될 때 받아들이는 가설 분석자가 증명하고자 하는 가설
귀무가설은 원가설의 대우(對偶, contrapositive)로  사실상 같은 명제이다 . 고등학교 때 배운
것 처럼 → q  (p이면 q이다)의 대우는 ~q →~p (q가 아니면 p가 아니다)이다.


(참고) 왜 어떤 가설에 대해서 반대되는 가설을 세우고, 이를 검증하나? 


수학과 논리학에서는 이를 귀류법()이라고 한다. 이는 어떤 명제가 거짓이라고 가정한 후 추론했을 때 모순이 발생함을 이끌어내어 가정이 거짓임을, 즉 처음 명제가 참임을 증명하는 방법임

A,  B와 의견 대립이 있을 떄 A가 "그래! B 너말이 맞다고 치자, 어라, 너말대로 했는데 문제가 생겼네? 그러니까 너 말이 틀렸네"와 같다.

(단, A, B의 주장이 서로 양립 불가한 내용일 경우,  (예) 안상선 강사는 현재 500원이 있다. 500원이 없다.)


[그림2-4] 가설 설정 "신약 완치율"


[그림2-5] 가설의 종류(단순, 복합가설)

Image result for 귀무가설과 대립가설의 관계


[그림2-6] 가설의 종류(차이, 상관관계, 영향관계)



"귀무가설이 기각되면 자동으로 대립가설이 채택되는 구조이다."

Image result for 단호한 짤










"그런데 귀무가설이 기각되면 자동으로 대립가설이 채택 것이 항상 참(True)일까?"

Image result for 설마 짤


가설을 잘 못 세우지 않는 이상, "참" 이다!

2.3 유의수준(Significant Level)

검정 시 허용되는 오류의 정도 : 95% 신뢰구간 ⇒ 5%의 오류

2.4 검정통계량(Test statistics) 결정

유의수준을 충족시키는 임계치 결정

                                      [그림2-7] 검정 통계량의 결정

2.4.1 임계치(Critical Value)

주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정을 할 때 
그 기준이 되는 점

2.4.2 기각역(Rejection Area)

귀무가설(H0)를 기각하는 영역

2.5 유의수준과 검정통계량 비교(유의수준과 유의력을 비교)

통계량의 계산과 임계치 비교

2.5.1 유의확률(P-Value)

검정통계량 값의 꼬리 확률 단축검정양축검정
H0를 기각하지 않는 최소한의 유의수준


                                           [그림2-8] 동전 던지기 사례 











"약간은...무책임 한듯..."


무책임하다 이미지 검색결과


2.5.2 단측양측 검정

단측 검정(부등가설) 좌단측 H1, m<0 ,  우단측 H1, m>0
양측 검정 : m0


[그림2-9] 단측검정(부등가설)과 양측검정(등가설)

Image result for 단측 검정과 양측검정

2.6 오류 


2.6.1. 1종 오류(1종 과오) 

옳을 것을 틀리다고 말함 (사실을 채택하지 않음) 

2.6.2  2종 오류(2종 과오) 

틀린 것을 맞다고 말함 (사실이 아닌 것을 채택) 

2.6.3  검정역 

1-B를 크게하는 가설을 세운다 



[그림2-10] 귀무가설, 대립가설과 1, 2종 오류

      Image result for 귀무가설과 대립가설의 관계




[그림2-11] 귀무가설, 대립가설과 1, 2종 오류와의 관계 


Image result for 귀무가설과 대립가설의 관계



Related image



2.7  과제 

정규 모집단에서 크기 20의 표본을 취하여 표본평균을 구한 결과 표본평균은 720 표본분산이 36인 것으로 조사되었다.

(1) 모평균이 725라는 주장을 유의수준 5%에서 검정하시오.

(2) 모분산이 34라는 주장을 유의수준 5%에서 검정하시오






https://drive.google.com/file/d/1UWC3Iu4tjTmIy7XroCLqZlAGo9o5rKGk/view?usp=sharing

댓글