본문 바로가기

학교/R과 통계

추측통계학이란

추측통계학

 

표본으로부터 특성을 관찰하여 모집탄의 특성을 유추하는 통계학의 한 분야

 

추측통계학에는 두 가지 연구 방법이 있다.

 

  • 추정 : 모집단으로부터 추출된 표본으로부터 특성(통계량)을 파악하여 이를 바탕으로 모수를 유추하는 방법
  • 가설검정 : 모수에 대한 가설을 수립하고 이로부터 어떤 가설을 선택할 것인지 통계적으로 결정하는 방법

 

추정은 또다시 2가지 종류로 나눌 수 있다.

 

  • 점추정 : 표본의 특성을 나타내는 계산식(통계량) 중 모수를 유추하는데 있어 최적의 계산식을 통해 구한 하나의 추정값을 구하는 방법이다. 점추정은 표본으로부터 계산되는 값이기에 표본에 따라 값이 달라진다.
  • 구간추정 : 하나의 점(값) 이 아닌 모수의 참값이 포함될 것으로 기대하는 구간을 추정하는 방법

 

추정량

 

  • 알고자 하는 모수를 추측하기 위해 표본으로부터 관찰된 값으로 계산되는 표본의 통계량이다.
  • 추정치는 표본으로부터 관측된 자료를 통해 계산된 추정량의 결과값이다.
  • 모수와 추정량은 표현 기호가 다르다. (모수) 위의 기호들은 각각 평균,분산(표준편차의 제곱),비율을 나타낸다.

 

불편성

 

  • 추정량이 갖춰야 할 가장 기본적인 성질으로 한쪽으로 치우쳐지지 않았음을 의미한다.
  • 모수에 대한 추정량이 다음을 만족할때 추정량은 모수에 대한 불편추정량이라고 한다. 이것을 공식으로 나타내면 다음과 같다.

  • 표본 중위수는 모평균, 표본 비율은 모비율, 표본 분산은 모분산 각각에 대한 불편추정량이다. (다르게 말하면 비편향 추정량)
  • 표본 분산의 경우 나눌 때 n으로 나누면 편향이고 n-1로 나눈다면 비편향이다. 증명은 다음과 같다.

 

유효성

 

  • 모수에 대한 불편추정량은 한 가지 이상 존재할 수 있다.
  • 여러개의 불편추정량이 있을 때 좋은 추정량을 결정하는 성질이다.
  • 모수에 대한 두 불편추정량이 있을 때 각각의 분산 중 분산이 더 작은 쪽이 '더 유효한 추정량'이라고 한다.
  • 편향과 분산을 동시에 줄이는 것이 가장 좋지만 기술적 한계로 비편향 추정량 중에서 분산을 최소로 하는 추정량을 찾는 전략을 쓰게 된다.
  • 최소분산비편향추정량 : 이름이 길지만 의미를 다 내포하고 있다. 분산이 최소가 되는 비편향추정량을 애기하는 것이다. 같은 표본에서 도출된 비편향추정량 중 분산이 최소가 되는 추정량을 뜻한다.

 

일치성

 

  • 표본의 크기와 관련이 있는 성질이다.
  • 표본의 크기가 커질수록 추정량의 추정치와 모수의 차이가 작아지는 것을 의미한다. 표본평균의 분산은 표본크기가 늘어나면 0으로 수렴한다. (표본평균의 분산은 분모가 n(표본크기)인 분수이므로) 따라서 표본평균의 표본추출로 인한 변동이 줄어들고 모평균으로 수렴한다.
  • 모수에 대한 추정량이 임의의 양수에 대해 만족하면 그 추정량을 일치추정량이라고 한다.

  • 대수의 법칙 : 표본평균이 모평균에서 조금이라도 벗어날 확률은 표본수의 증가에 따라 점차 0으로 수렴한다.
  • 표본평균, 표본중앙값 또는 n-1로 나눈 평균 모두 일치추정량이다.
  • 표본비율은 모비율의 일치추정량이고 표본분산은 모분산의 일치추정량이다.

 

 

'학교 > R과 통계' 카테고리의 다른 글

통계에서의 비율  (0) 2021.11.25