ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 파이썬 통계분석_Chpater06. 대표적인 이산형 확률분포
    카테고리 없음 2024. 1. 11. 16:36

    5장에서 이산형 확률분포의 정의와 기댓값이라는 기본적인 지표에 대해 알아보았다.

    이 장에서는 자주 사용하는 이산형 확률 분포에 대해 알아볼 것이다.

    4장에서 살펴보았듯, 추측 통계는 한정된 표본으로부터 모집단의 평균이나 분산이라는 지표를 추정하는 것이 목표이다.

    그러나 모집단의 확률 분포가 지닌 형태에 대해 아무런 가정도 하지 않고 그러한 지표를 추정하는 것은 간단하지 않다.

    이처럼 모집단의 확률 분포에 어떠한 가정도 하지 않는 것을 비모수적 기법이라고 한다.

    비모수적 기법과 대조되는 것이 모수적 기법이다.

    모수적 기법은 '모집단이 이와 같은 성질일 것이므로 이러한 형태를 지닌 확률 분포일 것이다'라고 어느 정도 가정을 하고, 그 뒤에 확률 분포의 기댓값이나 분산을 결정하는 소수의 파라미터를 추측하는 방법이다.

    어느 정도의 형태만 결정짓는 것이므로 모형으로서의 표현력은 부족하지만, 추정이 간단하고 분석이 쉬운 모형을 만들 수 있다.

    모집단의 확률분포에 어떤 가정을 하든, 확률 분포를 모르면 이야기 할 수 없다.

    그러므로 다양한 확률 분포에 대해 소개하고, 각각의 확률 분포를 어떠한 상황에서 사용하는지 설명한다.

     

    SciPy의 stats 모듈은 통계 계산을 위한 다양한 도구를 갖춘 라이브러리이다.

    이 도구들을 사용해 수식을 거의 의식하지 않고 구현할 수 있다.

     

    - E(X)와 V(X)는 기댓값과 분산에 대한 함수

    - check_prob는 확률 변수를 인수로 가지며, 그 확률변수가 확률의 성질을 만족하는 지 확인하고, 기댓값과 분산을 계산하여 반환하는 함수

    - plot_prob는 확률 변수를 인수로 가지고, 그 확률 변수의 확률 함수와 기댓값을 그리기 위한 함수

     

     

    01.베르누이 분포(Bernoulli distribution) :  가장 기본적인 이산형 확률 분포로, 확률 변수가 취할 수 있는 값이 0과 1밖에 없는 분포

    베르누이 분포를 따르는 확률 변수의 시행을 베르누이 시행이라한다.

    베르누이 시행을 하여 1이 나오면 성공, 0이 나오면 실패라 한다.

    확률 변수가 취할 수 있는 값이 두 가지밖에 없고 확률의 합이 1이라는 성질 때문에, 어느 한쪽의 확률이 정해지면 다른 한 쪽도 자동적으로 정해진다.

    이 때문에 베르누이 분포에서는 1이 나오는 확률을 p, 0이 나오는 확률을 1-p로 한다.

    이 p가 베르누이 분포의 형태를 조정할 수 있는 유일한 파라미터로, 확률의 성질을 만족하려면 0 <= p <= 1이라는 조건을 만족해야 한다.

    확률 변수가 취할 수 있는 값이 두 가지밖에 없는 것은 모두 베르누이 분포로 보면 된다.

    ex) 동전을 던져 앞면이 나올 확률, 주사위를 한번 굴려 6이 나오지 않을 확률

    - 파라미터 p(기댓값 E(X))를 인수로 취하고 x_set과 f를 반환하는 함수로 베르누이 분포의 확률함수

    - Bern(0.3)을 따르는 확률 변수 X

     

Designed by Tistory.