본문 바로가기
통계학 공부

22. 이산확률분포 - 베르누이 분포 & 이항분포

by 에쓰지 2023. 5. 2.

(1) 확률분포의 분류

 

  확률분포는 이산확률분포(discrete probability distribution)와 연속확률분포(continuous probability distribution)로 분류된다.

이산확률분포는 이산적인 값들을 가지는 확률변수의 분포를 의미한다. 이산확률분포는 확률변수가 취할 수 있는 값이 떨어져 있는 경우에 사용된다. 예를 들어, 동전 던지기, 주사위 던지기 등과 같이 확률변수가 취할 수 있는 값이 유한하거나 셀 수 있는 경우에 이산확률분포를 사용한다.

대표적인 이산확률분포로는 베르누이 분포, 이항 분포, 포아송 분포 등이 있다.

연속확률분포는 연속적인 값을 가지는 확률변수의 분포를 의미한다. 연속확률분포는 확률변수가 취할 수 있는 값이 연속적인 경우에 사용된다. 예를 들어, 시간, 길이, 온도 등과 같이 연속적인 값을 가지는 경우에 연속확률분포를 사용한다.

대표적인 연속확률분포로는 정규 분포, t 분포, F 분포, 카이 제곱 분포 등이 있다.

이산확률분포와 연속확률분포는 서로 다른 특징을 가지고 있으며, 각각의 특성에 따라 다른 분포를 사용해야 한다.

 

(2) 베르누이 분포

  • 베르누이 시행 : 두 가지의 결과만을 가지는 실험을 말한다. 이러한 시행에서 각각의 결과를 성공(success)과 실패(failure)로 정의한다. (S/F) 예를 들어, 동전을 한 번 던져 앞면(H:Head)이 나오거나 뒷면(T:Tail)이 나오게 하는 것도 베르누이 시행이다.
  • 베르누이 확률변수: 베르누이 시행에서 성공을 1, 실패를 0으로 정의한 이항 확률변수 중 성공과 실패 중 하나의 값을 가지는 경우를 말한다. , 성공확률 p를 가지는 이항 분포에서 n=1인 경우이다. 베르누이 확률변수는 두 값 중 하나만 가질 수 있으므로 이산확률변수(discrete random variable).
  • 베르누이 확률분포: 베르누이 확률변수의 분포를 말하며 혹은 편의상 베르누이 분포라 부른다. 이항 분포에서 n=1인 경우이며, 성공확률 p와 실패확률 q=1-p로 이루어져 있다.

 

  ▶ 베르누이 시행 (Bernoulli Trial)

  • 이항분포는 베르누이 시행에서 유도된다.
  •  베르누이 시행의 특징
  1. 각 실험에서 발생 가능한 결과는 단 2가지이다. 예) (성공,실패) , (앞면,뒷면)
  2. 각 실험이 독립적으로 수행한다.
  3. 모든 실험에서 결과의 확률은 항상 동일 예) P(S) = p , P(F) = 1-p

 

◈ 예시 : 불량품 검사 I

10개의 제품 중 3개가 불량품일 때,

  2개를 복원 추출하는 경우.

  • 실험에서 발생 가능한 결과는 2가지 이다. ⇒ 정상, 불량
  • 각 실험이 독립적이다.
  • 모든 실험에서 결과의 확률은 항상 동일하다.

        ⇒ 위 조건을 모두 충족하므로 베르누이 시행이다.

  ▶ 2개를 비복원 추출하는 경우.

      ⇒ 위 조건을 모두 충족하지 못하므로 베르누이 시행이 아니다. (모든 실험에서 결과의 확률은 항상 동일하다  조건을 충족하지 못한다.)

◈ 예시 : 불량품 검사 II

     10,000개의 제품 중 3,000개가 불량품일 때,

  ▶ 2개를 복원 추출하는 경우 ⇒ 베르누이 시행

  ▶ 2개를 비복원 추출하는 경우.

 

  ⇒ 모집단이 크고 표본크기가 상대적으로 크지 않는 경우, 비복원 추출도 베르누이 실험을 근사모형으로 사용가능

 

 베르누이 확률변수 (Bernoulli random variable)

  • 확률변수란 원소를 숫자로 변환시켜 주는 것이다.
  • 모수(성공할 확률)가 p인 베르누이 시행을 하였을 때,
  • 성공이면 1로 실패하면 0으로 변환한다.
  • 일종의 지시함수 (indicator function)이다.
  • 즉 베르누이 확률변수는 0과 1이다.

 

 베르누이 확률분포 (Bernoulli distribution)

  • 확률분포는 확률변수가 특정값을 가질 확률이다.
  • 베르누이 확률변수는 0과 1이다.
  • 예 를 들면 동전던기기의 경우 𝑃(𝑋 = 0) = 𝑃(𝑋 = 1) = 0.5 확률의 법칙에 따라서 확률분포에 나온 값을 모두 합할 경 우 1이 되어야 한다. 동전던지기와 같이 2가지 가능한 결과물을 가진 확률변수의 확률분포를 베르누이 분포라고 한다
  •  베르누이 확률변수의 확률질량함수는 이산 확률 변수에서 특정 값에 대한 확률을 나타내는 함수이다. 즉, 이산 확률 변수의 확률구조를 나타낸다.

  • 베르누이 분포는 아래와 같이 표기한다.

 

베르누이 확률변수의 기대값과 분산

 

(3) 이항분포 (binomial distribution)

  • 이항분포는 연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산 확률 분포이다.
  • 이러한 시행은 베르누이 시행이라고 불리기도 한다. n=1일 때 이항 분포는 베르누이 분포이다.
  • 대표적인 이산분포인 이항분포의 기초를 이루는 것이 베르누이 시행과 베르누이 확률변수이다.
  • 즉, 이항분포는 베르누이 시행에서 유도된다.

 

 성공할 확률이 p 베르누이 실험을 n 반복했을 , 성공 횟수(X) 분포

  • X~ B(p) 라고 할 때, 성공 횟수 X는 N개의 베르누이 확률변수를 합으로 표시

이항 확률 변수

  • 성공 횟수 X는 N개의 베르누이 확률변수를 합으로 표시하는데 이 때 성공 횟수 합이 이항 확률 변수이다.

         ⇒ X n p 모수로 갖는 이항분포(bionominal distribution) 따른다는 표현이다.

 

이항 확률 변수의 기대값, 분산

  • 기대값
  • 기대값의 정리 참조 : E(X+Y) = E(X)+E(Y)

  • 분산
  • 베르누이 시행은 독립시행
  • 독립일 공분산은 0, Var(X+Y) = Var(X)+Var(Y)+2Cov(X,Y) : ( 공분산의 성질 참조 )

  • 표준편차 SD(X)

 

예시 : 주사위 던지기

  • X = 1이 나온 횟수라 할 때, 1 이면 S(성공), 아니면 F(실패)라고 하면,

 

▶ 시행횟수 n, 성공확률p 이항분포의 확률질량함수

  • x는 성공횟수

  • 위 이항분포의 확률 질량 함수는 이항공식이라 표현되기도 한다.
  • 조합 공식

n 시행했을 , x 성공할 확률은?

  • 이항공식은 다음 조건하에서 성립한다.
  1.  n의 값은 미리 정해져 있다.
  2. 매 번의 시행은 상호 독립이다.
  3.  p는 매 시행마다 동일하다.

 

(4) 베르누이 (Bernoulli) vs 이항(binomial)

확률 변수

  • 베르누이

  • 이항

확률질량함수 (확률 분포) 

  • 베르누이

  • 이항

 확률 변수의 기대값,분산,표준편차

  • 베르누이

  • 이항

댓글