본문 바로가기

이항분포5

37. 모비율에 대한 통계적 추론 & 정규근사 (1) 모비율에 대한 통계적 추론 모비율에 대한 통계적 추론은 범주형 데이터에서 사용되며, 모집단의 비율에 대한 추론을 수행하는 것을 말한다. 주로 두 개의 범주를 가진 데이터에서 각 범주의 비율을 추론하고, 두 그룹 간의 비율 차이를 검정하는 데 사용된다. 모비율에 대한 추론에서는 주로 이항분포와 정규근사를 활용한다. 이항분포는 범주형 데이터의 분포를 표현하는 확률분포로 사용된다, 표본의 크기가 크거나 비율이 근사적으로 정규분포를 따를 때 정규근사를 적용하여 추론을 수행할 수 있다. ▶ 점추정량 베르누이 확률표본 성공횟수 표본비율 기대값과 분산 표본크기가 크면, 중심극한정리에 의해 정규분포에 근사한다. 정규근사는 표본크기(n)과 모비율(θ)에 영향을 받는다. 표본크기가 클수록 모비율이 0.5에 가까울 .. 2023. 5. 19.
30. 이항분포의 정규근사 모집단의 모수를 알 수 없기 때문에 이론적으로 표본에서 추출한 모든 표본에 대해 통계량을 계산할 수는 없다. 따라서, 표본에서 얻은 통계량이나 검정통계량 등이 어느 정도의 변동성을 가지는지에 대한 정보를 이용하여 추론을 하게 된다. 이 때, 표본에서 얻은 통계량의 분포를 표집분포(sampling distribution)라고 부르며, 표집분포를 이용하여 통계적 추론을 수행한다. (1) 이항분포의 정규근사 이항분포는 대표적인 이산형 확률분포이지만, 표본 크기가 충분히 크고 확률 파라미터 값이 적당한 경우에는 정규분포로 근사할 수 있다. 이러한 근사를 사용하면, 이항분포를 다루기 어려운 경우에도 정규분포의 성질을 활용하여 다양한 추론을 수행할 수 있다. 특히, 정규분포의 선형성과 대칭성, 표준화 등의 성질을 .. 2023. 5. 12.
26. 이산확률분포 - 다항분포 (Multinomial Distribution) 확률분포의 분류 ▷ 이산확률분포 : 베르누이 분포, 이항분포, 초기하분포, 포아송분포, 기하분포, 음이항분포, 다항분포 등 ▷ 연속확률분포 : 정규분포, t 분포, 카이제곱분포, F 분포 등 (1) 다항분포 (Multinomial Distribution) 다항 분포는 여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각각의 값이 특정 횟수가 나타날 확률을 정의한다. 다항 분포에서 차원이 2인 경우 이항 분포가 된다. ​ 각 시행에서 발생가능한 결과는 k 가지 각 시행에서 i번째 결과의 확률은 Pi로 고정 각 시행은 독립적을 수행 ​▶ 이항분포를 그림으로 표현하면, ​▶ 다항분포를 그림으로 표현하면, ▶ n번 시행했을 때, 각 결과의 횟수를 도수분포표로 나타내면,.. 2023. 5. 8.
23. 이산확률분포 - 초기하분포(Hypergeometric Distribution) 확률분포의 분류 ▷ 이산확률분포 : 베르누이 분포, 이항분포, 초기하분포, 포아송분포, 기하분포, 음이항분포, 다항분포 등 ▷ 연속확률분포 : 정규분포, t 분포, 카이제곱분포, F 분포 등 (1) 초기하분포(Hypergeometric Distribution) 초기하분포(超幾何分布, hypergeometric distribution)는 이항분포와 비슷한 분포이지만, 복원추출이 아닌 비복원추출에서의 확률분포이다. 즉, 모집단에서의 성공과 실패의 비율이 변하지 않는 상황에서, 추출한 표본에서의 성공과 실패의 분포를 나타내는 분포이다. 초기하분포는 비복원추출에서 N개 중에 n번 추출했을 때 원하는 것 k개가 뽑힐 확률의 분포이다. 크기가 N인 모집단이 크기가 M과 N-M인 두 개의 부모집단 (A,B)로 나누어.. 2023. 5. 3.
22. 이산확률분포 - 베르누이 분포 & 이항분포 (1) 확률분포의 분류 확률분포는 이산확률분포(discrete probability distribution)와 연속확률분포(continuous probability distribution)로 분류된다. 이산확률분포는 이산적인 값들을 가지는 확률변수의 분포를 의미한다. 이산확률분포는 확률변수가 취할 수 있는 값이 떨어져 있는 경우에 사용된다. 예를 들어, 동전 던지기, 주사위 던지기 등과 같이 확률변수가 취할 수 있는 값이 유한하거나 셀 수 있는 경우에 이산확률분포를 사용한다. 대표적인 이산확률분포로는 베르누이 분포, 이항 분포, 포아송 분포 등이 있다. 연속확률분포는 연속적인 값을 가지는 확률변수의 분포를 의미한다. 연속확률분포는 확률변수가 취할 수 있는 값이 연속적인 경우에 사용된다. 예를 들어, 시간.. 2023. 5. 2.