본문 바로가기

분류 전체보기92

24. 이산확률분포 - 포아송 분포 (Poisson Distribution) 확률분포의 분류 ▷ 이산확률분포 : 베르누이 분포, 이항분포, 초기하분포, 포아송분포, 기하분포, 음이항분포, 다항분포 등 ▷ 연속확률분포 : 정규분포, t 분포, 카이제곱분포, F 분포 등 (1) 포아송 분포 (Poisson Distribution)란 ? 포아송 분포는 단위시간 동안 혹은 단위공간에서 어떤 사건이 발생하는 횟수를 나타내는 이산 확률 분포이다. 이항분포에서 n이 커지면 계산하는데 어려움이 있는데, 포아송분포를 사용하여 이항분포의 근사치를 알 수 있다. 포아송분포는 어떤 사건의 발생건수와 같은 계수자료 모델링을 할 때 많이 사용된다. 예를 들어, 단위 시간당 발생하는 교통사고 수, 단위 면적당 나타나는 군락의 개수 등을 모델링하는 데 사용된다. (2) 이항분포와 포아송분포 ◈ 이항분포 B .. 2023. 5. 6.
23. 이산확률분포 - 초기하분포(Hypergeometric Distribution) 확률분포의 분류 ▷ 이산확률분포 : 베르누이 분포, 이항분포, 초기하분포, 포아송분포, 기하분포, 음이항분포, 다항분포 등 ▷ 연속확률분포 : 정규분포, t 분포, 카이제곱분포, F 분포 등 (1) 초기하분포(Hypergeometric Distribution) 초기하분포(超幾何分布, hypergeometric distribution)는 이항분포와 비슷한 분포이지만, 복원추출이 아닌 비복원추출에서의 확률분포이다. 즉, 모집단에서의 성공과 실패의 비율이 변하지 않는 상황에서, 추출한 표본에서의 성공과 실패의 분포를 나타내는 분포이다. 초기하분포는 비복원추출에서 N개 중에 n번 추출했을 때 원하는 것 k개가 뽑힐 확률의 분포이다. 크기가 N인 모집단이 크기가 M과 N-M인 두 개의 부모집단 (A,B)로 나누어.. 2023. 5. 3.
22. 이산확률분포 - 베르누이 분포 & 이항분포 (1) 확률분포의 분류 확률분포는 이산확률분포(discrete probability distribution)와 연속확률분포(continuous probability distribution)로 분류된다. 이산확률분포는 이산적인 값들을 가지는 확률변수의 분포를 의미한다. 이산확률분포는 확률변수가 취할 수 있는 값이 떨어져 있는 경우에 사용된다. 예를 들어, 동전 던지기, 주사위 던지기 등과 같이 확률변수가 취할 수 있는 값이 유한하거나 셀 수 있는 경우에 이산확률분포를 사용한다. 대표적인 이산확률분포로는 베르누이 분포, 이항 분포, 포아송 분포 등이 있다. 연속확률분포는 연속적인 값을 가지는 확률변수의 분포를 의미한다. 연속확률분포는 확률변수가 취할 수 있는 값이 연속적인 경우에 사용된다. 예를 들어, 시간.. 2023. 5. 2.
21. 확률변수의 공분산과 상관관계 (1) 확률변수 기대값의 정리 확률변수의 공분산을 구하기 위해서는 확률변수 기대값의 정리를 미리 파악해 둘 필요가 있다. E(X+Y) = E(X) + E(Y) X와 Y가 독립이면, E(XY) = E(X) E(Y) 2023.04.28 - [통계학 공부] - 18. 확률변수의 기대값 (Expected Value) 18. 확률변수의 기대값 (Expected Value) 확률변수의 통계량은 확률분포를 표현하기 위한 값들이며, 이 값들은 확률함수를 통해 계산할 수 있다. (1) 기대값 ( Expected Value) 확률변수에 대해 평균적으로 기대하는 값 = 모평균(population mean) pmxsg.tistory.com ▶ 확률변수 X와 Y에 대해, X+Y의 기댓값? XY의 기댓값? 두 변수를 고려한다는 .. 2023. 5. 1.
20. 결합분포와 주변분포 모든 확률변수는 확률분포를 가지며, 이 분포는 확률함수를 통해 정의된다. (1) 결합분포 ( Joint Distribution ) 결합분포(joint distribution)는 두 개 이상의 확률 변수에 대한 확률 분포를 말한다. 즉, 각각의 변수가 어떤 값을 가질 때 어떤 사건이 일어날 확률을 나타내는 함수이다. 예를 들어, X와 Y가 두 개의 확률 변수이고 (X,Y)로 표현한다면, 결합분포는 P(X=x,Y=y)로 표현된다. 이러한 결합분포는 각 변수의 확률분포를 알면 쉽게 구할 수 있다. 결합분포는 두 변수 간의 상관 관계를 분석하는 데 사용된다. ▶ 이산확률변수 & 결합확률질량함수 결합확률질량함수(joint probability mass function)는 이산형 확률변수들에 대해 사용되며, 각각의.. 2023. 4. 30.
19. 확률변수의 분산과 표준편차 일변량 자료에 대한 수치적 기술통계에서 표본들이 얼마나 퍼져있는지를 나타내는 대표적인 것이 표본분산과 표본 표준편차이다. 마찬가지로 확률변수에서도 분산과 표준편차를 확인해 볼 수 있다. 2023.04.18 - [통계학 공부] - 8. 수치자료의 산포 - 분산, 표준편차, 분위수 8. 수치자료의 산포 - 분산, 표준편차, 분위수 일변량 자료 요약 (1) 수치형 - 평균,중앙값,최빈값, 분산, 표준편차, 범위, 분위수 등 (2) 범주형 - 도수분포표 (빈도수, 백분율) 다변량 자료 요약 (1) 수치형 - 공분산, 상관관계 (2) 범주형 - 분할표 pmxsg.tistory.com (1) 수치자료의 표본분산 분산은 관측값에서 중심위치(평균)를 뺀 값을 제곱하고 그것을 모두 더한 값이다. 표본공간은 확률실험에서 .. 2023. 4. 29.