본문 바로가기

통계학 공부39

14. 조건부 확률 - 베이즈 정리 (Bayes' theorem) (1) 베이즈 정리 (Bayes' theorem) 베이즈 정리는 두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리이다. 즉, 원인과 결과 형태의 문제에서 결과에 대한 원인 분석이 가능하게 하는 이론인 것이다. 베이즈 정리를 이해하기 위해서 필요한 기본 이론이 있다. (2) 확률의 기본정리 ▶ 공리적 확률( Probability Axioms) : 너무 당연해서 증명이 필요없는 확률 1933년 콜모고로프(A.N.Kolmogorov, 1903-1987) ① 표본 공간의 전체 확률은 1 이다. ② 사건 A의 확률 ( P(A) )이 0보다 크거나 같고 1보다 작거나 같다. 즉 사건 A는 표본공간의 부분집합이다. ③ 서로 배반인 사건들의 합집합의 확률은 각각의 확률의 합과 같다. ▶ 확률의 기본 .. 2023. 4. 24.
13. 확률 - 경우의 수 ▶ 확률실험(random experiment) : 불확실성을 내포하고 있는 상황에서 어떤 사건이 발생할 확률을 알아내기 위한 실험 ▶ 표본공간(sample space, Ω) : 확률실험에서 발생 가능한 모든 결과들의 집합 ▶ 사건(event) : 표본공간 내에서의 관심 부분집합 (1) 경우의 수(the number of cases) 확률을 계산하기 위해서는 표본공간과 사건에 있는 원소의 개수를 효율적으로 계산하는 것이 중요하다. 즉, 표본공간의 크기와 사건의 크기를 알아내는 것이 필요하다. 경우의 수를 구하는 기본 법칙은 곱의 법칙 (multiplication rule) 이다. 곱셈법칙은 한 실험에서 두 개 이상의 과정이 있을 때, 각 과정마다 선택 가능한 경우의 수를 곱하여 전체 경우의 수를 구하는 방.. 2023. 4. 23.
12. 확률과 통계 (1) 확률과 통계 확률은 불확실성을 다루기 위한 수학적 도구이고, 통계는 데이터를 수집, 요약, 분석하여 패턴을 파악하는 학문이라 할 수 있다. 이러한 이유로 확률과 통계는 밀접한 관계를 가지고 있다. 먼저, 확률은 통계의 기초라 할 수 있다. 데이터를 분석하고 추론하기 위해서는 데이터가 어떤 분포를 따르는지, 그 분포의 모수는 무엇인지 등을 알아야 한다. 이때 확률 분포를 사용하여 데이터를 모델링하고, 모수를 추정하게 된다. 반대로, 통계는 확률을 응용하는 분야라 할 수 있다. 확률 분포를 사용하여 데이터를 모델링하고 모수를 추정한 후, 이를 토대로 가설 검정, 신뢰 구간 추정 등을 수행한다. 이러한 통계적 방법을 통해 데이터의 패턴과 관련된 문제를 해결할 수 있다. 따라서 확률과 통계는 각각 독립적.. 2023. 4. 22.
11. 다변량 자료의 기술 통계 - 공분산, 상관관계 & 산점도 일변량 자료 요약 (1) 수치형 - 평균,중앙값,최빈값, 분산, 표준편차, 범위, 분위수 등 (2) 범주형 - 도수분포표 (빈도수, 백분율) 다변량 자료 요약 (1) 수치형 - 공분산, 상관관계 (2) 범주형 - 분할표 (빈도수, 백분율) ※ 다변량 변수(자료) 형태 ◈ 분석목적 비교 : X에 따라 Y에 차이가 있는가? 관계 : X와 Y가 관련이 있는가? X가 Y에 영향을 주는가? 분류 : X에 따라 Y를 분류할 수 있는가? X, Y 가 비슷한 것끼리 묶을 수 있는가? (1) 산점도(scatter plot) 다변량 자료의 분석목적이 "관계"에 대한 분석도구로 가장 많이 사용되는 것은 산점도와 상관계수이다. 두 변수의 값을 각각 x축과 y축을 이용하여 표시나 그림을 산점도( scatter plot)이라고 .. 2023. 4. 21.
10. 범주형 자료 요약 정리 - 도수분포표 & 분할표 일변량 자료 요약 (1) 수치형 - 평균,중앙값,최빈값, 분산, 표준편차, 범위, 분위수 등 (2) 범주형 - 도수분포표 (빈도수, 백분율) 다변량 자료 요약 (1) 수치형 - 공분산, 상관관계 (2) 범주형 - 분할표 (빈도수, 백분율) (1) 범주형 자료란 범주형 자료는 각각의 데이터가 명목상의 범주(category) 또는 서열상의 범주(ordinal) 중 하나에 속하는 자료를 말한다. 명목형 자료는 분류를 목적으로 하며, 서열형 자료는 순서를 가지고 있는 범주형 자료이다. 예를 들어, 성별, 혈액형, 종교, 결혼 여부 등은 명목형 자료이고, 학년, 선호도 등은 서열형 자료입니다. 범주형 자료를 정리할 때 변수가 하나일 때는 도수분포표를 이용하고 변수가 2개 이상일 때 분할표를 사용한다. (2) 도수.. 2023. 4. 20.
9. 수치자료의 형태 - 정규분포, 왜도, 첨도 일변량 자료 요약 (1) 수치형 - 평균,중앙값,최빈값, 분산, 표준편차, 범위, 분위수 등 (2) 범주형 - 도수분포표 (빈도수, 백분율) 다변량 자료 요약 (1) 수치형 - 공분산, 상관관계 (2) 범주형 - 분할표 (빈도수, 백분율) (1) 분포의 형태 분포란 자료가 어떤 값들을 가지고 나타나는지를 보여주는 방법이다. 자료 분포의 형태를 보면 보다 많은 정보를 얻을 수 있다. 분포 형태를 알아보는 것이 중요하다. 많은 통계분석 방법은 모집단이 중심위치를 기준으로 대칭(symmetric)이라고 가정한다. 분석방법의 적절성은 가정한 조건을 자료가 얼마나 만족하고 있는지에 따라 영향을 받는다. 자료의 분포 형태에 대한 측도를 통하여 자료가 모집단의 가정을 만족하는지에 확인한다. (2) 분포의 형태 예시 .. 2023. 4. 19.