(1) 통계학의 필요성
통계학은 다양한 분야에서 중요한 역할을 합니다. 이에 따라 통계학이 필요한 이유는 다음과 같습니다.
- 데이터 분석 및 결정 지원: 통계학은 데이터를 수집, 분석, 해석하고 결과를 결정에 활용하는 기술입니다. 통계적 분석을 통해 데이터로부터 의미 있는 정보를 추출하고, 이를 토대로 조직이나 정책 결정을 지원할 수 있습니다.
- 과학 연구: 과학 연구에서 통계학은 데이터를 분석하여 가설을 검증하고, 결과를 해석하는 데 중요한 역할을 합니다. 이를 통해 새로운 지식을 창출하고, 과학 발전에 기여할 수 있습니다.
- 경제학 및 비즈니스: 경제학과 비즈니스에서는 통계학적 기법을 활용하여 시장 동향, 고객 요구사항, 제품 성능 등을 분석합니다. 이를 통해 경쟁력을 유지하고 비즈니스 전략을 수립할 수 있습니다.
- 의료 연구: 의료 연구에서는 통계학적 기법을 활용하여 새로운 치료 방법이나 약물의 효과를 평가합니다. 이를 통해 환자의 치료 결과를 개선하고, 의료 기술 발전에 기여할 수 있습니다.
- 사회과학 및 인문학: 사회과학과 인문학 분야에서는 통계학적 기법을 활용하여 인간 행동이나 사회 현상을 분석합니다. 이를 통해 사회 문제를 이해하고, 해결 방안을 모색할 수 있습니다.
따라서 통계학은 다양한 분야에서 필수적인 지식으로, 데이터 분석 및 결정 지원, 과학 연구, 경제학 및 비즈니스, 의료 연구, 사회과학 및 인문학 등에서 매우 중요한 역할을 합니다.
(2) 정의
- 통계학(Statistics)은 데이터를 수집, 분석, 해석하고, 결과를 결정에 활용하는 학문 분야입니다. 통계학은 불확실성과 변동성을 다루는 과학으로서, 대량의 데이터를 적절한 방법으로 요약하고, 모델링하며, 이를 통해 추론과 예측을 수행합니다. 통계학은 연구 설계, 데이터 수집, 표본 추출, 변수 측정, 데이터 분석, 결과 해석 및 추론 등 다양한 분야에서 활용됩니다. 통계학은 이론적인 측면 뿐만 아니라, 실제적인 응용에도 널리 활용되며, 자연 과학, 사회 과학, 경제학, 의학, 공학 등 다양한 분야에서 필수적인 지식으로 여겨지고 있습니다.
- 통계학은 자료를 정리 분석해 유용한 정보를 얻기 위한 언어이자 도구라 할 수 있습니다.
→ 세상은 통계로 가득 차 있고, 각종 통계가 축적되는 속도가 엄청나게 빠르게 진행되고 있습니다. 그것이 의미하는 것은 통계를 분석할 수 있는 능력이 있으면 사회에서 환영 받는다고 할 수 있습니다.
→ 자료가 엄청나게 쌓여가고 있는데 분석이 안 된 상태로 방치되어 있거나 아니면 제대로 모르는 사람이 잘못 분석 하거나 하는 자료들이 많습니다.
즉 원석을 다듬어야 다이아몬드가 되듯이 자료도 잘 분석해야 정보가 되는 것 입니다.
- 통계학은 관심 또는 연구의 대상인 모집단의 특성을 파악하기 위해,
→ 모집단으로부터 일부의 자료(표본)를 수집하고
→ 수집된 표본을 정리, 요약, 분석하여 표본의 특성을 파악한 후
→ 표본의 특성을 이용하여 모집단의 특성에 대해 추론하는 원리와 방법을 제공하는 학문이다.
* 모집단 : 관심의 대상이 되는 집단
* 표본(Sample) : 모집단으로부터 선택된 일부의 개체
예를 들어 대통령 선거 전에 각 후보별 지지율에 대한 여론 조사를 한다고 할 때, 모집단은 선거인 명부 유권자 전체 가 될 것이고 표본은 여론조사에 참여한 유권자가 될 것이다.
모집단 전체를 조사하는 것이 가장 정확하겠지만, 모집단이 너무 클 경우 시간과 비용이 많이 들기 때문에 표본을 뽑아 조사하게 된다.
(3) 모집단과 표본의 관계
- 통계학은 표본의 자료를 수집, 정리, 요약하고 나아가 요약된 자료를 토대로 그 자료의 모태가 되는 모집단에 대해 짐작, 추측해 보는 작업을 포함합니다.
- 관심의 대상이 되는 집단이 모집단(population),
- 모집단의 특성이 모수 (parameter)
- 모집단을 여러가지 이유로 다 분석할 수 없기 때문에 자료를 뽑아서 일부의 자료를 분석하게 됩니다.
- 뽑힌 자료가 표본(sample)이고, 이 표본을 가지고 계산해내는 각종 수치들이 통계량(statistic)
→ 통계학이 Statistics인데, 그것은 각종 통계량에 대해서 공부하는 학문이기 때문에 statistics라고 합니다.
(4) 통계학의 종류
통계학은 크게 두가지로 분류할 수 있다.
1. 기술 통계학 (Descriptive Statistics)
자료를 변수 별로 따로따로 또는 관계되는 변수끼리 묶어서 요약하는 것
2. 추론통계학 (Inferential Statistics)
정리된 자료에 담긴 의미를 해석하여 미지의 세계에 대해 추론 하는 것.
☞ 기술통계학이 묘사하는 작업이라면 추론통계학은 묘사한 것을 새기는 작업이라 할 수 있습니다.
(5) 통계학의 진화
1. 전통적인 통계학
* 자료의 소개와 요약 통계량
* 확률과 확률분포, 표본분포
* 각종 검정 방법 ( t, Z, 카이, F )
* 실제 사용 사례
2. 데이터 사이언스를 위한 통계학
* 실제 문제를 통한 동기유발
* 데이터 시각화와 탐색적 자료 분석
* 데이터를 통해서 알아낼 수 있는 지식에 집중 (내재되어 있는 편향, 인과관계 등)
* 모형과 알고리즘
* 확률 이론 기반의(예측에 관한) 불확실성의 근거 제시
☞ 전통적인 통계학에서는 요약 통계량, 확률과 확률분포, 표본분포, t-검정,z-검정,카이검정 등 통계기법에 중점이었다면 데이터 사이언스를 위한 통계학은 대중에게 쉽게 전달하는 것에 중점을 두고 있으며, 요즘 가장 관심 받고 중요한 것 중에 하나가 데이터시각화라고 합니다.
(6) 통계 분석 방법 - PPDAC
PROBLEM - PLAN - DATA - ANAYLSIS - CONCLUSION
① Problem : 데이터에 대한 문제 의식을 제기하여 나의 가설을 세운다.
② Plan : 가설을 확인 할 조사 계획을 세운다.
③ Data : 조사 계획을 토대로 데이터를 수집한다.
④ Analysis : 얻은 데이터를 기반으로 통계적인 분석을 실행한다.
⑤ Conclusion : 분석 결과를 정리한다.
우리가 세운 가설이 옳은지 확인하고 결과에 따라서 새로운 문제를 찾고 가설을 설정한다.
☞ 정리하자면, "지금 먼저 문제를 정의를 한 다음에, 그 문제에 대해서 자료를 어떻게 수집하고, 어떻게 분석할지 계획을 세운다. 실제 자료 수집을 하고, 그 자료 수집 과정에 보면 사실은 소위 말하는 Raw 데이터의 경우에는 굉장히 지저분하게 되어 있기 때문에 데이터를 가지고 cleaning 하는 작업이 필요하기도 하다. 그런 단계를 거친 다음에 최종적으로 분석이 들어가고, 그 다음에 결론을 통해서 원래 물어봤던 질문에 대한 대답을 하게 된다." 과정을 거치게 됩니다.
출처 : https://new.censusatschool.org.nz/resource/data-detective-poster/
'통계학 공부' 카테고리의 다른 글
5. 자료의 요약 정리 (0) | 2023.04.15 |
---|---|
4. 자료의 분류와 특성 (0) | 2023.04.14 |
3. 표본추출 - 가중치 (Weight) (0) | 2023.04.13 |
2. 표본추출 (Sampling) (0) | 2023.04.12 |
0. 통계학 공부를 시작하며 (0) | 2023.04.11 |
댓글