본문 바로가기

분류 전체보기92

6. 데이터 시각화의 중요성을 알려주는 사례 (1) 데이터 시각화가 중요한 이유 빅 데이터 ( Big Data ) 란 디지털 환경에서 발생하는 대량의 모든 데이터를 말한다. 요즘은 매일 2조 5천억 바이트의 빅 데이터가 생성된다고 한다. 페이스북에서는 하루 300페타바이트 이상의 정보가 저장되고 공유된다고 한다. 또한 전 세계에서 하루에 500억 건 이상의 트윗 사용하고 있다고도 한다. 이것이 어느 정도 크기인지 가늠조차 안 된다. 뉴욕타임즈가 하루에 싣는 정보의 양은 17세기 영국의 평범한 사람이 평생 소비하는 정보의 양과 비슷하다( Wurman, S.A.(1987). Information Anxiety. New York : Doubleday) 는 말이 1987년도에 나온 얘기라는데, 지금의 정보양을 과연 어느 정도일까 ? Google 검색 및 .. 2023. 4. 16.
5. 자료의 요약 정리 통계학은 관심 또는 연구의 대상인 모집단의 특성을 파악하기 위해, → 모집단으로부터 일부의 자료(표본)를 수집하고 → 수집된 표본을 정리, 요약, 분석하여 표본의 특성을 파악한 후 → 표본의 특성을 이용하여 모집단의 특성에 대해 추론하는 원리와 방법을 제공하는 학문이다. (1) 자료를 요약 정리해야 하는 이유 자료를 요약 정리하는 이유는 다양하다. 자료의 양이 많아지면 분석하기 힘들어지기 때문에 자료를 간결하게 요약 정리하여 쉽게 파악할 수 있다. 요약된 자료를 통해 추세나 분포 등의 패턴을 파악할 수 있다. 자료의 특성이나 경향성을 파악할 수 있으며, 이를 통해 문제의 원인을 분석하고 개선점을 도출할 수 있다. 요약된 자료는 의사결정에 도움을 주고, 효율적인 의사결정을 가능하게 한다. 요약된 자료는 다.. 2023. 4. 15.
4. 자료의 분류와 특성 (1) 자료의 정의 자료 ( Data )는 문자, 숫자, 소리, 그림, 영상, 단어 등의 형태로된 의미 단위이다. 보통 연구나 조사 등의 바탕이 되는 재료를 말하며, 자료를 의미있게 정리하면 정보가 된다. 자료(data)와 정보(information)는 서로 교환되어 사용하는 경우가 많다. 하지만 자료와 정보의 의미는 다르다. 자료는 숫자, 문자, 기호 등으로 이루어진 형태를 가질 수 있으며, 연속적인 값인 경우 연속 자료(continuous data), 이산적인 값인 경우 이산 자료(discrete data)로 구분된다. 이러한 자료를 수집하고 분석함으로써 문제를 해결하고 결론을 도출하는데 사용된다. 모집단은 큰 데이터 집합이라고도 말할 수 있다. 따라서 표본은 모집단으로부터 얻은 데이터의 부분집합을 .. 2023. 4. 14.
3. 표본추출 - 가중치 (Weight) (1) 가중치 (Weight)의 의미 표본추출에서 가중치는 표본의 각 관측치에 대한 중요도를 나타내는 값이다. 모집단에서 추출한 표본이 모집단을 대표하기 위해서는 표본이 모집단의 다양한 특성을 반영해야 한다. 하지만 실제로는 모든 개체를 표본으로 추출하는 것이 어려운 경우가 많다. 이럴 때 가중치를 사용하여 특정 개체나 집단의 중요도를 높여서 표본에 반영할 수 있다. 예를 들어, 인구 조사를 할 때 여성과 남성의 비율이 2:3인 인구에서 표본을 추출한다면, 표본에서 여성과 남성이 각각 동일한 비율로 추출되지 않을 수 있다. 이때, 여성과 남성에 대한 가중치를 설정하여 표본에서 여성과 남성이 적절한 비율로 추출되도록 할 수 있다. 가중치를 사용하면 표본의 편향성을 줄이고 통계 분석 결과의 정확성을 높일 수.. 2023. 4. 13.
2. 표본추출 (Sampling) (1) 표본 추출 개념 통계학은 관심 또는 연구의 대상인 모집단의 특성을 파악하기 위해, → 모집단으로부터 일부의 자료(표본)를 수집하고 → 수집된 표본을 정리, 요약, 분석하여 표본의 특성을 파악한 후 → 표본의 특성을 이용하여 모집단의 특성에 대해 추론하는 원리와 방법을 제공하는 학문이다. 표본추출은 통계학의 시작이라고 할 수 있다. 모집단으로부터 일부의 자료인 표본을 추출하여 해당 표본을 대표할 수 있도록 잘 선택하는 것이 매우 중요하다. 만약 표본추출이 잘못되어 적절하지 않은 표본이 선택된다면, 해당 표본을 기반으로 한 모집단에 대한 추론은 틀릴 수밖에 없습니다. 따라서 표본추출은 통계적 분석을 수행하는 데 있어 가장 기본이 되는 요소 중 하나이다. 표본추출 방법은 다양하며, 각각의 방법에 따라 .. 2023. 4. 12.
1. 통계학이란 ? (1) 통계학의 필요성 통계학은 다양한 분야에서 중요한 역할을 합니다. 이에 따라 통계학이 필요한 이유는 다음과 같습니다. 데이터 분석 및 결정 지원: 통계학은 데이터를 수집, 분석, 해석하고 결과를 결정에 활용하는 기술입니다. 통계적 분석을 통해 데이터로부터 의미 있는 정보를 추출하고, 이를 토대로 조직이나 정책 결정을 지원할 수 있습니다. 과학 연구: 과학 연구에서 통계학은 데이터를 분석하여 가설을 검증하고, 결과를 해석하는 데 중요한 역할을 합니다. 이를 통해 새로운 지식을 창출하고, 과학 발전에 기여할 수 있습니다. 경제학 및 비즈니스: 경제학과 비즈니스에서는 통계학적 기법을 활용하여 시장 동향, 고객 요구사항, 제품 성능 등을 분석합니다. 이를 통해 경쟁력을 유지하고 비즈니스 전략을 수립할 수 .. 2023. 4. 11.