8. 수치자료의 산포 - 분산, 표준편차, 분위수
일변량 자료 요약 (1) 수치형 - 평균,중앙값,최빈값, 분산, 표준편차, 범위, 분위수 등 (2) 범주형 - 도수분포표 (빈도수, 백분율) 다변량 자료 요약 (1) 수치형 - 공분산, 상관관계 (2) 범주형 - 분할표 (빈도수, 백분율) (1) 산포 (dispersion, 퍼짐) 산포란 자료들이 얼마나 퍼져 있는지를 나타내는 측도이다. 중심위치와 더불어 일변량 수치형 자료 요약의 한 축이다. 데이터의 중앙을 나타내는 대표값과 더불어 데이터가 얼마나 퍼져 있는지 여부를 제시하는 대표값은 자료의 요약에 필수적인 요소이다. 대표적인 퍼짐을 나타내는 통계량은 다음과 같다. 범위 : 최대값 – 최소값 IQR : 𝑄3 - 𝑄1, 여기서 𝑄1과 𝑄3는 1사분위수(하위 50%데이터의 중앙값) 과 3사분위수(상위 50..
2023. 4. 18.
7. 수치 자료의 중심 - 평균, 중앙값, 최빈값
일변량 자료 요약 (1) 수치형 - 평균,중앙값,최빈값, 분산, 표준편차, 범위, 분위수 등 (2) 범주형 - 도수분포표 (빈도수, 백분율) 다변량 자료 요약 (1) 수치형 - 공분산, 상관관계 (2) 범주형 - 분할표 (빈도수, 백분율) (1) 일변량 자료에 대한 수치적 기술통계 위 자료는 신체검사 결과를 나타내고 있는 자료이다. 위 자료에서 일변량 자료란 성, 연령, 신장, 체중 등 각 변수 한 항목을 말한다. 예를 들어 신장에 대한 평균을 구할 수 있지만, 신장과 체중을 합친 두 변수의 평균을 구하는 것은 오히려 혼선을 준다. 다변량 자료에 대한 요약은 공분산과 상관계수 등을 구할 수 있다. 위 자료에서 성, 비만도, 혈액형은 범주자료이고 자료요약은 도수분포표로 할 수 있다. 따라서 일변량 자료에 ..
2023. 4. 17.
4. 자료의 분류와 특성
(1) 자료의 정의 자료 ( Data )는 문자, 숫자, 소리, 그림, 영상, 단어 등의 형태로된 의미 단위이다. 보통 연구나 조사 등의 바탕이 되는 재료를 말하며, 자료를 의미있게 정리하면 정보가 된다. 자료(data)와 정보(information)는 서로 교환되어 사용하는 경우가 많다. 하지만 자료와 정보의 의미는 다르다. 자료는 숫자, 문자, 기호 등으로 이루어진 형태를 가질 수 있으며, 연속적인 값인 경우 연속 자료(continuous data), 이산적인 값인 경우 이산 자료(discrete data)로 구분된다. 이러한 자료를 수집하고 분석함으로써 문제를 해결하고 결론을 도출하는데 사용된다. 모집단은 큰 데이터 집합이라고도 말할 수 있다. 따라서 표본은 모집단으로부터 얻은 데이터의 부분집합을 ..
2023. 4. 14.