반응형
통계 기반 데이터 시각화는 복잡하고 방대한 양의 데이터를 이해하기 쉽고 직관적인 형태로 표현하는 과정입니다. 이는 단순히 데이터를 그래프나 차트로 나타내는 것을 넘어, 통계적 분석을 통해 데이터의 숨겨진 패턴, 추세, 관계 등을 명확하게 보여주는 것을 목표로 합니다.

▣ 통계(統計)의 사전적 의미
- 어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자로 나타냄. 또는 그런 것.
▣ 통계의 기능
- 많은 수량적 자료를 처리가능하고 쉽게 이해할 수 있는 형태로 축소시킵니다.
- 표본을 통해 연구대상 집단의 특성을 유추합니다.
- 의사결정의 보조수단이 됩니다.
- 관찰 가능한 자료를 통해 논리적으로 어떠한 결론을 추출 및 검증합니다.
통계와 예언은 겉보기에는 매우 다른 분야처럼 보이지만, 몇 가지 흥미로운 공통점을 가지고 있습니다.
둘 다 미래에 대한 예측과 관련되어 있으며, 정보를 분석하고 해석하여 결론을 도출하는 과정을 포함합니다.
▣ 데이터 시각화 방법
수량적 자료를 처리 가능하고 쉽게 이해할 수 있는 형태로 축소하는 방법은 다양하며, 크게 두 가지 범주로 나눌 수 있습니다.
1. 통계적 요약:
1) 대표값:
- 평균(mean): 모든 값을 더하여 개수로 나눈 값. 수식: ∑x / n
- 중앙값(median): 모든 값을 크기 순서로 정렬했을 때 가운데 위치하는 값.
- 최빈값(mode): 가장 많이 나타나는 값.
2) 산포도:
- 분산(variance): 값들이 평균에서 얼마나 떨어져 있는지 나타내는 값. 수식: ∑(x - 평균)² / (n - 1)
- 표준편차(standard deviation): 분산의 제곱근으로, 값들이 평균에서 얼마나 떨어져 있는지 나타내는 값.
- 범위(range): 가장 큰 값과 가장 작은 값의 차이.
3) 분포:
- 도수분포표(frequency distribution table): 자료를 일정한 구간으로 나누고, 각 구간에 속하는 자료의 수를 나타내는 표
- 히스토그램: 도수분포표를 시각화한 그래프.
4) 상관관계:
- 상관계수: 두 변수 사이의 선형적인 관계의 강도와 방향을 나타내는 수치.
2. 시각적 요약:
1) 그래프:
- 막대 그래프(bar graph): 범주형 자료의 빈도를 비교하는 데 사용됩니다.
- 선 그래프(line graph): 시간의 흐름에 따른 변화를 나타내는 데 사용됩니다.
- 원 그래프(pie chart): 범주형 자료의 비율을 나타내는 데 사용됩니다.
- 산점도(scatter plot): 두 변수 사이의 관계를 나타내는 데 사용됩니다.
- 히스토그램(histogram): 수치형 자료의 분포를 나타내는 데 사용됩니다.
2) 표:
- 도수분포표: 자료를 일정한 구간으로 나누고, 각 구간에 속하는 자료의 수를 나타내는 표입니다.
'Creo Reference Room > Preferences' 카테고리의 다른 글
Orange3] Model (0) | 2025.04.08 |
---|---|
Creo Schematic 이란? (0) | 2025.04.07 |
데이터 마이닝(Data Mining) (0) | 2025.04.01 |
deep learning 그리고 cad (0) | 2025.03.29 |
Creo 9.0] 제품에 재질 이름 각인 방법 (0) | 2025.03.27 |