기술 통계
기술 통계는 데이터를 요약하고, 데이터릐 분포를 이해하는데 도움이 되는 도구로 데이터셋의 특징을 간단히 표현하여 한 눈에 파악하고, 복잡한 데이터를 간결하게 표현하며, 데이터의 이상치를 확인하는데 도움을 줌
기술 통계 주요 요소
1. 평균(Mean)
import numpy as np
# 데이터 예제
data = [10, 20, 30, 40, 50]
# 평균 계산
mean = np.mean(data)
print("평균:", mean)
2. 중앙값(Median)
# 중앙값 계산
median = np.median(data)
print("중앙값:", median)
3. 최빈값(Mode)
from scipy import stats
# 최빈값 계산
mode = stats.mode(data)
print("최빈값:", mode.mode[0], "빈도:", mode.count[0])
4. 범위(Range)
# 범위 계산
range_value = max(data) - min(data)
print("범위:", range_value)
5. 분산(Variance)
# 분산 계산
variance = np.var(data)
print("분산:", variance)
6. 표준편차(Standard Deviation)
# 표준편차 계산
std_deviation = np.std(data)
print("표준편차:", std_deviation)
데이터 분석 - 가설 검정 (1) | 2025.01.08 |
---|---|
데이터 분석 - 분포 분석 (0) | 2025.01.06 |