
교과서 없이 배우는 통계: 평균, 중앙값, 표준편차, 그 이상
📷 Lukas / Pexels교과서 없이 배우는 통계: 평균, 중앙값, 표준편차, 그 이상
통계학 학위가 없어도 데이터를 이해할 수 있습니다. 평균, 중앙값, 최빈값, 표준편차, IQR, 범위가 실제로 무엇을 의미하는지, 언제 어떤 것을 사용해야 하는지 알아보세요.
통계학은 이미지 문제가 있습니다. 대부분의 사람들은 교실에서 추상적이고 현실과 동떨어진 것으로 통계를 처음 접합니다. 그리고 그것은 연구자와 수학자를 위한 것이라는 확신을 가지고 자리를 떠납니다. 그 후 평생 데이터를 다루게 됩니다 — 매출 숫자, 시험 성적, 센서 데이터, A/B 테스트 결과 — 하지만 즉흥적으로 처리합니다.
사실 통계의 핵심 개념들은 단순하고 실용적이며, 누구에게나 열려 있습니다. 숫자들이 무엇을 말하는지 이해하기 위해 학위가 필요하지 않습니다. 각 측도가 실제로 무엇을 의미하는지, 언제 어떤 것을 사용해야 하는지만 알면 됩니다.
이 가이드는 가장 자주 접하게 될 기술통계 — 평균, 중앙값, 최빈값, 표준편차, 분산, IQR, 범위 — 를 수식보다는 직관과 실제 적용에 초점을 맞춰 살펴봅니다.
기술통계가 존재하는 이유
수백 또는 수천 개의 값이 있는 데이터셋을 보면서 생데이터만으로는 결론을 도출할 수 없습니다. 요약이 필요합니다 — 데이터셋을 의미 있는 것으로 압축하는 숫자들이요. 기술통계는 두 가지를 제공합니다: 값이 어디에 집중되는지(중심 경향)와 얼마나 퍼져 있는지(변동성). 이 두 차원이 함께 데이터셋을 한눈에 이해하는 데 필요한 대부분을 알려줍니다.
평균: 모두가 아는 (그리고 잘못 사용하는) 지표
평균은 모든 값을 더하고 값의 개수로 나누어 계산합니다. 가장 친숙한 통계 측도이자, 그 결과 가장 자주 오용됩니다.
평균의 문제는 이상치에 민감하다는 것입니다. 극단적인 값 하나가 데이터의 대부분이 위치한 곳에서 평균을 멀리 끌어당길 수 있습니다. 전형적인 예시는 소득 데이터입니다.
직원이 10명인 작은 회사를 상상해 보세요. 9명은 연간 4,500만 원에서 6,500만 원 사이를 법니다. 열 번째는 창업자로 연 2억 원을 받습니다. 평균 급여는 약 2,400만 원 정도 — 실제 직원 중 아무도 평균에 가까운 급여를 받지 않는 숫자입니다.
이것은 수학의 실패가 아닙니다. 평균은 해야 할 일을 정확히 하고 있습니다. 문제는 이 데이터셋에는 평균이 적합한 측도가 아니라는 것입니다. 급여 분포는 고소득자에 의해 크게 치우치며, 평균은 꼬리 방향으로 끌려갑니다.
평균을 사용할 때: 데이터가 극단적인 이상치 없이 대략 대칭적일 때. 대규모 수업의 시험 점수. 제조 배치에서 항목의 무게. 서버 응답 시간 (스파이크 이상치를 제거한 경우). 한 달간의 기온 측정값.
중앙값: 이상치를 무시하는 중간값
중앙값은 모든 값을 가장 작은 것부터 가장 큰 것 순서로 정렬하고 중간에 있는 값을 선택하여 구합니다(값의 개수가 짝수인 경우 두 중간값의 평균). 이상치의 영향을 전혀 받지 않습니다 — 극단적인 값들은 정렬된 목록의 끝에 있고 단순히 고려되지 않습니다.
급여 예시로 돌아가면, 10개의 급여를 정렬하면 중앙값은 5번째와 6번째 값 사이에 떨어지며, 둘 다 5,000만 원에서 6,000만 원 범위에 있습니다. 중앙값은 약 5,500만 원 — 그 회사의 일반 직원들이 실제로 버는 금액을 대표하는 숫자입니다.
그래서 소득에 관한 경제 보도는 거의 항상 평균 가구소득이 아닌 중앙 가구소득을 인용합니다. 평균은 상향 방향으로 왜곡되어 대부분의 가구가 경험하는 현실을 가릴 것입니다.
중앙값을 사용할 때: 데이터가 치우쳐 있거나, 제거하기 어려운 이상치가 있거나, 순위 데이터를 다룰 때. 부동산 가격 (몇몇 고급 주택이 평균을 왜곡함). 소득. 작업 완료 시간 (매우 오래 걸리는 일부 사용자가 평균을 왜곡함). 전형적인 경험이 무엇인지 알고 싶은 모든 시나리오.
최빈값: 가장 자주 나타나는 값
최빈값은 데이터셋에서 가장 자주 나타나는 값입니다. 평균과 중앙값이 의미 없는 색상, 브랜드, 설문 응답과 같은 범주형 데이터에 사용할 수 있는 유일한 중심 경향 측도입니다.
5개의 옵션 목록에서 가장 좋아하는 기능을 선택하도록 사용자에게 설문을 실시하면, "기능 C"는 평균을 가질 수 없습니다. 하지만 최빈값은 완전히 가질 수 있습니다: 가장 많이 선택된 옵션이 최빈값입니다.
최빈값은 특정 수치 맥락에서도 유용합니다. 신발 판매를 분석하고 있는데 사이즈 270이 다른 어떤 사이즈보다 훨씬 자주 나타난다면, 최빈값을 알면 재고를 올바르게 관리하는 데 도움이 됩니다.
표준편차와 분산: 퍼짐 측정
데이터의 중심을 아는 것은 절반의 이야기일 뿐입니다. 두 데이터셋은 같은 평균을 가지면서도 성격이 완전히 다를 수 있습니다. 다음 두 데이터셋을 생각해 보세요:
데이터셋 A: 48, 49, 50, 51, 52 — 평균: 50 데이터셋 B: 10, 25, 50, 75, 90 — 평균: 50
둘 다 평균이 50이지만, 데이터셋 B는 훨씬 더 변동이 큽니다. 표준편차가 이 변동성을 정량화합니다. 대략적으로 일반적인 값이 평균에서 얼마나 떨어져 있는지 알려줍니다.
데이터셋 A의 표준편차는 약 1.6입니다. 데이터셋 B의 표준편차는 약 30.4입니다. 이 차이가 생데이터에서 보이는 것을 정확히 포착합니다: 데이터셋 A는 50 주변에 빽빽하게 모여 있고, 데이터셋 B는 넓게 퍼져 있습니다.
분산은 단순히 표준편차의 제곱입니다. 통계 이론과 공식에서 참조되지만, 표준편차는 보통 데이터와 같은 단위에 있기 때문에 더 해석하기 쉽습니다. 키를 센티미터로 측정한다면, 표준편차도 센티미터입니다. 분산은 제곱 센티미터가 되어 추론하기 더 어렵습니다.
모집단 vs 표본 표준편차: n-1이 중요한 이유
이것이 기초 통계에서 혼란의 가장 일반적인 원인이며, 중요한 문제입니다.
모집단 표준편차는 데이터셋이 연구하는 그룹의 모든 구성원을 포함할 때 사용합니다. n(총 값의 수)으로 나눕니다. 시험을 치른 모든 학생의 점수가 있다면 모집단 표준편차를 사용합니다.
표본 표준편차는 데이터셋이 더 큰 모집단에서 추출된 표본이고 더 큰 모집단의 변동성을 추정하려 할 때 사용합니다. n 대신 n-1로 나눕니다.
왜 n-1일까요? 표본은 우연히 모집단의 변동성을 과소평가하는 경향이 있기 때문입니다. 표본이 작을수록 이 과소평가가 심해집니다. n-1로 나누면 이 편향을 수정합니다 — 체계적인 과소평가를 보완하는 방식으로 추정값을 약간 부풀립니다. 이 수정을 베셀 보정(Bessel's correction)이라고 합니다.
실제로: 50,000명의 고객 기반에서 200명의 고객 설문 응답을 분석한다면 표본 표준편차를 사용하세요. 회사 전체 200명의 직원 데이터가 있다면 모집단 표준편차를 사용하세요.
대부분의 통계 계산기와 스프레드시트 함수는 표본 표준편차를 기본값으로 설정합니다. 엑셀의 STDEV() 함수는 n-1을 사용하고, STDEVP()는 n을 사용합니다. 이를 잘못 사용하면 데이터가 실제보다 덜 변동적이라고 생각하게 되어 실제 의사결정에 영향을 미칩니다.
IQR과 사분위수: 이상치 왜곡 없는 강건한 퍼짐 측도
표준편차는 이상치에 민감합니다 — 극단적인 값 하나가 표준편차를 크게 부풀릴 수 있습니다. **사분위 범위(IQR)**는 극단값을 완전히 무시하는 더 강건한 대안입니다.
IQR 계산 방법:
- 데이터를 정렬합니다
- Q1(25번째 백분위수 — 하위 절반의 중앙값)을 찾습니다
- Q3(75번째 백분위수 — 상위 절반의 중앙값)을 찾습니다
- IQR = Q3 - Q1
IQR은 데이터의 중간 50%의 퍼짐을 알려줍니다. Q1과 Q3 사이의 값만 보기 때문에 양 끝의 이상치가 단순히 영향을 미치지 않습니다.
IQR은 박스 플롯에서 이상치를 정의하는 표준 방법이기도 합니다. Q1 - 1.5 * IQR보다 작거나 Q3 + 1.5 * IQR보다 큰 값이 이상치로 표시됩니다. 이것은 완벽한 규칙이 아닙니다 — 때로는 극단적인 값이 버려서는 안 되는 합법적인 데이터 포인트입니다 — 하지만 이상치 감지를 위한 원칙적이고 자동적인 출발점을 제공합니다.
범위: 단순하지만 제한적
범위는 퍼짐의 가장 단순한 측도입니다: 최댓값에서 최솟값을 뺀 값. 단 하나의 숫자로 데이터의 전체 범위를 알려줍니다.
한계는 명확합니다. 범위는 완전히 두 개의 가장 극단적인 값에 의해 결정됩니다. 데이터 입력 오류 하나 — 52를 520으로 바꾸는 오타 — 가 범위를 크게 부풀려 완전히 오해를 불러일으킬 수 있습니다. 범위는 대부분의 값이 어디에 있는지에 대한 정보를 제공하지 않습니다.
그럼에도 범위는 유용합니다. 데이터의 규모가 얼마나 되는지 빠르고 대략적으로 파악하고 싶을 때 범위가 즉시 알려줍니다.
실용적 활용 사례
A/B 테스트
A/B 테스트를 실행할 때 두 변형에 대한 지표(전환율, 사용자당 수익, 페이지 체류 시간)를 수집합니다. 유의성 검정을 실행하기 전에 각 그룹의 기술통계를 살펴보세요: 평균, 중앙값, 표준편차. 분포의 형태가 매우 다르다면 — 하나는 치우치고 다른 하나는 대칭이라면 — 어떤 통계 검정이 적절한지 달라집니다.
성적 분포
수업 평균 72%는 정보가 있어 보입니다. 표준편차가 4라면 거의 모든 학생이 68%에서 76% 사이에 점수를 받았다는 의미입니다 — 수업이 일관되게 수행되었습니다. 표준편차가 18이라면 점수가 크게 다양하다는 것을 의미합니다. 같은 평균이지만 완전히 다른 교육 상황입니다. 표준편차 없이는 이야기의 대부분을 놓치게 됩니다.
센서 및 IoT 데이터
산업 센서는 온도, 압력, 진동 등의 판독값 스트림을 생성합니다. 롤링 윈도우에서 평균과 IQR을 계산하면 정상이 어떻게 보이는지 알 수 있습니다. 판독값이 평균에서 2-3 표준편차 이상 벗어나거나 IQR 기반 이상치 경계를 벗어나면, 무언가 잘못되었을 수 있다는 신호입니다.
비즈니스 지표
월별 수익에는 평균과 표준편차가 있습니다. 이번 달 수익이 평균에서 2.5 표준편차 위에 있다면 조사할 가치가 있습니다 — 실제 개선일 수도 있고 일회성 급등일 수도 있습니다. 이력 분포와 비교하여 지표를 추적하면 생데이터만으로는 숨겨진 추세와 이상치가 보입니다.
흔한 실수들
치우친 데이터에 평균 사용하기. 가장 일반적인 오류입니다. 소득, 가격, 시간, 개수처럼 치우칠 수 있는 데이터의 전형적인 값을 보고할 때는 항상 중앙값을 확인하세요.
표본에 모집단 표준편차 사용하기. 표본을 다루고 있다면 n-1을 사용하세요. 대부분의 계산기 도구가 이것을 기본값으로 설정하지만 확인하세요.
IQR 이상치 감지를 결정적인 것으로 취급하기. 1.5 * IQR 규칙은 유용한 경험칙이지, 법칙이 아닙니다. 공식이 표시하는 극단적인 값이 완전히 합법적일 수 있습니다.
분포의 형태를 무시하기. 기술통계는 요약하지만, 요약은 정보를 잃습니다. 중요할 때는 요약 숫자뿐만 아니라 히스토그램이나 박스 플롯을 살펴보세요.
마무리
좋은 데이터 분석은 기술통계에서 시작하지, 끝나지 않습니다. 모델을 구축하거나 검정을 실행하거나 결정을 내리기 전에 잠시 데이터와 함께하세요: 평균과 중앙값을 계산하고 비교하고, 변동성을 이해하기 위해 표준편차를 살펴보고, 이상치를 찾기 위해 IQR을 사용하고, 명백한 데이터 품질 문제를 위해 범위를 확인하세요.
이 숫자들은 데이터가 깨끗한지, 치우쳐 있는지, 평균이 합리적인 요약인지, 흥미로운 특성이 어디에 있는지 알려줄 것입니다. 이것들은 그 위에 모든 것이 세워지는 기초입니다.
저희 통계 계산기는 이 모든 것을 즉시 처리합니다 — 데이터를 붙여넣으면 한 번의 클릭으로 평균, 중앙값, 최빈값, 표준편차(모집단과 표본 모두), 분산, IQR, 사분위수, 범위를 얻을 수 있습니다. 기억해야 할 스프레드시트 공식도, 수동 정렬도 필요하지 않습니다. 새로운 데이터셋을 만날 때마다 출발점으로 사용하세요.
통계는 공식을 마스터하는 것이 아닙니다. 데이터에 올바른 질문을 하는 것입니다. 이 도구들이 더 빠르게 질문할 수 있도록 도와줍니다.