본문 바로가기
누구보다쉬운통계

누구보다 쉬운 통계(T-test)

by CodeMuscle 2025. 4. 22.
반응형

📊 t-검정(t-test)이란?

t-검정은 두 집단의 평균이 서로 유의미하게 다른지를 판단하기 위해 사용하는 통계적 검정 방법입니다. 쉽게 말해, "두 그룹이 정말 차이가 있나?", "이 차이가 우연이 아니라 진짜일까?"를 확인하는 것이죠.


📌 t-검정은 언제 사용할까요?

  • 두 그룹의 평균을 비교하고 싶을 때
  • 샘플 수가 작고, 모집단의 분산을 모를 때
  • 데이터가 정규분포를 따른다고 가정할 수 있을 때

📚 예시로 이해하기

예시 1: 다이어트 프로그램 A를 받은 그룹과 받지 않은 그룹의 몸무게 변화가 다를까?
예시 2: 남학생과 여학생의 수학 점수가 평균적으로 차이가 있을까?
예시 3: 어떤 신약을 복용한 그룹과 위약(placebo)을 복용한 그룹의 치료 효과 차이?


🔍 t-검정의 종류

  1. 독립표본 t-검정 (Independent t-test)
    • 서로 다른 두 그룹을 비교할 때
    • 예: 남자 vs 여자, 실험군 vs 대조군
  2. 대응표본 t-검정 (Paired t-test)
    • 같은 집단에서 시간의 흐름에 따른 변화를 비교할 때
    • 예: 다이어트 전 몸무게 vs 후 몸무게
  3. 단일표본 t-검정 (One-sample t-test)
    • 한 집단의 평균이 특정 기준과 다른지를 비교
    • 예: 우리 학급의 평균 키가 전국 평균 키와 다른가?

🧪 1. 단일표본 t검정 (One-Sample t-test)

✅ 개념

단일표본 t검정하나의 집단 평균이 특정 기준값과 다른지를 검정할 때 사용합니다.

✅ 예시

  • 어떤 제품의 평균 무게가 기준인 500g과 차이가 있는지 알아보고 싶을 때
  • 한 반의 평균 점수가 전국 평균 70점과 다른지 확인하고 싶을 때

✅ 가설

  • 귀무가설(H₀): 집단 평균 = 기준값 (변화 없음)
  • 대립가설(H₁): 집단 평균 ≠ 기준값 (변화 있음)

✅ 해석

검정 결과의 p-value가 0.05보다 작으면 → 귀무가설 기각 → 차이 있다!
즉, 측정된 집단 평균이 기준값과 통계적으로 유의하게 다르다고 판단할 수 있습니다.


👥 2. 독립표본 t검정 (Independent Samples t-test)

✅ 개념

서로 다른 두 집단 간의 평균을 비교할 때 사용합니다.
예: 남학생과 여학생, 제품 A와 제품 B

이 검정은 두 집단 간의 구성원이 겹치지 않을 때, 즉 서로 완전히 독립적일 때 사용합니다.

✅ 예시

  • 남학생과 여학생의 평균 수학 점수 비교
  • 두 가지 약을 각각 다른 그룹에게 사용했을 때 효과 차이
  • 새 광고를 본 고객 vs 안 본 고객의 구매율 비교

✅ 가설

  • 귀무가설(H₀): 두 집단 평균은 같다
  • 대립가설(H₁): 두 집단 평균은 다르다

✅ 조건

  • 두 집단은 서로 독립적
  • 정규성 가정 필요
  • 등분산성 가정 → 충족되지 않으면 Welch’s t-test 사용

✅ 해석

  • p-value < 0.05: 두 집단 평균에 유의한 차이 있음
  • p-value ≥ 0.05: 두 집단 평균은 차이 없음

🔁 3. 대응표본 t검정 (Paired Samples t-test)

✅ 개념

같은 집단에서 두 번 측정한 결과를 비교할 때 사용합니다.
즉, **비교 대상이 같은 사람(또는 사물)**일 때 사용하는 방법입니다.

✅ 예시

  • 다이어트 전/후 몸무게 비교
  • 수업 전/후 테스트 점수 비교
  • 같은 사람이 두 제품을 사용했을 때 만족도 비교

✅ 가설

  • 귀무가설(H₀): 전후 차이 = 0 (변화 없음)
  • 대립가설(H₁): 전후 차이 ≠ 0 (변화 있음)

✅ 조건

  • 동일한 대상의 두 결과 간 비교
  • 차이값이 정규성을 띠어야 함

✅ 해석

  • p-value < 0.05 → 변화 있음 → 대립가설 채택
  • 전후의 변화가 통계적으로 유의미한 차이를 보였다고 판단

📊 세 가지 t-test 비교 표

구분단일표본 t검정독립표본 t검정대응표본 t검정
대상 한 집단 vs 기준값 두 개의 서로 다른 집단 한 집단의 전후 비교
예시 한 반 평균 vs 전국 평균 남녀 키 비교 다이어트 전후 몸무게
가정 정규성 정규성, 등분산성 정규성 (차이값)
특징 기준과의 비교 독립된 두 집단 동일 대상의 반복 측정

🔍 언제 어떤 t-test를 써야 할까요?

  • 기준값과 비교 → 단일표본 t검정
  • 서로 다른 그룹 간 비교 → 독립표본 t검정
  • 같은 사람(또는 집단)에서 전후 비교 → 대응표본 t검정

 

 

✅ t-검정 해석 방법

  1. 귀무가설(H₀): 두 그룹의 평균은 차이가 없다
  2. 대립가설(H₁): 두 그룹의 평균은 차이가 있다
  3. p값이 0.05보다 작으면 → 귀무가설 기각 → "차이가 있다"고 해석

📌 마무리 요약

  • t-검정은 평균 비교를 위한 유용한 도구!
  • 종류: 독립표본, 대응표본, 단일표본
  • p값이 0.05 미만이면 → 통계적으로 유의미한 차이!

 

t-test 요약 5줄 정리

  1. 단일표본 t-test: 한 집단 평균이 기준값과 다른지 비교
  2. 독립표본 t-test: 두 서로 다른 집단의 평균 비교
  3. 대응표본 t-test: 같은 집단의 전후 변화 비교
  4. p-value < 0.05면 → 유의미한 차이 → 귀무가설 기각
  5. 사용 조건(정규성, 등분산성 등)을 충족해야 정확한 해석 가능

📎 관련 용어 정리

  • p값 (유의확률): 귀무가설이 참일 확률
  • 유의수준(α): 보통 0.05 (5%) 기준
  • 표준편차: 데이터의 퍼짐 정도
반응형