본문 바로가기
연구방법_분석방법

회귀분석의 탄생 이야기: 통계의 역사로 보는 Regression Analysis

by PhDHelper 2025. 12. 15.
반응형

회귀분석의 아버지는
바로,
프랜시스 골턴(Francis Galton)이에요.

그는 찰스 다윈의 사촌이자,
유전학과 통계학의 선구자였죠.

골턴은 사람의 키가 유전되는 방식에 관심이 많았는데요,
부모가 키가 크면 자식도 클까?

그걸 데이터로 검증하려고 한 거예요.
그가 놀랍게도 발견한 건...

“부모의 키가 극단적으로 크거나 작아도,
자식은 평균 키 쪽으로 되돌아간다.”

이 현상을 설명하면서 골턴이 처음 사용한 용어가 바로 ‘Regression’이었답니다.
이건 ‘되돌아감’ 또는 ‘회귀’란 뜻으로,
자식 세대가 평균으로 회귀한다는 의미였어요(Galton, 1886).

그때 골턴은 키의 관계를 선으로 표현하면서,
우리가 알고 있는 '회귀선(Regression Line)'이라는 개념도 함께 만들었죠.


상관관계와 피어슨의 등장

 

골턴의 연구는 통계학자 칼 피어슨(Karl Pearson)에게도 큰 영향을 줘요.
피어슨은 골턴의 아이디어를 확장해서, 변수 간의 관계를 수치화하는
‘피어슨 상관계수’를 만들죠.

이걸 통해 두 변수 간의 직선적 관계를 더 정확히
측정할 수 있게 되었어요.

피어슨 덕분에 회귀분석이 수학적으로 체계화되기
시작한 거죠(Pearson, 1896).


그 이후, 회귀는 진화한다!

처음에는 부모와 자식의 키 같은 간단한 관계를 설명하던 회귀분석은 이제 엄청나게 발전했어요.
변수를 동시에 고려하는 다중 회귀 분석(Multiple Regression), 곡선 형태를 다루는 비선형 회귀 분석까지.
오늘날에는 경제학, 심리학, 마케팅, 심지어 날씨 예측까지,
회귀 분석은 거의 모든 데이터 기반 분야에서 핵심적인 도구로 쓰이고 있어요.

회귀분석은 단순한 통계 기법이 아니라, '우리는 어떻게 패턴을 예측하고 설명할 수 있을까?’​라는
질문에서 시작된 통찰의 산물이에요.
프랜시스 골턴의 호기심이 오늘날 데이터 과학의 기반이 되었다니, 참 멋지지 않나요?

참고자료

  • Galton, F. (1886). Regression towards mediocrity in hereditary stature. Journal of the Anthropological Institute of Great Britain and Ireland, 15, 246–263.
  • Pearson, K. (1896). Mathematical contributions to the theory of evolution. III. Regression, heredity, and panmixia. Philosophical Transactions of the Royal Society of London. Series A, 187, 253–318.
  • Freedman, D. A. (2009). Statistical models: Theory and practice (2nd ed.). Cambridge University Press.
  • Stewart, M. (2018). The history of regression analysis. International Journal of Statistics and Probability, 7(3), 112–121.
반응형