AI 머신러닝 딥러닝/파이썬 머신러닝 입문 공부일지

파이썬 머신러닝 입문 공부일지. 회귀 분석의 회귀란 무슨 뜻일까?

Tomitom 2023. 1. 2. 15:55
반응형

 

머신러닝을 공부하면서 '회귀분석' 이라는 말을 계속해서 보게 됩니다. 

 

회귀분석이란 둘 이상의 변수 간의 관계를 보여주는 통계적인 방법입니다. 

일반적으로 그래프로 표현되는데, 종속 변수와 독립 변수 간의 관계를 테스트 합니다. 

 

비전공자였던 저로써는 남들 다 통계학의 꽃이라고 하는 회귀분석이 대체 무엇인지, 왜 '회귀' 라고 하는지 의아했었어요.

제가 아는 회귀라고 함은 돌아온다는 뜻이에요. (ex. 회귀하다, 로맨스 장르 회귀물 등등...) 

그렇다면 회귀 분석이라고 한다면 어떤 것으로 되돌아간다는 뜻인데, 두 변수 간의 관계를 구하는 회귀 분석이 왜 그런 뜻을 가졌는지 도통 모르겠었어요.

 

그런데 이것은 통계학의 역사에 등장한 인물이 붙인 이름이라 그렇게 표시되었다고 합니다. 

 

'회귀' 라는 단어를 처음 붙여서 쓴 사람은 영국의 프랜시스 골턴(Francis Galton) 입니다. 골턴은 아버지와 아들의 키 사이의 관계에 대해서 조사를 했고, 조사 결과 아버지의 키와 아들의 키 사이의 관계식 기울기가 1보다 작다는 것을 알아냈습니다. 

 

골턴이 구한 기울기는 2/3 이었고, 결국 신장은 세대를 거듭할수록 평균에 가까워져 가는 경향을 보이게 된다는 사실을 밝힙니다. 즉, 평균으로 돌아간다는 것은 아버지의 키가 크다면 자식은 아버지보다 키가 작고, 자식의 키가 크다면 아버지의 키는 작아서 서로 평균을 맞춰간다는 것이에요. 언뜻 생각해보면 의아할 수 있지만, 세상에 키가 극단적으로 크거나 극단적으로 작은 사람이 드문 것은 모두가 평균으로 돌아가기 때문이라는 결론을 낸 것입니다.

 

골턴은 이 분석에 '평균으로 돌아간다' 라는 의미의 '회귀' 라는 용어를 붙입니다. 그리고 이로 인해 이후에 변수 간의 함수 관계를 표현하는 식을 회귀식, 그러한 관계를 표현하고 분석하는 학문을 '회귀분석' 이라고 이르게 되었습니다. 

 

결론적으로 우리가 익히 알고 있는 '회귀'라는 단어의 의미는 회귀분석에서는 정확하게 쓰이는 용어가 아니며, 

통계학의 역사에서 비롯된 단어로 우리가 생각하는 의미와 연관을 지으면 괴리감이 생길 것입니다.  ^-^

회귀에 대해서 의아했었는데, 이제야 속이 좀 시원합니다.

 

참고 : https://brunch.co.kr/@plusstar/139 

 

나 돌아갈래-프랜시스 골턴과 회귀

베르나르 베르베르의 잡학 서적 『상상력 사전(열린책들, 2011)』은 인류의 자존심이 상하는 세 가지 사건을 언급한다. 첫 번째 사건은 니콜라우스 코페르니쿠스 (Nicolaus Copernicus, 1473~1543)가 주장

brunch.co.kr

 

반응형