Regression 회귀분석 파이썬 부동산 빅데이터 분석 적용 사례

요즘 필자는 파이썬을 활용해서 부동산 빅데이터를 공부하고 있습니다. 데이터 간 상관성을 찾아보니 Regression 회귀 분석 개념을 많이 사용하게 되었습니다. 이번 포스팅은 회귀분석 개념을 알아보고 부동산 데이터에 적용한 사례를 직접 만들어 소개합니다. 회귀분석: Regression 회귀분석의 사전적 의미는 매개변수 모델을 이용하여 통계적으로 변수 간의 관계를 추정하는 방법입니다. 간단히 말해서 변수의 상관성을 표시할 수 있는 개념입니다. 선형, 로지스틱, 리지, 라쏘, 다항식 회귀 등의 모델이 있지만 일반적으로 많이 사용되는 것은 선형 모델입니다. 직관적으로 표현할 수 있습니다.

Regression이 중요한 이유는 여러 분야에서 변수의 상관성을 바탕으로 향후 방향을 예측할 수 있기 때문입니다. 날씨, 매출 증대, 부동산, 주식 등 다양한 분야에서 사용됩니다. 필자는 부동산 빅데이터 분석에 활용하고 있습니다. 파이썬을 활용하면 꽤 쉽게 구현할 수 있습니다.

부동산 빅데이터 사례 공급, 미분양, 매매, 전세지수 등 다양한 항목이 있는데 필자가 회귀분석에 사용한 것은 서울 25구 특목고 진학률과 학원 수 사이의 관계입니다. 서울에서 학군이 좋은 구는 감남구, 송파구, 서초구, 양천이 대표적입니다. 정말 그런지 특목고 진학률과 학원 수의 상관관계를 통해서 찾아봤습니다.

다음은 결과입니다. X축은 [특목고 진학률]로, 각 구마다 전체 학생수 대비 특목고 진학률을 퍼센트로 나타냈습니다. Y축은 학원 수로 각 구에 있는 ‘입시정보 및 보충학습’에 해당하는 전체 학원 수를 더한 값입니다. 특목고 진학률과 학원 수는 정말 관계가 있는 걸까요? 이하의 화상을 보면, 오른쪽 상승인 것을 대략적으로 추측할 수 있습니다. 참고로 구의 색깔이 옅을수록 부동산 가격이 비쌉니다.그러나 특목고 진학률과 학원 수가 완전히 비례한 것은 아니었습니다. 예를 들어 종로구의 경우 특목고 진학률은 높았지만 학원 수는 다른 구에 비해 그리 많지 않다는 것을 알 수 있습니다. 이에 비해 강남구는 특목고 진학률도 높고 학원 수도 많았습니다. 완전히 비례하는 것은 아니지만 어느 정도의 경향은 있다고 할 수 있습니다.

이러한 경향을 정확하게 나타낼 수 있는 것이 회귀분석입니다. 선형 Regression을 활용하여 아래와 같이 상관관계를 나타냈습니다. 특목고 진학률이 높아질수록 학원 수도 함께 늘어나는 것을 확인할 수 있습니다. 노원구’가 어느 정도 표준에 속한다고 볼 수 있습니다.이와 달리 도봉구는 학원 수는 적지만 특목고 진학률은 높은 구에 속합니다. 이와는 반대로 양천구는 학원 수는 많지만 그만큼 특목고 진학률은 높지 않다고 할 수 있습니다. 이렇게 회귀분석을 활용하면 부동산 빅데이터 연구에 적용할 수 있습니다. 이를 통해 시각적으로 상관관계를 살펴볼 수 있습니다.

이러한 경향을 정확하게 나타낼 수 있는 것이 회귀분석입니다. 선형 Regression을 활용하여 아래와 같이 상관관계를 나타냈습니다. 특목고 진학률이 높아질수록 학원 수도 함께 늘어나는 것을 확인할 수 있습니다. 노원구’가 어느 정도 표준에 속한다고 볼 수 있습니다.이와 달리 도봉구는 학원 수는 적지만 특목고 진학률은 높은 구에 속합니다. 이와는 반대로 양천구는 학원 수는 많지만 그만큼 특목고 진학률은 높지 않다고 할 수 있습니다. 이렇게 회귀분석을 활용하면 부동산 빅데이터 연구에 적용할 수 있습니다. 이를 통해 시각적으로 상관관계를 살펴볼 수 있습니다.

이러한 경향을 정확하게 나타낼 수 있는 것이 회귀분석입니다. 선형 Regression을 활용하여 아래와 같이 상관관계를 나타냈습니다. 특목고 진학률이 높아질수록 학원 수도 함께 늘어나는 것을 확인할 수 있습니다. 노원구’가 어느 정도 표준에 속한다고 볼 수 있습니다.이와 달리 도봉구는 학원 수는 적지만 특목고 진학률은 높은 구에 속합니다. 이와는 반대로 양천구는 학원 수는 많지만 그만큼 특목고 진학률은 높지 않다고 할 수 있습니다. 이렇게 회귀분석을 활용하면 부동산 빅데이터 연구에 적용할 수 있습니다. 이를 통해 시각적으로 상관관계를 살펴볼 수 있습니다.

error: Content is protected !!