빅데이터

빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교

2023. 1. 17. 17:12
728x90

1. 데이터 소개

  • homeprice.csv : 3개월간의 전국 집값, 집값의 상승률
  • movehouse.csv : 3개월간의 전국 이동량
  • koreahuman.csv : 3개월간의 인구수
  • ※ 실제 통계된 내용은 정확한 자료가 아닐 수 있으며, 정확한 통계가 아닐 수 있습니다.

2. 데이터 생성-1

  • csv 파일을 작성 및 클라우드에 올린 후, 해당 클라우드 사이트에 접근을 요청하여 다운로드
  •  

데이터를 받아옴

2.1 데이터 생성-2

  • 각각의 데이터를 pyspark를 통하여 csv 파일을 읽어 들여 출력
  •  

해당 csv 파일을 읽어들임

2.2 데이터 생성-3

  • homeprice의 데이터 값을 count한 결과 데이터가 상당히 불규칙하여, 지역별로 균등하게 나누었다.
  •  

지역별로 균등하게 나눔

2.3 데이터 생성-4

  • movehouse의 2,3,4월에 대한 전입-전출 = 변동량으로 하여, 새로운 열을 생성하고, 불필요 데이터 제거
  •  

불필요 데이터가 있는 movehouse.csv
불필요 데이터 제거 movehouse.csv

  • 마찬가지로, koreahuman의 데이터도 불필요 데이터를 제거
  •  

불필요 데이터 제거 koreahuman.csv

3.1 데이터 비교-1

  • homeprice의 2,3,4월에 대한 가격 변동 지수를 sort를 통하여 각각 정렬
  • 대구가 1,2,3월 대비 공시가 대비 가장 낮은 변동 수치를 보여주었고
  • 전라북도, 강원도가 공시가 대비 가장 높은 변동 수치를 보여주었다
  •  

2,3,4월 가격 변동지수 homeprice.csv

3.2 데이터 비교-2

  • movehouse도 마찬가지로, sort를 통하여 정렬한 결과
  • 2월에는 서울이 가장 많이 줄었고, 3,4월에는 경상남도가 가장 많이 줄었다.
  • 반면에 2월에 경기도, 3월에는 서울, 4월에는 인천이 가장 많이 늘었다.
  •  

이사 변동량 movehouse.csv

3.3 데이터 비교-3

  • koreahuman도 정렬 한 결과
  • 경기도가 가장 많은 인구수가 분포, 세종시가 가장 적은 인구수가 분포
  •  

인구수 변동량 koreahuman.csv

3.4 데이터 비교-4

  • 하지만, homeprice에 지역별 평균 가격이 존재하지 않아, 30평 대 아파트 기준으로 조사를 하여,
  • 새로운 열을 삽입하였다
  •  

아파트 평균가격 열 삽입 homeprice.csv

3.5 데이터 비교-5

  • join 연산을 통하여 지역별 행정구역을 기준으로 보았다.
  • 그 결과, 변동량에 따라 인구수가 달라지는 것을 볼 수 있었다
  •  

조인 연산

3.6 데이터 비교-6

  • 2월에 대한 사항을 살펴보면 인구수 변동량의 상위 3지역은 경기도, 세종, 인천
  • 그에 따른 가격 변동지수를 살펴보면, 93.3 93.1 93.7 인 것을 알 수 있다.
  •  

2월 변동

3.7 데이터 비교-7

  • 3월에 대한 사항을 살펴보면, 인구수 변동량의 상위 3지역은 서울, 경기, 인천 순이다.
  • 그에 따른 가격 변동지수를 살펴보면, 88.9, 92.4, 93.5 인 것을 알 수 있다.
  •  

3월 변동

3.8 데이터 비교-8

  • 4월에 대한 사항을 살펴보면, 인구수 변동량의 상위 3지역은 인천, 경기, 충북 순이다.
  • 그에 따른 가격 변동지수를 살펴보면, 94.3, 93.4, 99.4 인 것을 알 수 있다.
  •  

4월 변동

3.9 데이터 비교-9

  • 최종적으로 정리하여 보면, 인구 수 증가량에 따라 어느정도 집값의 상승률도 올라가는 현상을 볼 수 있다.
  • 인천으로 예를 들어보면, 최종적으로 2월에 2,950,978명에서 4월에 2,953,260명으로 대략 3천명 이상이 늘은 것을 볼 수 있다.
  • 이에 따른 집값 상승률은 대략 (94.3-93.7) 0.6에 해당하는 상승률을 볼 수 있다.
  • 대략 예측하여 보면 3000명은 0.6 상승률 1000명당 0.2에 비례한다고 예측하여 볼 수 있다.
  •  

상승률

 

728x90
저작자표시 비영리 변경금지 (새창열림)

'빅데이터' 카테고리의 다른 글

빅데이터-11. 지하철 호선에 대한 승,하차 인원 예측  (0) 2023.01.17
빅데이터 - 10. 인구수와 이동량에 대한 집값 예측  (0) 2023.01.17
빅데이터 - 8. 자동차 온실가스 분석  (0) 2023.01.17
빅데이터 - 7. 단어 카운트  (0) 2022.10.09
빅데이터 - 6. SFPD 응용  (0) 2022.10.09
'빅데이터' 카테고리의 다른 글
  • 빅데이터-11. 지하철 호선에 대한 승,하차 인원 예측
  • 빅데이터 - 10. 인구수와 이동량에 대한 집값 예측
  • 빅데이터 - 8. 자동차 온실가스 분석
  • 빅데이터 - 7. 단어 카운트
IT의 큰손
IT의 큰손
IT계의 큰손이 되고 싶은 개린이의 Log 일지
Developer Story HouseIT계의 큰손이 되고 싶은 개린이의 Log 일지
IT의 큰손
Developer Story House
IT의 큰손
전체
오늘
어제
  • 분류 전체보기 (457)
    • 정보처리기사 필기 (18)
    • 정보처리기사 실기 (12)
    • 정보처리기사 통합 QUIZ (12)
    • 빅데이터 (11)
    • 안드로이드 (11)
    • 웹페이지 (108)
    • 자바 (49)
    • SQLD (3)
    • 백준 알고리즘 (76)
    • 데이터베이스 (41)
    • 깃허브 (2)
    • Library (14)
    • Server (31)
    • 크롤링&스크래핑 (3)
    • Spring (23)
    • Vue.js (13)
    • React (27)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • Developer Stroy House

인기 글

태그

  • 정보보안전문가
  • 코딩테스트
  • html
  • IT자격증
  • 개발블로그
  • java
  • ajax
  • 웹페이지
  • 정보처리기사필기
  • 웹개발자
  • 백엔드
  • 자바
  • JavaScript
  • 웹개발
  • IT개발자
  • 정보처리기사
  • DBA
  • 백준
  • React
  • css
  • jsp
  • IT자격증공부
  • jquery
  • 데이터베이스
  • 알고리즘
  • it
  • 프론트엔드
  • 개발자
  • DB
  • 앱개발자

최근 댓글

최근 글

Designed By hELLO
IT의 큰손
빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.