빅데이터

빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교

2023. 1. 17. 17:12
728x90

1. 데이터 소개

  • homeprice.csv : 3개월간의 전국 집값, 집값의 상승률
  • movehouse.csv : 3개월간의 전국 이동량
  • koreahuman.csv : 3개월간의 인구수
  • ※ 실제 통계된 내용은 정확한 자료가 아닐 수 있으며, 정확한 통계가 아닐 수 있습니다.

2. 데이터 생성-1

  • csv 파일을 작성 및 클라우드에 올린 후, 해당 클라우드 사이트에 접근을 요청하여 다운로드
  •  

데이터를 받아옴

2.1 데이터 생성-2

  • 각각의 데이터를 pyspark를 통하여 csv 파일을 읽어 들여 출력
  •  

해당 csv 파일을 읽어들임

2.2 데이터 생성-3

  • homeprice의 데이터 값을 count한 결과 데이터가 상당히 불규칙하여, 지역별로 균등하게 나누었다.
  •  

지역별로 균등하게 나눔

2.3 데이터 생성-4

  • movehouse의 2,3,4월에 대한 전입-전출 = 변동량으로 하여, 새로운 열을 생성하고, 불필요 데이터 제거
  •  

불필요 데이터가 있는 movehouse.csv
불필요 데이터 제거 movehouse.csv

  • 마찬가지로, koreahuman의 데이터도 불필요 데이터를 제거
  •  

불필요 데이터 제거 koreahuman.csv

3.1 데이터 비교-1

  • homeprice의 2,3,4월에 대한 가격 변동 지수를 sort를 통하여 각각 정렬
  • 대구가 1,2,3월 대비 공시가 대비 가장 낮은 변동 수치를 보여주었고
  • 전라북도, 강원도가 공시가 대비 가장 높은 변동 수치를 보여주었다
  •  

2,3,4월 가격 변동지수 homeprice.csv

3.2 데이터 비교-2

  • movehouse도 마찬가지로, sort를 통하여 정렬한 결과
  • 2월에는 서울이 가장 많이 줄었고, 3,4월에는 경상남도가 가장 많이 줄었다.
  • 반면에 2월에 경기도, 3월에는 서울, 4월에는 인천이 가장 많이 늘었다.
  •  

이사 변동량 movehouse.csv

3.3 데이터 비교-3

  • koreahuman도 정렬 한 결과
  • 경기도가 가장 많은 인구수가 분포, 세종시가 가장 적은 인구수가 분포
  •  

인구수 변동량 koreahuman.csv

3.4 데이터 비교-4

  • 하지만, homeprice에 지역별 평균 가격이 존재하지 않아, 30평 대 아파트 기준으로 조사를 하여,
  • 새로운 열을 삽입하였다
  •  

아파트 평균가격 열 삽입 homeprice.csv

3.5 데이터 비교-5

  • join 연산을 통하여 지역별 행정구역을 기준으로 보았다.
  • 그 결과, 변동량에 따라 인구수가 달라지는 것을 볼 수 있었다
  •  

조인 연산

3.6 데이터 비교-6

  • 2월에 대한 사항을 살펴보면 인구수 변동량의 상위 3지역은 경기도, 세종, 인천
  • 그에 따른 가격 변동지수를 살펴보면, 93.3 93.1 93.7 인 것을 알 수 있다.
  •  

2월 변동

3.7 데이터 비교-7

  • 3월에 대한 사항을 살펴보면, 인구수 변동량의 상위 3지역은 서울, 경기, 인천 순이다.
  • 그에 따른 가격 변동지수를 살펴보면, 88.9, 92.4, 93.5 인 것을 알 수 있다.
  •  

3월 변동

3.8 데이터 비교-8

  • 4월에 대한 사항을 살펴보면, 인구수 변동량의 상위 3지역은 인천, 경기, 충북 순이다.
  • 그에 따른 가격 변동지수를 살펴보면, 94.3, 93.4, 99.4 인 것을 알 수 있다.
  •  

4월 변동

3.9 데이터 비교-9

  • 최종적으로 정리하여 보면, 인구 수 증가량에 따라 어느정도 집값의 상승률도 올라가는 현상을 볼 수 있다.
  • 인천으로 예를 들어보면, 최종적으로 2월에 2,950,978명에서 4월에 2,953,260명으로 대략 3천명 이상이 늘은 것을 볼 수 있다.
  • 이에 따른 집값 상승률은 대략 (94.3-93.7) 0.6에 해당하는 상승률을 볼 수 있다.
  • 대략 예측하여 보면 3000명은 0.6 상승률 1000명당 0.2에 비례한다고 예측하여 볼 수 있다.
  •  

상승률

 

728x90
저작자표시 비영리 변경금지 (새창열림)

'빅데이터' 카테고리의 다른 글

빅데이터-11. 지하철 호선에 대한 승,하차 인원 예측  (0) 2023.01.17
빅데이터 - 10. 인구수와 이동량에 대한 집값 예측  (0) 2023.01.17
빅데이터 - 8. 자동차 온실가스 분석  (0) 2023.01.17
빅데이터 - 7. 단어 카운트  (0) 2022.10.09
빅데이터 - 6. SFPD 응용  (0) 2022.10.09
'빅데이터' 카테고리의 다른 글
  • 빅데이터-11. 지하철 호선에 대한 승,하차 인원 예측
  • 빅데이터 - 10. 인구수와 이동량에 대한 집값 예측
  • 빅데이터 - 8. 자동차 온실가스 분석
  • 빅데이터 - 7. 단어 카운트
IT의 큰손
IT의 큰손
IT계의 큰손이 되고 싶은 개린이의 Log 일지
IT의 큰손
Developer Story House
IT의 큰손
전체
오늘
어제
  • 분류 전체보기 (457)
    • 정보처리기사 필기 (18)
    • 정보처리기사 실기 (12)
    • 정보처리기사 통합 QUIZ (12)
    • 빅데이터 (11)
    • 안드로이드 (11)
    • 웹페이지 (108)
    • 자바 (49)
    • SQLD (3)
    • 백준 알고리즘 (76)
    • 데이터베이스 (41)
    • 깃허브 (2)
    • Library (14)
    • Server (31)
    • 크롤링&스크래핑 (3)
    • Spring (23)
    • Vue.js (13)
    • React (27)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • Developer Stroy House

인기 글

태그

  • 정보처리기사필기
  • 백준
  • 웹개발
  • jquery
  • 웹개발자
  • 웹페이지
  • DBA
  • 정보처리기사
  • 개발자
  • 정보보안전문가
  • 앱개발자
  • 프론트엔드
  • IT자격증
  • 개발블로그
  • React
  • css
  • ajax
  • IT개발자
  • java
  • html
  • 데이터베이스
  • 백엔드
  • JavaScript
  • 알고리즘
  • 코딩테스트
  • it
  • DB
  • 자바
  • jsp
  • IT자격증공부

최근 댓글

최근 글

Designed By hELLO
IT의 큰손
빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.