분산데이터

빅데이터

빅데이터 - 10. 인구수와 이동량에 대한 집값 예측

1.1 집값 예측-1 우선 총 데이터 사용을 위하여 dataframe 합치기 연산을 통하여 이와 같이 데이터들을 통합하였다. 1.2 집값 예측-2 총 데이터를 8:2 비율로 훈련 데이터와 테스트 데이터를 나누었다. mean, stddev, min 등을 출력하여 비교하였다. 1.3 집값 예측-3 마찬가지로, 3월 4월에 해당하는 각각의 데이터들도 출력하였다. 1.4 집값 예측-4 카테고리의 열들을 각각 기입하고, index의 새로운 열을 반환하고 전처리를 수행 fit과 transform을 이용하여 변환하였다. 1.5 집값 예측-5 데이터 숫자 열들과, 원핫 인코드 열들의 피처들을 단일 피처로 결합 파이프 라인을 구축하여, 훈련 데이터로 학습 모델을 구축 그 후, 테스트 데이터에 학습 모델을 적용 후, 데이..

IT의 큰손
'분산데이터' 태그의 글 목록