728x90
1. 데이터 생성
- subway.csv 파일을 생성 후 불러옴
- 훈련 데이터와 테스트 데이터를 8:2의 비율로 나눈 후, 승차인원과 하차인원을 출력
2. 데이터 가공
- 피처 전처리를 실행 한 후, 데이터의 숫자열들과 인코드 열들의 피처들을 단일 피처로 결합
- 파이프 라인을 구축하여, 훈련 데이터로 학습 모델을 구축
- 학습 모델에 적용 후 데이터 프레임을 변환
3. 예측 정확도
- 예측 정확도를 살펴보니 0.9대의 정확도를 측정
- 아래와 같이 승하차 인원에 대한 예측도를 볼 수 있다.
4. 정확도 시각화
- 데이터를 시각화하여 살펴본 결과
- 5호선이 가장 높았고, 7호선, 2호선 순인 것을 알 수 있었다.
728x90
'빅데이터' 카테고리의 다른 글
빅데이터 - 10. 인구수와 이동량에 대한 집값 예측 (0) | 2023.01.17 |
---|---|
빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교 (0) | 2023.01.17 |
빅데이터 - 8. 자동차 온실가스 분석 (0) | 2023.01.17 |
빅데이터 - 7. 단어 카운트 (0) | 2022.10.09 |
빅데이터 - 6. SFPD 응용 (0) | 2022.10.09 |