728x90
1. SFPD 데이터 다운로드
- $ mkdir ~/sparkdata/sfpd
- $ cd ~/sparkdata/sfpd
- $ wget https://github.com/caroljmcdonald/sparkdataframeexample/blob/master/sfpd.csv
2. 하둡 적재
- hadoop fs -mkdir /sparkdata/sfpd
- hadoop fs -put sfpd.csv /sparkdata/sfpd
- hadoop fs -ls /sparkdata/sfpd
3. SFPD 데이터 프레임 생성
4. 데이터 조사 질의
- 가장 사건이 많이 발생한 5개의 주소?
5. 가장 사건이 많이 발생한 5개의 주소, SQL
6. 가장 사건이 많이 발생한 5개의 지구대는?
7. 가장 많은 10개의 사건 해결 유형은?
8. 가장 많은 3개의 범죄 유형은?
728x90
'빅데이터' 카테고리의 다른 글
빅데이터 - 8. 자동차 온실가스 분석 (0) | 2023.01.17 |
---|---|
빅데이터 - 7. 단어 카운트 (0) | 2022.10.09 |
빅데이터 - 5. 스파크 데이터프레임 연산 (0) | 2022.09.18 |
빅데이터 - 4. 스파크 설치 및 테스트 (0) | 2022.08.30 |
빅데이터 - 3. 맵리듀스 응용 구축 (0) | 2022.08.30 |