IT공부

빅데이터

빅데이터 - 3. 맵리듀스 응용 구축

1. 데이터 다운로드 wget을 이용하여 사이트에 있는 receipts.txt 파일을 다운로드 한다. 정상적으로 다운로드를 완료한다. 2. RECEIPTS ReceiptsMapper 패키지 Receipts를 받아, import를 한다. Mapper 클래스 인수 : 입력키,입력값,출력키,출력값 타입을 구분 Map() 메서드 인수 : 입력키, 입력값,실행되는 작업의 컨텍스트 필드 구분을 위하여 StringTokenizer을 사용. 키(“Summary”)와 합성값(year_delta) 출력 ReceiptReducer Reducer 클래스 인수 : 입력키,입력값,출력키,출력값 Reduce() 메서드 인수 : 입력키,입력값,실행되는 작업의 컨텍스트 합성 값들에서 년도와 delta를 분리하고 delta 값을 Lon..