크롤링&스크래핑

Crawling STEP 2 - 다음 영화페이지 크롤링

2023. 5. 26. 10:41
728x90

★ 다음 영화 페이지

  • https://movie.daum.net/main
 

HOME

Daum영화에서 자세한 내용을 확인하세요!

movie.daum.net

  • 영화 박스오피스 순위 -> 크롤링
  • 개발자 모드 F12를 이용하여 태그 분석

 

★ 소스

package com.test.crawling;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Ex03 {

	public static void main(String[] args) {
		
		
		try {
			
			//가져올 URL
			String url = "https://movie.daum.net/ranking/boxoffice/weekly";
			
			//URL을 연결 
			Document doc = Jsoup.connect(url).get();
			
			//System.out.println(doc.select(".list_movieranking").size());
			
			//자식 태그 찾기
			
			//영화 목록
			Elements list = doc.select(".list_movieranking li");
			
			System.out.println("영화 목록 : " + list.size() + "편");
			
			//데이터 가져오기
			for (Element movie :list) {
				
				//영화 제목
				String title = movie.select(".link_txt").text();
				System.out.println(title);
				
				
				//개봉 날짜
				String date = movie.select(".txt_num").text();
				System.out.println(date);
				
				//관객수
				String num = movie.select(".info_txt:nth-child(2)").text();
				System.out.println(num.replace("관객수", ""));
				
				//설명
				String story = movie.select(".link_story").text();
				System.out.println(story);
				
				//이미지
				String poster = movie.select(".img_thumb").attr("src");
				System.out.println(poster);
				
				System.out.println();
				
				
			}
			
			
		} catch (IOException e) {
			
			e.printStackTrace();
		}
		
	}
	
	
}

 

 

■ 실행 결과

 

■ 이미지 다운로드 ->

//이미지 다운로드
URL posterUrl = new URL(poster);

BufferedImage image = ImageIO.read(posterUrl);
File file = new File("poster\\" + title + ".png");

ImageIO.write(image, "png", file);
  • 실행 결과

다운로드 성공

728x90
저작자표시 비영리 변경금지 (새창열림)

'크롤링&스크래핑' 카테고리의 다른 글

Crawling STEP 3 - 셀레니움을 통해 JavaScript로 선언된 데이터 가져오기  (0) 2023.05.26
Crawling STEP 1 - JSOUP 사용  (0) 2023.05.26
'크롤링&스크래핑' 카테고리의 다른 글
  • Crawling STEP 3 - 셀레니움을 통해 JavaScript로 선언된 데이터 가져오기
  • Crawling STEP 1 - JSOUP 사용
IT의 큰손
IT의 큰손
IT계의 큰손이 되고 싶은 개린이의 Log 일지
IT의 큰손
Developer Story House
IT의 큰손
전체
오늘
어제
  • 분류 전체보기 (457)
    • 정보처리기사 필기 (18)
    • 정보처리기사 실기 (12)
    • 정보처리기사 통합 QUIZ (12)
    • 빅데이터 (11)
    • 안드로이드 (11)
    • 웹페이지 (108)
    • 자바 (49)
    • SQLD (3)
    • 백준 알고리즘 (76)
    • 데이터베이스 (41)
    • 깃허브 (2)
    • Library (14)
    • Server (31)
    • 크롤링&스크래핑 (3)
    • Spring (23)
    • Vue.js (13)
    • React (27)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • Developer Stroy House

인기 글

태그

  • jsp
  • 정보처리기사필기
  • css
  • DB
  • 웹개발
  • ajax
  • 정보보안전문가
  • java
  • 자바
  • 개발블로그
  • 데이터베이스
  • jquery
  • 웹개발자
  • DBA
  • it
  • 알고리즘
  • JavaScript
  • IT자격증공부
  • 프론트엔드
  • 코딩테스트
  • 앱개발자
  • 웹페이지
  • 정보처리기사
  • React
  • 백준
  • html
  • IT자격증
  • 백엔드
  • IT개발자
  • 개발자

최근 댓글

최근 글

Designed By hELLO
IT의 큰손
Crawling STEP 2 - 다음 영화페이지 크롤링
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.