728x90
★ 다음 영화 페이지
- 영화 박스오피스 순위 -> 크롤링
- 개발자 모드 F12를 이용하여 태그 분석
★ 소스
package com.test.crawling;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Ex03 {
public static void main(String[] args) {
try {
//가져올 URL
String url = "https://movie.daum.net/ranking/boxoffice/weekly";
//URL을 연결
Document doc = Jsoup.connect(url).get();
//System.out.println(doc.select(".list_movieranking").size());
//자식 태그 찾기
//영화 목록
Elements list = doc.select(".list_movieranking li");
System.out.println("영화 목록 : " + list.size() + "편");
//데이터 가져오기
for (Element movie :list) {
//영화 제목
String title = movie.select(".link_txt").text();
System.out.println(title);
//개봉 날짜
String date = movie.select(".txt_num").text();
System.out.println(date);
//관객수
String num = movie.select(".info_txt:nth-child(2)").text();
System.out.println(num.replace("관객수", ""));
//설명
String story = movie.select(".link_story").text();
System.out.println(story);
//이미지
String poster = movie.select(".img_thumb").attr("src");
System.out.println(poster);
System.out.println();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
■ 실행 결과
■ 이미지 다운로드 ->
//이미지 다운로드
URL posterUrl = new URL(poster);
BufferedImage image = ImageIO.read(posterUrl);
File file = new File("poster\\" + title + ".png");
ImageIO.write(image, "png", file);
- 실행 결과
728x90
'크롤링&스크래핑' 카테고리의 다른 글
Crawling STEP 3 - 셀레니움을 통해 JavaScript로 선언된 데이터 가져오기 (0) | 2023.05.26 |
---|---|
Crawling STEP 1 - JSOUP 사용 (0) | 2023.05.26 |