빅데이터

빅데이터 - 8. 자동차 온실가스 분석

2023. 1. 17. 16:38
728x90

1. 분석 내용

  • 차량, 브랜드별 탄소(온실가스) 배출량은 어느정도가 되는가?
  • 전기차 시대의 규모가 점점 커짐에 따라 내연기관 차에서 발생하는 온실가스의 양을 알아보고, 과징금을 부여하여 본다.
  • ※ 실제 통계된 내용은 정확한 자료가 아닐 수 있으며, 정확한 통계가 아닐 수 있습니다.

1.1 분석 1

차량 별 온실가스 배출량

1.2 분석 2

  • 승용차 브랜드 5가지, 트럭 브랜드 3가지, 버스 브랜드 3가지를 선정
  • 선정 브랜드
    • 승용차 : 현대, 기아, 벤츠, bmw, 지프
    • 트럭 : 현대, MAN, Volvo
    • 버스 : 현대, 기아, 대우
  • 각 브랜드별 차량을 3대씩 임의로 선정하여 33가지의 데이터를 모았다.
  • 속성 값 : 번호/자동차종류/브랜드/자동차이름/연료/배기량/평균연비/탄소배출량/기준배출량 으로 정리

1.3 분석 3

  • 각각의 브랜드와 차량 종류 등에 대해 작성하고, 승용차들은 현재 정부 기준 탄소 배출량 97에 맞추었고, 각각의 배기량과 탄소배출량 연료들을 기입하였다.
  • 하지만, 트럭과 버스의 경우 현재 탄소배출량을 정확하게 알 수 없었다. 따라서, 연료 절감장치를 달지 않았다고 가정하고 추산하였고, (최소값,최대값)x1/2하여 중간 값으로 추산하였다.

 

2.1 데이터 생성

  • Pyspark를 통해 데이터 생성
    • Spark 세션 빌더를 통하여 spark에 대한 프레임을 생성하였고, 그 데이터 프레임 안에 이전에 보았던 표에 대한 튜플들과 속성들을 삽입하여 df라는 릴레이션을 생성하였다.
    •  

데이터 생성

2.2 데이터 생성2

  • 초과량이라는 속성값을 삽입
    • df1 = df.withColumn
    • ("초과량", df.기준배출량-df.탄소배출량)
    • 즉, df1이라는 데이터에 df의 기준 배출량 - df의 탄소배출량을 연산하여 초과량이라는 새로운 속성값 생성
    • 초과량이라는 튜플들이 새롭게 삽입되었고, 해당 수치가 정확하게 나왔다.
    •  

초과량 속성값 생성

 

3.1 데이터 프레임 연산

  • 초과량이 넘지 않은 정상적인 차들
    • 초과량 = (기준 배출량 - 탄소배출량) = N
    • df1.filter(df1.초과량 >=0).show
    • df1.filter(df1.초과량 <=0).show
    • 즉, 초과량 N이 음수의 값을 갖게 된다면 기준 배출량을 초과한 차량이고, 양수의 값을 갖게 된다면 기준 배출량을 충족한 차량이 된다.
    •  

초과량이 넘지 않은 차량들

  • 초과량이 가장 많은 차량은?
    • df3.sort("초과량").show()
    • 초과량을 기준으로 가장 값이 큰 순서로 나열하여 확인하여 보았다.
    • 그 결과 트럭 MAN차의 TGX 640, Volvo의 FH-285, 기아의 그랜버드 순인 것으로 볼 수 있다.
    •  

초과량이 가장 많은 순서

  • 스포츠카는 어떨까?
    • 연비가 안좋기로 소문난 대표적인 스포츠카 한대를 데이터 프레임에 삽입하여 보았다.
    • spark.createDataFrame을 이용하여 튜플을 생성한 후, union을 통해 df3를 만들어 냈다.
    •  

스포츠카 튜플 삽입 및 합침

  • 가장 많이 초과하는 자동차 종류는?
    • groupBy("자동차종류").sum("초과량").show(truncate=False)
    • 자동차 종류의 속성을 기준으로 그룹화하여 초과량을 합산
    • 그 결과 스포츠카, 트럭, 승용차, 버스 순이다
    •  

가장 많이 초과하는 자동차 종류

  • 가장 많이 초과하는 브랜드?
    • 이전과 마찬가지로, groupBy를 사용하여, 초과량에 대한 합산
    • 그 결과, MAN, Volvo, 람보르기니 순이다.
    •  

가장 많이 초과하는 브랜드

  • 연료와 연비의 초과량
    • 평균 연비 별로 살펴 보았을 때, 차량마다 다르긴 하지만
    • 평균 초과량이 대체적으로 연비가 낮을 수록 많은 초과량을 보이는 것을 볼 수 있다.
    •  

연료와 연비의 초과량

  • 초과량에 대한 과징금 부여
    • 초과량에 대한 과징금을 부여하는 속성 값을 삽입하여 보았다.
    • 과징금 = 초과량*50000
    • df4라는 데이터 프레임을 생성, 그 안에 과징금이라는 속성을 삽입하고, 속성 값은 초과량*50000으로 한다.
    •  

초과량에 대한 과징금 부여

  • 과징금 높은 순서, 낮은 순서
    • 초과량을 넘지 않은 차량들은 마이티, 그린시티, 카운티, BH090
    • 과징금이 높은 상위 3개는 MAN TGX 640이 25,150,000원, Volvo FH가 14,250,000원, 기아의 그랜버드가 14,000,000원 이다.
    •  

과징금 순서

  • 과징금이 가장 많은 브랜드는?
    • df4.groupBy("브랜드").sum("과징금").show(truncate=False)
    • 가장 많은 과징금 브랜드는 MAN차로 50,350,000원으로 가장 많은 것을 알 수 있었다.
    •  

과징금이 가장 많은 브랜드

    • 자료출처
      • 환경부   
      • https://www.me.go.kr/home/web/board/read.do;jsessionid=zPooTV5yk4E5e2y9V4Wt3j1W.mehome1?pagerOffset=13170&maxPageItems=10&maxIndexPages=10&searchKey=&searchValue=&menuId=&orgCd=&boardId=82696&boardMasterId=1&boardCategoryId=&decorator=
      • 자동차 탄소배출량
      • https://m.etnews.com/20200830000012
      • 현대 자동차
      • https://www.hyundai.com/kr/ko/e
      • 기아 자동차
      • https://www.kia.com/kr/main.html
      • 벤츠
      • https://www.mercedes-benz.co.kr
      • Bmw
      • https://www.bmw.co.kr/ko/index.html
      • 대우
      • http://www.daewoobus.co.kr/
      • JEEP
      • https://www.jeep.co.kr
      • MAN
      • https://mantruck.co.kr
      • VOLVO
      • https://www.volvocars.com/kr

 

 

728x90
저작자표시 비영리 변경금지 (새창열림)

'빅데이터' 카테고리의 다른 글

빅데이터 - 10. 인구수와 이동량에 대한 집값 예측  (0) 2023.01.17
빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교  (0) 2023.01.17
빅데이터 - 7. 단어 카운트  (0) 2022.10.09
빅데이터 - 6. SFPD 응용  (0) 2022.10.09
빅데이터 - 5. 스파크 데이터프레임 연산  (0) 2022.09.18
'빅데이터' 카테고리의 다른 글
  • 빅데이터 - 10. 인구수와 이동량에 대한 집값 예측
  • 빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교
  • 빅데이터 - 7. 단어 카운트
  • 빅데이터 - 6. SFPD 응용
IT의 큰손
IT의 큰손
IT계의 큰손이 되고 싶은 개린이의 Log 일지
IT의 큰손
Developer Story House
IT의 큰손
전체
오늘
어제
  • 분류 전체보기 (457)
    • 정보처리기사 필기 (18)
    • 정보처리기사 실기 (12)
    • 정보처리기사 통합 QUIZ (12)
    • 빅데이터 (11)
    • 안드로이드 (11)
    • 웹페이지 (108)
    • 자바 (49)
    • SQLD (3)
    • 백준 알고리즘 (76)
    • 데이터베이스 (41)
    • 깃허브 (2)
    • Library (14)
    • Server (31)
    • 크롤링&스크래핑 (3)
    • Spring (23)
    • Vue.js (13)
    • React (27)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • Developer Stroy House

인기 글

태그

  • jsp
  • 백준
  • 정보처리기사필기
  • jquery
  • 백엔드
  • JavaScript
  • 정보보안전문가
  • 웹개발
  • java
  • html
  • IT자격증공부
  • 앱개발자
  • 웹개발자
  • 프론트엔드
  • 데이터베이스
  • 코딩테스트
  • css
  • IT자격증
  • DBA
  • 개발자
  • ajax
  • 정보처리기사
  • 웹페이지
  • React
  • 개발블로그
  • 알고리즘
  • IT개발자
  • DB
  • it
  • 자바

최근 댓글

최근 글

Designed By hELLO
IT의 큰손
빅데이터 - 8. 자동차 온실가스 분석
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.