빅데이터

빅데이터 - 8. 자동차 온실가스 분석

2023. 1. 17. 16:38
728x90

1. 분석 내용

  • 차량, 브랜드별 탄소(온실가스) 배출량은 어느정도가 되는가?
  • 전기차 시대의 규모가 점점 커짐에 따라 내연기관 차에서 발생하는 온실가스의 양을 알아보고, 과징금을 부여하여 본다.
  • ※ 실제 통계된 내용은 정확한 자료가 아닐 수 있으며, 정확한 통계가 아닐 수 있습니다.

1.1 분석 1

차량 별 온실가스 배출량

1.2 분석 2

  • 승용차 브랜드 5가지, 트럭 브랜드 3가지, 버스 브랜드 3가지를 선정
  • 선정 브랜드
    • 승용차 : 현대, 기아, 벤츠, bmw, 지프
    • 트럭 : 현대, MAN, Volvo
    • 버스 : 현대, 기아, 대우
  • 각 브랜드별 차량을 3대씩 임의로 선정하여 33가지의 데이터를 모았다.
  • 속성 값 : 번호/자동차종류/브랜드/자동차이름/연료/배기량/평균연비/탄소배출량/기준배출량 으로 정리

1.3 분석 3

  • 각각의 브랜드와 차량 종류 등에 대해 작성하고, 승용차들은 현재 정부 기준 탄소 배출량 97에 맞추었고, 각각의 배기량과 탄소배출량 연료들을 기입하였다.
  • 하지만, 트럭과 버스의 경우 현재 탄소배출량을 정확하게 알 수 없었다. 따라서, 연료 절감장치를 달지 않았다고 가정하고 추산하였고, (최소값,최대값)x1/2하여 중간 값으로 추산하였다.

 

2.1 데이터 생성

  • Pyspark를 통해 데이터 생성
    • Spark 세션 빌더를 통하여 spark에 대한 프레임을 생성하였고, 그 데이터 프레임 안에 이전에 보았던 표에 대한 튜플들과 속성들을 삽입하여 df라는 릴레이션을 생성하였다.
    •  

데이터 생성

2.2 데이터 생성2

  • 초과량이라는 속성값을 삽입
    • df1 = df.withColumn
    • ("초과량", df.기준배출량-df.탄소배출량)
    • 즉, df1이라는 데이터에 df의 기준 배출량 - df의 탄소배출량을 연산하여 초과량이라는 새로운 속성값 생성
    • 초과량이라는 튜플들이 새롭게 삽입되었고, 해당 수치가 정확하게 나왔다.
    •  

초과량 속성값 생성

 

3.1 데이터 프레임 연산

  • 초과량이 넘지 않은 정상적인 차들
    • 초과량 = (기준 배출량 - 탄소배출량) = N
    • df1.filter(df1.초과량 >=0).show
    • df1.filter(df1.초과량 <=0).show
    • 즉, 초과량 N이 음수의 값을 갖게 된다면 기준 배출량을 초과한 차량이고, 양수의 값을 갖게 된다면 기준 배출량을 충족한 차량이 된다.
    •  

초과량이 넘지 않은 차량들

  • 초과량이 가장 많은 차량은?
    • df3.sort("초과량").show()
    • 초과량을 기준으로 가장 값이 큰 순서로 나열하여 확인하여 보았다.
    • 그 결과 트럭 MAN차의 TGX 640, Volvo의 FH-285, 기아의 그랜버드 순인 것으로 볼 수 있다.
    •  

초과량이 가장 많은 순서

  • 스포츠카는 어떨까?
    • 연비가 안좋기로 소문난 대표적인 스포츠카 한대를 데이터 프레임에 삽입하여 보았다.
    • spark.createDataFrame을 이용하여 튜플을 생성한 후, union을 통해 df3를 만들어 냈다.
    •  

스포츠카 튜플 삽입 및 합침

  • 가장 많이 초과하는 자동차 종류는?
    • groupBy("자동차종류").sum("초과량").show(truncate=False)
    • 자동차 종류의 속성을 기준으로 그룹화하여 초과량을 합산
    • 그 결과 스포츠카, 트럭, 승용차, 버스 순이다
    •  

가장 많이 초과하는 자동차 종류

  • 가장 많이 초과하는 브랜드?
    • 이전과 마찬가지로, groupBy를 사용하여, 초과량에 대한 합산
    • 그 결과, MAN, Volvo, 람보르기니 순이다.
    •  

가장 많이 초과하는 브랜드

  • 연료와 연비의 초과량
    • 평균 연비 별로 살펴 보았을 때, 차량마다 다르긴 하지만
    • 평균 초과량이 대체적으로 연비가 낮을 수록 많은 초과량을 보이는 것을 볼 수 있다.
    •  

연료와 연비의 초과량

  • 초과량에 대한 과징금 부여
    • 초과량에 대한 과징금을 부여하는 속성 값을 삽입하여 보았다.
    • 과징금 = 초과량*50000
    • df4라는 데이터 프레임을 생성, 그 안에 과징금이라는 속성을 삽입하고, 속성 값은 초과량*50000으로 한다.
    •  

초과량에 대한 과징금 부여

  • 과징금 높은 순서, 낮은 순서
    • 초과량을 넘지 않은 차량들은 마이티, 그린시티, 카운티, BH090
    • 과징금이 높은 상위 3개는 MAN TGX 640이 25,150,000원, Volvo FH가 14,250,000원, 기아의 그랜버드가 14,000,000원 이다.
    •  

과징금 순서

  • 과징금이 가장 많은 브랜드는?
    • df4.groupBy("브랜드").sum("과징금").show(truncate=False)
    • 가장 많은 과징금 브랜드는 MAN차로 50,350,000원으로 가장 많은 것을 알 수 있었다.
    •  

과징금이 가장 많은 브랜드

    • 자료출처
      • 환경부   
      • https://www.me.go.kr/home/web/board/read.do;jsessionid=zPooTV5yk4E5e2y9V4Wt3j1W.mehome1?pagerOffset=13170&maxPageItems=10&maxIndexPages=10&searchKey=&searchValue=&menuId=&orgCd=&boardId=82696&boardMasterId=1&boardCategoryId=&decorator=
      • 자동차 탄소배출량
      • https://m.etnews.com/20200830000012
      • 현대 자동차
      • https://www.hyundai.com/kr/ko/e
      • 기아 자동차
      • https://www.kia.com/kr/main.html
      • 벤츠
      • https://www.mercedes-benz.co.kr
      • Bmw
      • https://www.bmw.co.kr/ko/index.html
      • 대우
      • http://www.daewoobus.co.kr/
      • JEEP
      • https://www.jeep.co.kr
      • MAN
      • https://mantruck.co.kr
      • VOLVO
      • https://www.volvocars.com/kr

 

 

728x90
저작자표시 비영리 변경금지 (새창열림)

'빅데이터' 카테고리의 다른 글

빅데이터 - 10. 인구수와 이동량에 대한 집값 예측  (0) 2023.01.17
빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교  (0) 2023.01.17
빅데이터 - 7. 단어 카운트  (0) 2022.10.09
빅데이터 - 6. SFPD 응용  (0) 2022.10.09
빅데이터 - 5. 스파크 데이터프레임 연산  (0) 2022.09.18
'빅데이터' 카테고리의 다른 글
  • 빅데이터 - 10. 인구수와 이동량에 대한 집값 예측
  • 빅데이터 - 9. 인구수와 이동량에 대한 집값 상승률 비교
  • 빅데이터 - 7. 단어 카운트
  • 빅데이터 - 6. SFPD 응용
IT의 큰손
IT의 큰손
IT계의 큰손이 되고 싶은 개린이의 Log 일지
Developer Story HouseIT계의 큰손이 되고 싶은 개린이의 Log 일지
IT의 큰손
Developer Story House
IT의 큰손
전체
오늘
어제
  • 분류 전체보기 (457)
    • 정보처리기사 필기 (18)
    • 정보처리기사 실기 (12)
    • 정보처리기사 통합 QUIZ (12)
    • 빅데이터 (11)
    • 안드로이드 (11)
    • 웹페이지 (108)
    • 자바 (49)
    • SQLD (3)
    • 백준 알고리즘 (76)
    • 데이터베이스 (41)
    • 깃허브 (2)
    • Library (14)
    • Server (31)
    • 크롤링&스크래핑 (3)
    • Spring (23)
    • Vue.js (13)
    • React (27)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • Developer Stroy House

인기 글

태그

  • css
  • 알고리즘
  • IT자격증
  • 백엔드
  • 웹페이지
  • java
  • 자바
  • 개발블로그
  • 정보보안전문가
  • IT자격증공부
  • 앱개발자
  • jquery
  • jsp
  • 정보처리기사
  • 코딩테스트
  • IT개발자
  • 개발자
  • DB
  • 백준
  • DBA
  • 웹개발자
  • it
  • 데이터베이스
  • 프론트엔드
  • html
  • React
  • JavaScript
  • 정보처리기사필기
  • ajax
  • 웹개발

최근 댓글

최근 글

Designed By hELLO
IT의 큰손
빅데이터 - 8. 자동차 온실가스 분석
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.