본문 바로가기
  • You find inspiration to create your own path !
업무 자동화/AI

자동차 연비를 예측 하는 프로그램 #1

by ToolBOX01 2026. 3. 15.
반응형

UCI Machine Learning Repository 데이터(Auto MPG 데이터셋)를 활용

auto-mpg.data
0.03MB

위 데이터틑 연비(MPG)뿐만 아니라 실린더 수, 배기량, 마력, 무게 등 연비에 영향을 주는 다양한 수치들이 포함되어 있어, 엑셀의 '회귀 분석' 기능을 활용하기에 아주 적합합니다.  이 데이터는 MPG(연비)를 예측하기 위한 타겟(Target)으로 하고, 나머지 항목들을 원인(Feature)으로 분석하게 됩니다.

MPG
(연비)
Cylinders Displacement Horsepower Weight Acceleration Model Year Origin Car Name
18 8 307 130 3504 12 70 1
chevrolet chevelle malibu
15 8 350 165 3693 11.5 70 1
buick skylark 320
18 8 318 150 3436 11 70 1
plymouth satellite
16 8 304 150 3433 12 70 1 amc rebel sst
17 8 302 140 3449 10.5 70 1 ford torino
15 8 429 198 4341 10 70 1 ford galaxie 500
14 8 454 220 4354 9 70 1 chevrolet impala
14 8 440 215 4312 8.5 70 1 plymouth fury iii
14 8 455 225 4425 10 70 1 pontiac catalina
15 8 390 190 3850 8.5 70 1
amc ambassador dpl

기계가 데이터를 학습하여,  Cylinders: 실린더 개수, Displacement: 배기량, Horsepower: 마력 , Weight: 차체 무게, Acceleration: 가속 성능을 입력하면 예상되는 "연비(MPG) "를 알려주는 프로그램을 개발 합니다.  


'데이터 전처리' 과정 

데이터 중 마력(horsepower) 부분에 결측치(값이 없는 경우, 주로 '?'로 표시됨)가 있을 수 있습니다. 분석을 위해 해당 행을 삭제하거나 평균값으로 채워주세요. 연비 예측에 큰 도움이 되지 않거나 처리가 까다로운 '자동차 이름(car_name)', '제조국(origin)', '마력(horsepower)' 열을 삭제합니다. 데이터 전처리 과정은 " 파워 쿼리(Power Query)"를 사용합니다.

auto-mpg.xlsx
0.02MB

 

파워 쿼리(Power Query)

파워 쿼리(Power Query)는 엑셀과 파워 BI에서 다양한 원본(엑셀, CSV, 데이터베이스, 웹 등) 데이터를 가져와 원하는 형태로 쉽게 가공, 정리, 병합하여 분석할 수 있게 돕는 데이터 연결 및 변환 기술입니다. 코딩 없이 UI를 통해 변환 과정을 자동화할 수 있으며, 원본 데이터 손상 없이 최종 결과만 로드하는 것이 특징입니다.

핵심 특징 및 장점:
  • 간편한 데이터 가공: 필터링, 정렬, 열 추가/제거, 형식 변경 등 복잡한 작업을 함수 없이 처리.
  • 자동화: 데이터 가공 과정을 단계별로 기록하여, 원본 데이터만 바뀌면 '새로 고침'으로 자동 업데이트.
  • 다양한 데이터 소스: 엑셀, CSV, 데이터베이스, 웹 등 다양한 곳의 데이터를 손쉽게 연결.
  • 데이터 결합:
     여러 시트나 파일의 데이터를 하나로 병합하거나 추가하여 분석.

 

 

공공데이터 포털 : https://www.data.go.kr/

전자 공시 사이트 : https://dart.fss.or.kr/

거래소 : https://data.krx.co.kr/contents/MDC/MAIN/main/index.cmd


 

반응형