UCI Machine Learning Repository 데이터(Auto MPG 데이터셋)를 활용
위 데이터틑 연비(MPG)뿐만 아니라 실린더 수, 배기량, 마력, 무게 등 연비에 영향을 주는 다양한 수치들이 포함되어 있어, 엑셀의 '회귀 분석' 기능을 활용하기에 아주 적합합니다. 이 데이터는 MPG(연비)를 예측하기 위한 타겟(Target)으로 하고, 나머지 항목들을 원인(Feature)으로 분석하게 됩니다.
| MPG (연비) |
Cylinders | Displacement | Horsepower | Weight | Acceleration | Model Year | Origin | Car Name |
| 18 | 8 | 307 | 130 | 3504 | 12 | 70 | 1 |
chevrolet chevelle malibu
|
| 15 | 8 | 350 | 165 | 3693 | 11.5 | 70 | 1 |
buick skylark 320
|
| 18 | 8 | 318 | 150 | 3436 | 11 | 70 | 1 |
plymouth satellite
|
| 16 | 8 | 304 | 150 | 3433 | 12 | 70 | 1 | amc rebel sst |
| 17 | 8 | 302 | 140 | 3449 | 10.5 | 70 | 1 | ford torino |
| 15 | 8 | 429 | 198 | 4341 | 10 | 70 | 1 | ford galaxie 500 |
| 14 | 8 | 454 | 220 | 4354 | 9 | 70 | 1 | chevrolet impala |
| 14 | 8 | 440 | 215 | 4312 | 8.5 | 70 | 1 | plymouth fury iii |
| 14 | 8 | 455 | 225 | 4425 | 10 | 70 | 1 | pontiac catalina |
| 15 | 8 | 390 | 190 | 3850 | 8.5 | 70 | 1 |
amc ambassador dpl
|
기계가 데이터를 학습하여, Cylinders: 실린더 개수, Displacement: 배기량, Horsepower: 마력 , Weight: 차체 무게, Acceleration: 가속 성능을 입력하면 예상되는 "연비(MPG) "를 알려주는 프로그램을 개발 합니다.
'데이터 전처리' 과정
데이터 중 마력(horsepower) 부분에 결측치(값이 없는 경우, 주로 '?'로 표시됨)가 있을 수 있습니다. 분석을 위해 해당 행을 삭제하거나 평균값으로 채워주세요. 연비 예측에 큰 도움이 되지 않거나 처리가 까다로운 '자동차 이름(car_name)', '제조국(origin)', '마력(horsepower)' 열을 삭제합니다. 데이터 전처리 과정은 " 파워 쿼리(Power Query)"를 사용합니다.
■ 파워 쿼리(Power Query)
파워 쿼리(Power Query)는 엑셀과 파워 BI에서 다양한 원본(엑셀, CSV, 데이터베이스, 웹 등) 데이터를 가져와 원하는 형태로 쉽게 가공, 정리, 병합하여 분석할 수 있게 돕는 데이터 연결 및 변환 기술입니다. 코딩 없이 UI를 통해 변환 과정을 자동화할 수 있으며, 원본 데이터 손상 없이 최종 결과만 로드하는 것이 특징입니다.

- 간편한 데이터 가공: 필터링, 정렬, 열 추가/제거, 형식 변경 등 복잡한 작업을 함수 없이 처리.
- 자동화: 데이터 가공 과정을 단계별로 기록하여, 원본 데이터만 바뀌면 '새로 고침'으로 자동 업데이트.
- 다양한 데이터 소스: 엑셀, CSV, 데이터베이스, 웹 등 다양한 곳의 데이터를 손쉽게 연결.
- 데이터 결합:
여러 시트나 파일의 데이터를 하나로 병합하거나 추가하여 분석.
공공데이터 포털 : https://www.data.go.kr/
전자 공시 사이트 : https://dart.fss.or.kr/
거래소 : https://data.krx.co.kr/contents/MDC/MAIN/main/index.cmd
'업무 자동화 > AI' 카테고리의 다른 글
| 기계학습 용어들 (0) | 2026.03.26 |
|---|---|
| 기계학습 (머신러닝(Machine Learning)) 개념 (0) | 2026.03.26 |
| 머신러닝의 작동 원리 (0) | 2026.03.11 |
| 회귀 분석(Regression Analysis) 이란? (0) | 2026.03.11 |
| 데이터 표준화, 정규화 의미 (0) | 2026.03.08 |