본문 바로가기
  • You find inspiration to create your own path !
업무 자동화/AI

기계학습 (머신러닝(Machine Learning)) 개념

by ToolBOX01 2026. 3. 26.
반응형

■ 기계학습 정의

기존의 컴퓨터 프로그래밍이 사람이 정해준 규칙(If-Then)에 따라 움직였다면, 머신러닝은 컴퓨터가 데이터를 통해 스스로 학습하여 패턴을 찾아내고 미래를 예측하는 기술을 말합니다.

*기계지능 (Machine Intelligence)
전통적인 의미에서의 기계지능은 주로 규칙 기반(Rule-based) 시스템을 의미합니다.

1. 특징: 사람이 모든 경우의 수를 생각하여 If-Then 형태의 조건문으로 컴퓨터에게 명령을 내립니다.

2. 한계: 질문자가 제시하신 것처럼 사전에 등록되지 않은 미지의 질문이나 상황이 발생하면 컴퓨터는 
         판단 근거가 없어 대응이 불가능합니다.

3. 예시: 간단한 챗봇이나 초기 체스 프로그램 (정해진 길로만 움직임)

 

기계학습 (머신러닝(Machine Learning))은 데이터 속에서 스스로 규칙을 찾아내는 방식입니다.

  1. 특징:
    수많은 데이터를 입력하면 컴퓨터가 통계적인 기법을 사용하여 데이터 간의 관계를 하나의 수식(모델)으로 만들어냅니다.
  2. 장점:
    명시적인 가이드라인이 없어도 새로운 데이터가 들어왔을 때 기존에 학습한 수식을 바탕으로 스스로 결과를 유추합니다.
  3. 수식의 역할:
    y = f(x) 라는 구조에서 데이터 x를 넣었을 때 최적의 정답 y를 내놓기 위해 함수 f()를 찾아가는 과정이 곧 학습입니다.

■ 인공지능과의 관계

흔히 혼용되지만, 엄밀히 따지면 포함 관계가 존재합니다. 

  • 인공지능(AI): 가장 넓은 개념 (기계가 지능을 갖게 하는 모든 기술)
  • 머신러닝(기계학습): 인공지능의 한 분야 (데이터 기반 학습)
  • 딥러닝(Deep Learning): 머신러닝의 한 종류 (인간의 뇌 구조를 본뜬 인공신경망 활용)

 

 


■ 기계학습과 목적

데이터에서규칙을 찾아내어 수식으로 표현하는 모델(알고리즘, 함수)을 추출하는 것 입니다. [데이터 입력 → 파라미터 추정(학습) → 오차 계산 및 확인(검증)]의 흐름을 통해 최적의 수식(모델)을 만들어가는 과정입니다.

1. 학습 과정 (Training Process)

모델이 데이터의 특성을 파악하여 규칙을 정립하는 단계입니다.

  • 방법: 샘플 데이터를 사용하여 입력(Input)과 출력(Output) 간의 관계를 분석합니다.
  • 결과: 데이터의 특징을 가장 잘 나타내는 파라미터(매개변수)의 추정값을 찾아냅니다.

 

* 엑셀 구성 요소와 기계학습의 매칭 (파라미터(매개변수)란?)

예시 데이타

번호 세대주 이름 면적 층수 세대주구성 화장실 수 호 수
1 홍길동 25 3 2 1 301
2 김말자 104 12 5 2 1201

 

엑셀의 요소 기계학습에서의 의미
예시 (아파트 가격 예측)
행 (Row) 데이터 샘플 (Sample)
아파트 1채의 정보 (101동 1호)
열 (Column) 특징 (Feature, x)
면적, 층수, 준공 연도
파라미터 (Parameter) 가중치 (Weight, w)
면적이 가격에 미치는 영향력(수치)

 

기계학습의 목표는 y = ax + b라는 수식을 찾는 것과 같습니다. 여기서 파라미터는 바로 ab입니다.

 

  • x (입력값): 엑셀의 각 열에 들어있는 값 (예: 면적 84m^2)
  • y (출력값): 우리가 알고 싶은 결과 (예: 매매가 10억)
  • 파라미터 (a, b): 면적(x)에 얼마를 곱해야(a) 실제 가격(y)과 비슷해지는지를 나타내는 고정된 값입니다.

 

 

엑셀 시트에 1,000개의 아파트 거래 기록(1,000개의 행)이 있다고 가정해 보겠습니다.

  • 기계학습은 이 1,000개의 행을 모두 분석해서,
  • "보통 면적에 1,200만 원(a)을 곱하고 5,000만 원(b)을 더하면 가격이 나오네!"라는 단 하나의 규칙(a, b)**을 찾아내는 과정입니다.
  • 이때 찾은 1,200만 원5,000만 원이 바로 파라미터의 추정값입니다.

 

2. 검증 과정 (Validation Process)

학습된 모델이 얼마나 정확한지 성능을 확인하는 단계입니다.

  • 방법: 학습에 사용하지 않은 새로운 데이터(미사용 데이터)를 모델에 대입합니다.
  • 비교: 모델이 내놓은 추정 결과값과 실제 데이터의 실제 출력값을 대조합니다.
  • 평가: 두 값의 차이를 바탕으로 오차율을 계산하여 모델의 신뢰도를 평가합니다.
반응형