본문 바로가기
  • Welcome!
Creo Reference Room/Preferences

Orange3] Model #2 - CN2 Rule Induction

by ToolBOX01 2025. 4. 9.
반응형

▣ CN2 Rule Induction:

머신러닝의 규칙 기반 학습(rule-based learning) 알고리즘 중 하나로, 데이터를 분석해 "if-then" 형식의 분류 규칙을 생성합니다. 이 방식은 사람이 이해하기 쉬운 형태의 결과를 제공하는 것이 큰 장점입니다.
주어진 학습 데이터를 바탕으로 간단하고 이해하기 쉬운 규칙 집합을 만들어서 데이터를 분류 할수 있습니다.

▷CN2 Rule Induction  사용 예시

꽃잎의 길이와 너비 등을 이용하여 아이리스(Iris)의 품종을 예측하는 규칙 기반 모델(CN2 Rule Induction)을 만들어본다.

[데이터]

▷규칙 예시 (CN2 Rule Induction 결과)

IF petal length ≤ 2.0 THEN class = Setosa
IF petal length > 2.0 AND petal width ≤ 1.6 THEN class = Versicolor
IF petal length > 4.8 AND petal width > 1.6 THEN class = Virginica


Orange3의 워크플로 예제 스크린샷

▷ 워크플로 구성 요소 설명:

1. File
- 데이터셋 불러오기 (예: Iris)
2. CN2 Rule Induction
- 규칙 기반 모델 생성
3. Test & Score
- 모델의 성능 평가 (정확도 등)
4. Rules
- 생성된 규칙을 사람이 이해할 수 있는 형태로 출력


CN2 Rule Induction 알고리즘이 분류 문제를 해결하는 데 있어 몇 가지 독특한 장점을 제공합니다. CN2는 단순하고 이해하기 쉬운 "if 조건 then 클래스 예측" 형태의 규칙을 생성하도록 설계된 분류 기법으로, 특히 다음과 같은 이유로 유용합니다:

  1. 단순성과 해석 가능성: CN2는 복잡한 데이터에서도 직관적이고 사람이 읽을 수 있는 규칙을 생성합니다. 이는 데이터 분석가나 도메인 전문가가 결과를 쉽게 이해하고 활용할 수 있도록 돕습니다.
  2. 노이즈 처리 능력: CN2는 학습 데이터에 노이즈(오류나 불완전한 데이터)가 포함되어 있어도 효과적으로 작동합니다. 이는 현실 세계의 데이터가 완벽하지 않은 경우가 많기 때문에 큰 장점입니다.
  3. 유연한 규칙 생성: CN2는 순서가 있는 규칙(ordered rules, 즉 의사결정 리스트)과 순서가 없는 규칙(unordered rules, 즉 규칙 집합)을 모두 생성할 수 있어, 문제의 특성에 따라 적합한 접근 방식을 선택할 수 있습니다.
  4. 별개-정복 전략: CN2는 "separate-and-conquer" 전략을 사용하여 데이터를 점진적으로 분할하고 규칙을 학습합니다. 이는 복잡한 문제를 작은 부분으로 나누어 해결하는 데 효과적입니다.
  5. ORANGE 3와의 통합성: ORANGE 3는 시각적 프로그래밍 환경을 제공하며, CN2 Rule Induction은 이 환경에서 모델을 학습하고 결과를 시각적으로 확인하는 데 적합합니다. 예를 들어, CN2 Rule Viewer 위젯을 통해 생성된 규칙을 쉽게 검토할 수 있습니다.

 

'Creo Reference Room > Preferences' 카테고리의 다른 글

Orange3] Model #4-k-NN(k-Nearest Neighbors)  (0) 2025.04.10
Orange3] Model #3-Calibrated Learner  (0) 2025.04.10
Orange3] Model #1  (0) 2025.04.08
Creo Schematic 이란?  (0) 2025.04.07
데이터 시각화란?  (0) 2025.04.02