Scikit-Learn
- 파이썬 기반의 다른 머신러닝 패키지도 사이킷런 스타일의 API를 지향할 정도로 쉽고 가장 파이썬스러운 API 제공
- 머신러닝을 위한 매우 다양한 알고리즘
- 개발을 위한 편리한 프레임워크와 API
- 매우 많은 환경에서 사용되는 성숙한 라이브러리
- 주로 Numpy와 Scipy 기반 위에서 구축된 라이브러리
Machine Learning 용어
Feature?
- 데이터 세트의 일반 속성
- 머신러닝은 타겟값을 제외한 나머지 속성을 모두 Feature로 지칭
레이블, 클래스, 타겟값, 결정값
- 타겟값 또는 결정값은 지도학습시 데이터의 학습을 위해 주어지는 정답 데이터
- 지도학습 중 분류의 경우에는 결정값을 레이블 또는 클래스로 지칭
지도학습
- **Classification(분류)**는 대표적인 지도학습(Supervised Learning) 방법의 하나
- 학습을 위한 다양한 피처와 분류 결정값인 레이블 데이터로 모델을 학습 후 별도의 테스트 데이터 세트에서 미지의 레이블을 예측함.
- 지도학습은 명확한 정답이 주어진 데이터를 먼저 학습한 뒤 미지의 정답을 예측하는 방식임.
- 학습을 위해 주어진 데이터 세트 = 학습 데이터 세트