기계 학습에는 크게 4가지 유형이 있다. 그 4가지 유형은 각각
- 지도 학습
- 비지도 학습
- 준지도 학습
- 강화 학습 이다.
지도 학습(Supervised Learning)이란, 데이터와 정답의 역할을 하는 레이블을 제공받아 컴퓨터가 학습하는 것이다. 답이 주어진 데이터를 활용하여 학습하므로, 입력을 출력에 매핑하는 일반적인 규칙을 학습하는 것이다. 대표적인 지도 학습으로는 classification과 regression을 꼽을 수 있다.
비지도 학습(Unsupervised Learning)이란, 지도 학습과 달리 외부에서 정답이 주어지지 않고 학습 알고리즘이 스스로 입력으로부터 어떤 구조나 규칙을 발견하는 학습이다. 대표적인 비지도 학습으로는 clustering을 꼽을 수 있다. clustering은 주어진 데이터를 특성에 따라 둘 이상의 그룹으로 나누는 것이다.
준지도 학습(Semi-supervised Learning)이란, 일부 데이터에만 레이블을 부여하여 학습시키는 방법이다. 보통 우리가 실제로 구하는 데이터에는 레이블(정답)이 없는 경우가 많다. 레이블은 일반적으로 사람이 부여한다. 대규모 데이터에 일일이 레이블을 부여하는 것은 매우 어려운 일이다. 이런 경우, 일부의 데이터에만 레이블을 부여하는 것만으로도 전체적인 학습의 정확도를 높일 수 있다. 즉, 레이블 정보를 가진 소수의 데이터와, 레이블 정보가 없는 다수의 데이터를 함께 이용하여 학습을 수행하는 것이다.
강화 학습(Reinforcement Learning)이란, 보상 및 처벌의 형태로 학습 데이터를 주어 학습하는 형태를 말한다. 주로 차량 운전이나 바둑, 체스와 같은 상대방과의 동적인 경기 상황에서 프로그램의 행동에 따른 피드백을 보상, 처벌의 형태로 제공하는 것이다. 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화 하는 행동 혹은 순서를 선택하는 정책을 만들어 가는 방식이다.
위의 4가지 유형은 모델을 학습시키는 방법에 따른 분류였다. 이외에도, 다양한 기준에 따라 유형을 분류하기도 한다. 예시로, 오프라인/온라인 학습, 분별/생성 모델이라는 분류도 있다. 특히 분별 모델은 부류 예측에만 관심이 있는 모델이다. 즉, P(y|x) - x가 주어지면 y에 속할 확률의 추정에만 관심이 있는 것이다. 생성 모델은 P(x), P(x|y)를 추정한다. 즉, 생성 모델은 새로운 샘플을 생성할 수 있다. 대표적인 생성 모델로 GAN을 꼽을 수 있다.