Conventional Programming
- input, program을 주었을 때 output를 출력
Machine Learning
- input, output을 주었을 때 program을 출력
- 주어진 데이터에서 선형함수를 어떻게 표현해야 오차를 최소화할 수 있는지를 탐색
Supervised Learning
- direct feedback
- (x, y) pair로써 데이터가 존재
- (ex) classification, regreesion
- given target output (labels, responses)
- 새로운 input에 대하여 옳은 output를 예측하는 것
- y = f(x)
Reinforcement Learning (강화 학습)
- undirect feedback
- (state, action) 로써 데이터가 존재
- 주어진 state에서 reward를 고려하여 가장 최적의 action을 선택
- (ex) game AI, real-time decisions, Robot Navigation
- y = f(x) that maximizes r
Unsupervised Learning
- without teacher
- no feedback
- (ex) Dimensionality Reduction, Clustering
- f(x)