티스토리 뷰
X(i) : 입력변수, Y(i) : 출력변수
(X(i), Y(i)) : training set --> 학습하는데 사용하게 될 데이타셋
supervised learning problem을 좀 더 형식적으로 설명하기 위해, 우리의 목표는 training set을 받는 것이고 h : X ---> Y 함수를 학습시키는 것이다 그래서 h(x) 는 y 에 해당하는 값을 위한 "good" predictor 이다
우리가 예측하고자 하는 타겟변수가 continuous할 때, 부동산 가격예제 처럼, 우리는 이 learning problem을 regression problem이라고 부른다. y 가 작은 discrete 값들의 형태로 보여준다면 (예를 들어, 거주지가 하우스인지 아파트인지) 이는 classification problem이라고 부른다.
댓글