no idea 또는 약간 어떻다 이런 식의 결과를 도출해 내는 문제에 접근할 때 사용한다 데이타를 가지고 structure를 파생할 수 있는데 그 데이타라는 것이 어떤 변수들로 인해서 만들어내는지에 대한 효력에 대해 필연에 의해 알지 못하는 데이타들일 것이다. 데이타에 있는 변수들 사이에 관계들을 기반으로 해서 데이타를 clustering 하는 구조로 만들어 낼 수 있다. unsupervised learning으로는 예측결과들을 바탕으로 한 feedback을 할 수 없다. 예제 : Clustering : 1,000,000 개의 다른 유전자들의 콜렉션을 가지고 있고, 유전자들을 자동으로 그룹화할 수 있는 방법을 찾는 데 이는 다소 다른 값들 - 생명주기, 역할, 지역 등- 에 의해 관련되거나 유사할 수 있..
정답이 있는 데이타셋이 주어지고, input 과 output의 관계가 어떨것이다라는 생각을 가지고 접근하는 algo 문제는 "regression"과 "classification" 으로 나눌 수 있는데, regression 문제는 아웃풋으로 내 놓는 값들이 계속적으로 달라질 수 있는 값들사이에서 결과를 예측하는 것이다 즉, input 값들을 continunous function에 맵핑시켜서 결과를 만들어내는 것을 말하며, classification 문제는 결과값이 discrete 값으로 출력되고 이를 예측하는 것이다. 다른 말로하면, input 값들을 discrete 카테고리들 사이에서 매핑하고자하는 것이다. 예제 1: 부동산 시장에서 집들의 가격들이 나와있는 데이타들이 주어져있고, 어떠한 집을 팔려고 할..
어떤 특별한 알고리즘에 개의치 않는 머신러닝에 적용할 수 있는 몇가지 기능적인 결과를 보여주고 연산적이고 통계적인 이론으로부터의 결과들과 몇가지 기능적인 접근들을 정의하고 재생산할 수 있도록 한다. * 표본 복잡도의 학습을 하기 위한 기본이 되는 이론적인 프레임웍을 설명한다. * Probably Approximately Correct (PAC) 학습 프레임웍을 설명한다. * Vapnik-Chervonenkis (VC) dimenstion 프레임웍을 설명한다. * Mistake Bounds 프레임웍을 설명하고 WINNOW 알고리즘을 적용한다. * "No Free Lunch" 와 "Ugly Duckling" 정리를 보여준다. 추론학습에 적용할 일반적인 법칙이 있는가? 연산적인 학습이론과 통계적인 학습이론으로..