oursera의 Supervised Machine Learning: Regression and Classification 강좌 내용입니다.


지도 학습 

지도 학습은  x를 배우는 알고리즘을 사용하여 y라는 값을 나타내려고 할 때 사용한다.

고로 '맞은 정답(값)'을 학습 데이터로 사용하며, x(입력)에 맞는 y(라벨)를 연결지어 가며 기계를 학습시켜

합리적으로 정확한 예측 또는 추측을 가능하게 한다.

 

<예시>

input (X) input (Y) Application(응용 프로그램)
이메일 스팸 여부?(0/1) 스팸 필터링
오디오 문자 입력 음성 인식
영어 스페인어 머신 번역
광고, 유저 정보 클릭 여부?(0/1) 온라인 광고
이미지, 레이더 정보 다른 차의 위치 자가 주행 자동차
핸드폰 이미지 결함 여부?(0/1) 시각 검사(visual inspection)

응용 프로그램을 사용하기 위해 우리는 먼저 예제(x에 대한 올바른 답변 라벨 y)를 통해 훈련을 시킨 모델을 만들어야 한다.

 

 

훈련 후, 예제에 포함돼있지 않던 a라는 새로운 값을 인풋으로 넣고 적절한 y를 낼 수 있는지 확인 해본다.

예시로 '주택 가격 별 집의 크기'를 예측하고 싶다고 해보자. 그걸 위하여 몇 데이터를 수집했다. [집의 크기 : 집의 가격]

그러하여 위와 같은 그래프를 만들었다. 이중 한 친구가 750피트의 집의 가격을 궁금해할 때 어떻게 가격을 알아낼 수 있을까? = 지도 알고리즘을 어떻게 활용할 수 있을까?

데이터 분포를 토대로 직선과 곡선을 그려볼 수 있는데, 그러면 750피트의 집은 저 두 사이에 가격이 형성될 거라고 예측 할 수 있다. 

 

이번 예제에서는 직선/곡선 외에 다른 방법을 선택할 수도 있지만 이 예제에는 직선/곡선이 가장 체계적으로 맞았다.

이렇게 상황에 따라 맞는 알고리즘을 선택해야 한다. 알맞은 알고리즘이 더 알맞은 정답을 제공한다.


 

-이번 과정에서 사용했던 지도 학습의 알고리즘은 Regression(회귀)로 x,y 값을 통해 수많은 수 중에서 특정 숫자를 예측하는 것이다.

 

-그리고 750피트의 집이라는 인풋(x)을 넣어서 가격을 알아내는 지도 학습 문제를 classification이라고 한다ㅏ.

 

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 2  (0) 2023.04.27
Unsupervised learning part 1  (0) 2023.04.27
Supervised learning part 2  (0) 2023.04.27
What is machine learning?  (0) 2023.04.27

+ Recent posts