oursera의 Supervised Machine Learning: Regression and Classification 강좌 내용입니다.
지도 학습
지도 학습은 x를 배우는 알고리즘을 사용하여 y라는 값을 나타내려고 할 때 사용한다.
고로 '맞은 정답(값)'을 학습 데이터로 사용하며, x(입력)에 맞는 y(라벨)를 연결지어 가며 기계를 학습시켜
합리적으로 정확한 예측 또는 추측을 가능하게 한다.
<예시>
| input (X) | input (Y) | Application(응용 프로그램) |
| 이메일 | 스팸 여부?(0/1) | 스팸 필터링 |
| 오디오 | 문자 입력 | 음성 인식 |
| 영어 | 스페인어 | 머신 번역 |
| 광고, 유저 정보 | 클릭 여부?(0/1) | 온라인 광고 |
| 이미지, 레이더 정보 | 다른 차의 위치 | 자가 주행 자동차 |
| 핸드폰 이미지 | 결함 여부?(0/1) | 시각 검사(visual inspection) |
응용 프로그램을 사용하기 위해 우리는 먼저 예제(x에 대한 올바른 답변 라벨 y)를 통해 훈련을 시킨 모델을 만들어야 한다.
훈련 후, 예제에 포함돼있지 않던 a라는 새로운 값을 인풋으로 넣고 적절한 y를 낼 수 있는지 확인 해본다.
예시로 '주택 가격 별 집의 크기'를 예측하고 싶다고 해보자. 그걸 위하여 몇 데이터를 수집했다. [집의 크기 : 집의 가격]

그러하여 위와 같은 그래프를 만들었다. 이중 한 친구가 750피트의 집의 가격을 궁금해할 때 어떻게 가격을 알아낼 수 있을까? = 지도 알고리즘을 어떻게 활용할 수 있을까?

데이터 분포를 토대로 직선과 곡선을 그려볼 수 있는데, 그러면 750피트의 집은 저 두 사이에 가격이 형성될 거라고 예측 할 수 있다.
이번 예제에서는 직선/곡선 외에 다른 방법을 선택할 수도 있지만 이 예제에는 직선/곡선이 가장 체계적으로 맞았다.
이렇게 상황에 따라 맞는 알고리즘을 선택해야 한다. 알맞은 알고리즘이 더 알맞은 정답을 제공한다.
-이번 과정에서 사용했던 지도 학습의 알고리즘은 Regression(회귀)로 x,y 값을 통해 수많은 수 중에서 특정 숫자를 예측하는 것이다.
-그리고 750피트의 집이라는 인풋(x)을 넣어서 가격을 알아내는 지도 학습 문제를 classification이라고 한다ㅏ.
'machine_learning > [coursera] Machine learning' 카테고리의 다른 글
| Jupyter Notebooks (0) | 2023.04.27 |
|---|---|
| Unsupervised learning part 2 (0) | 2023.04.27 |
| Unsupervised learning part 1 (0) | 2023.04.27 |
| Supervised learning part 2 (0) | 2023.04.27 |
| What is machine learning? (0) | 2023.04.27 |