coursera의 Supervised Machine Learning: Regression and Classification 강좌 내용입니다.


즉, 지도 학습 알고리즘은 인풋과 아웃풋 혹은 (x,y)매핑을 예측하는 것을 학습한다.

예로, part1에서는 지도 학습 유형 중 하나인 regression(회귀) 알고리즘을 통해 무한한 숫자중 특정 숫자를 예측하는 것을 배웠다. 또 두번째 유형으로는 classification(분류) 알고리즘이 있다.

 

<classification 예시 : 유방암 검사>

데이터 [종양의 크기, 양성 여부[0/1]

데이터를 토대로 그린 그래프

출력은 0 혹은 1, 즉 양성 혹은 악성으로 나온다. 회귀와 달리 이번에는 두가지로만 결과가 출력된다. 

 

 

그렇기 때문에 위와 같이 그래프를 수정하면 좀 더 결과가 보기 쉬워진다. 암일 경우 종양의 크기가 크다는 걸 알 수 있다.

 

또한 암이 한종류 더 있을 때는 이런 모양의 그래프도 나올 수 있고 종양의 크기는 평균일 때 많이 나온다는 걸 알 수 있다.

 

 


Classification 예제를 통해 output 클래스 및 output 카테고리들이 종종 상호교환적으로 사용된 걸 알 수 있었다.

즉 아웃풋을 나타낼 때 클래스나 카테고리는 같은 것을 의미한다.

 

Classification 알고리즘은 범주(카테고리)를 예측한다. 또 카테고리는숫자일 수도 있으나 숫자일 필요가 없다.

작은 숫자내에서 출력값이 나온다는 점이 회귀와 다르다.


<classification 예시2 : 유방암 검사>

 

이번에는 데이터 세트에 [나이 : 종양 크기]를 가지고 있다.

데이터를 토대로 만든 그래프(o : 양성 종양, x:악성 종양)

위 그래프를 토대로 의사는 종양의 사이즈와 환자의 나이를 기록하여 해당 환자가 암일지 아닐지 예측 하려고 한다.

 

 

그러기 위해서는 저 그래프를 분리시키는 하나의 경계를 나누어야 할 것이다. 따라서 경계를 나눌 학습 알고리즘이 필요하다.

 

또 머신 러닝 문제에서는 종종 더 많은 입력값이 필요하다. 종양의 두께, 세포 모양의 균일성 등...


지도 학습

-입력 x를 출력 y로 맵핑

-주어진 정답을 통해 학습

-regression : 숫자를 예측하며 아웃풋에 무한한 가능성이 있다.

-classification : 카테고리를 예측하며, 아웃풋은 한정되어 있다.

 


Q. Supervised learning is when we give our learning algorithm the right answer y  for each example to learn from.  Which is an example of supervised learning?

1.Spam filtering.

2.Calculating the average age of a group of customers.

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 2  (0) 2023.04.27
Unsupervised learning part 1  (0) 2023.04.27
Supervised learning part 1  (0) 2023.04.27
What is machine learning?  (0) 2023.04.27

+ Recent posts