coursera의 Supervised Machine Learning: Regression and Classification 강좌 내용입니다.


비지도 학습은 출력값(output = y)가 제공되지 않는다.

예를 들면 지도학습의 예시에서는 인풋으로 종양의 크기, 나이등의 데이터와 라벨[종양이 악성인지 양성인지]을 학습 데이터로 사용했다. 비지도 학습에서는 환자의 나이와 종양의 사이즈에 대한 인풋은 주어지지만 종양이 양성인지 악성인지에 대한 라벨이 자료로 제공되지 않는다. 그렇기에 우리는 비지도 학습을 통해 환자의 나이와 종양 사이즈에 대한 그래프는 그려도 그 종양이 양성인지 악성인지는 알 수 없다. 대신 어떤 패턴이나 구조를 찾아낼 수 있다.

 

우측 그래프를 보면 데이터를 두가지 군집(clustering)으로 나눌 수 있다. 이렇게 군집으로 나누는 것이 전형적인 비지도 학습이라고 할 수있다.


clustering

 

예시1. 구글 뉴스

 구글 뉴스 관련된 뉴스끼리 묶어 보여주는 데에서 사용된다. 구글 뉴스는 상단에 해드라인이 있고 그 아래 관련된 다른 기사들이 있다. 헤드 라인에 나타난 키워드들로 알고리즘이 알아서 추측하여 클러스트링을 한 것이다.

 

예시2. DNA 데이터

각각의 행은 한 사람의 DNA  특징을 순서대로 정리한 데이터를 갖고 있다. 즉 어떤 열을 보면 여러 사람의 특정 DNA 특성(예를 들면 눈동자 색 혹은 키에 영향주는 유전자)을 알 수 있다. 

즉 아래의 Micro array은 개인의 활성화된 DNA 혹은 발현되지 않은 특정 DNA 등을 알 수 있고 각각의 데이터를 컬러로 구분해 두었다.

 

이 데이터 타입들을 통해 비지도 학습 알고리즘은 특성을 나누어 열(사람들)을 여러 타입으로 나누어 정리할 수 있다.

 

 

예시3.  AI 학습 사이트에서 고객들의 정보를 군집화할 때

 

첫번째 군집의 동기는 기술을 키우기 위한 지식을 찾고 있다, 두번째 군집은 경력을 개발하고 싶어한다. 세번째 그룹은 AI가 업데이트 되기를 기다린다.

 


비지도 학습

라벨 없이 데이터를 가져와 자동적으로 군집으로 그룹화 시키는 것

'machine_learning > [coursera] Machine learning' 카테고리의 다른 글

Jupyter Notebooks  (0) 2023.04.27
Unsupervised learning part 2  (0) 2023.04.27
Supervised learning part 2  (0) 2023.04.27
Supervised learning part 1  (0) 2023.04.27
What is machine learning?  (0) 2023.04.27

+ Recent posts