데이터 라벨링하는 이유

 

훈련되지 않은 장치에 이미지 라벨링을 통해 장치가 객체를 인지할 수 있게 해주는 작업

 

라벨링 박스

객체 전체를 잡되 타이트하게 잡아라

눈에 좀 보인다 싶으면 다 잡아라 (블러되어있거나 어느정도 가려져있거나 못하겠다 싶은 것은 검은 박스로 가려버려라)

 

bbox는 [x,y,w,h] 또는 [x1,y1,x2,y2]로 두점 좌표로 구성 되어있지만( yolo는 bbox의 중간 위치가 좌표값으로 사용된다 [x_center, y_center, w, h] 이때 좌표 값으로 보통 이미지내 절대적인 픽셀 위치가 아닌 이미지에 대한 상대적 값 사용)

polygon은 다각형 모양으로 객체의 가시영역 외곽선을 따라 점을 찍어 그리는 라벨링 방법

polyline은 여러 개의 점을 가진 선을 활용하여 특정 영역을 라벨링하여 인도/차선 구분 

point는 특정 지점을 라벨링하는 작업으로 안면 인식을 통한 감정인식 등에 사용

 

 

 

학습 목적에 따라 라벨링(labeling) 또는 어노테이션(annotation)으로 데이터를 준비

-분류(Classification): 분류 작업에서는 주어진 이미지에 대해 단일한 라벨 정보만 필요. 이 경우 라벨링(labeling) 작업을 수행

-객체 탐지(Detection): 객체 탐지 작업에서는 이미지 내의 개별 객체를 탐지하고, 객체의 위치와 경계 상자(bounding box) 등의 메타 정보를 기록. 이를 위해 주로 어노테이션(annotation) 파일을 사용하며, 개별 객체의 위치와 클래스 라벨을 기록

-시맨틱 세그멘테이션(Semantic Segmentation): 시맨틱 세그멘테이션은 이미지를 픽셀 단위로 분할하여 각 픽셀이 어떤 클래스에 속하는지 알려주는 작업입니다. 각 픽셀에 대한 클래스 라벨을 기록하기 위해 어노테이션(annotation) 파일이 사용. 픽셀 단위의 라벨 정보를 기록하여 이미지를 세그멘테이션하는 것 (instance segmentation은 또 다른 것임, 각 객체에 대한 정보)

 

어노테이션(Annotation)은 이미지 처리 작업에서 추가적인 정보를 기록하기 위한 양식. 주로 JSON이나 XML 형식으로 표현되며, 때에 따라 CSV나 TXT 등의 형식도 사용될 수 있음

 

 

라벨링 툴

1. makesense : 브라우저 형태로 사용가능한 라벨링 도구

2. Roboflow : 브라우저 형태로 사용가능한 라벨링 도구

 

json 파일

 데이터를 구조화하여 저장하고 교환하기 위한 경량의 데이터 형식

xml 파일

데이터를 저장하고 전송, 데이터와 그 구조를 기술하는데 사용, 속성과 값으로 구성, 계층 구조로 구성

 

 

'machine_learning' 카테고리의 다른 글

데이터 가공 구축 프로세스  (0) 2023.06.22
데이터셋과 데이터로더, Pytorch 설치  (1) 2023.06.16
데이터 수집과 전처리  (0) 2023.06.14
통계 - 인자분석  (0) 2023.06.02
통계 - 주성분 분석(PCA)  (0) 2023.06.01

+ Recent posts