객체탐지2

jinny95 2023. 7. 21. 16:12

2023. 7. 21. 16:12

그리드 생성:
- 입력 이미지를 여러 개의 작은 그리드 셀로 분할합니다.
- 그리드 셀은 모두 동일한 크기로 나누어지며, 일반적으로 정사각형 형태로 나눕니다.
중심점 찾기:
- 각 그리드 셀 내에서 물체의 중심점을 예측합니다.
- 중심점은 물체의 위치를 나타내는 값으로 사용됩니다.
- 예를 들어, 물체가 그리드 셀의 왼쪽 상단에 있으면 중심점은 해당 그리드 셀의 중심을 기준으로 물체의 위치를 나타내는 값이 됩니다.
앵커 박스 그리기:
- 앵커 박스는 사전에 미리 정의된 크기와 종횡비를 가지는 작은 바운딩 박스입니다.
- 각 그리드 셀에서 여러 개의 앵커 박스를 적용하여 물체를 예측합니다.
- 앵커 박스의 크기와 종횡비는 다양한 물체를 대표하도록 사전에 정의되어 있습니다.
예측 결과:
- 그리드 셀 내에서 예측된 중심점과 앵커 박스를 기반으로 실제 물체의 위치와 크기를 결정합니다.
- 예측된 중심점과 앵커 박스를 조합하여 최종적으로 물체의 바운딩 박스를 얻습니다.

객체 탐지 모델은 yolo, SSD를 많이 쓴다.

YOLO와 SSD에서 쓰는 알고리즘은 ONE-stage로 이미지 하나를 한번에 탐지하는 방식이다. 빠르지만 TWO_Stage알고리즘에 비해 성능은 떨어질 수 있다

One-stage 기본 동작 원리

앵커 박스 생성

앵커 박스 : 크기, 종횡비, 개수, 특성맵, 위치로 구성

장점 : 앵커 박스 중복 겹침 제거와 정확도 향상, 객체의 위치를 정렬하여 학습, 실시간 객체 탐지

앵커 박스를 객체 탐지 모델에 적용하는 방법

앵거 박스 설정

- 앵커박스의 크기와 종횡비 설정 (k-means 클러스터링 또는 수동으로 박스 크기 결정)

- 앵커박스는 보통 2개 이상의 크기와 종횡비를 갖는다

데이터 전처리

- 추출한 객체의 크기와 종횡비를 정규화하여 데이터 추출-> k-means알고리즘에 도움

k_means 알고리즘 적용

- 정규화된 데이터를 k-means 클러스트링 알고리즘에 적용

앵커 박스의 종횡비 결정

최종 앵커박스 생성

모델에 앵커박스 적용

객체 탐지 수행

JINHEE's lab