더보기
  1. 그리드 생성:
    • 입력 이미지를 여러 개의 작은 그리드 셀로 분할합니다.
    • 그리드 셀은 모두 동일한 크기로 나누어지며, 일반적으로 정사각형 형태로 나눕니다.
  2. 중심점 찾기:
    • 각 그리드 셀 내에서 물체의 중심점을 예측합니다.
    • 중심점은 물체의 위치를 나타내는 값으로 사용됩니다.
    • 예를 들어, 물체가 그리드 셀의 왼쪽 상단에 있으면 중심점은 해당 그리드 셀의 중심을 기준으로 물체의 위치를 나타내는 값이 됩니다.
  3. 앵커 박스 그리기:
    • 앵커 박스는 사전에 미리 정의된 크기와 종횡비를 가지는 작은 바운딩 박스입니다.
    • 각 그리드 셀에서 여러 개의 앵커 박스를 적용하여 물체를 예측합니다.
    • 앵커 박스의 크기와 종횡비는 다양한 물체를 대표하도록 사전에 정의되어 있습니다.
  4. 예측 결과:
    • 그리드 셀 내에서 예측된 중심점과 앵커 박스를 기반으로 실제 물체의 위치와 크기를 결정합니다.
    • 예측된 중심점과 앵커 박스를 조합하여 최종적으로 물체의 바운딩 박스를 얻습니다.

 

 

 

 

객체 탐지 모델은 yolo, SSD를 많이 쓴다.

 


YOLO와 SSD에서 쓰는 알고리즘은 ONE-stage로 이미지 하나를 한번에 탐지하는 방식이다. 빠르지만 TWO_Stage알고리즘에 비해 성능은 떨어질 수 있다

 

 

One-stage 기본 동작 원리


앵커 박스 생성

앵커 박스 : 크기, 종횡비, 개수, 특성맵, 위치로 구성

장점 : 앵커 박스 중복 겹침 제거와 정확도 향상, 객체의 위치를 정렬하여 학습, 실시간 객체 탐지

 

 


앵커 박스를 객체 탐지 모델에 적용하는 방법

앵거 박스 설정

- 앵커박스의 크기와 종횡비 설정 (k-means 클러스터링 또는 수동으로 박스 크기 결정)

- 앵커박스는 보통 2개 이상의 크기와 종횡비를 갖는다

 

데이터 전처리

- 추출한 객체의 크기와 종횡비를 정규화하여 데이터 추출-> k-means알고리즘에 도움

 

k_means 알고리즘 적용

- 정규화된 데이터를 k-means 클러스트링 알고리즘에 적용

 

앵커 박스의 종횡비 결정

 

최종 앵커박스 생성

 

모델에 앵커박스 적용

 

객체 탐지 수행

 

 


 

+ Recent posts