객체 인식이란?
이미지를 해석하는 컴퓨터 비전 분야에서 객체 인식은 이미지나 비디오에서 특정 객체 자동 감지하고 분류하는 것을 뜻함
이미지 데이터(픽셀의 배열로 3채널로 구성)를 기반으로 수행하고 특징을 추출한다, 이를 기계학습 또는 딥러닝(특히 합성곱)신경망을 통해 진행한다.
응용분야:
자율 주행, 보안 시스템, 로봇 공학, 의료 영상 분석, AR, 제조 및 자동화
이미지 처리, 픽셀 기본 정리
이미지 처리: 컴퓨터 비전 분야에서 디지털 이미지의 품질을 향상시키거나 원하는 정보를 추출하기 위해 다양한 기법을 사용하는 과정
픽셀(picture element): 디지털 이미지를 구성하는 가장 작은 단위, 각 픽셀은 3가지 층(채널)로 이루어져있다(RGB), 흑백 이미지의 경우 밝기 값만 가지며 1채널을 가진다.
이런 픽셀의 위치와 색상 정보를 통해 디지털 이미지가 표현, 이미지 처리를 한다는 것은 즉 이런 픽셀의 값을 조절하거나 필터링 명암조절을 하는 것과 같다.
픽셀의 구조


픽셀 처리 기법:
-밝기 조정
-명암 대비
-필터링
-색 공간 변환 (rgb에서 hsv로 변환이 가장 대표적 색 공간 변환 방법)
특징 추출
이미지나 영상에서 식별가능한 부분을 수학적으로 주변정보와 차이 계산하여 추출한다.
이를 다양한 컴퓨터 비전 작업에 전처리 단계로 사용한다.
특징 추출을 통해 데이터 차원을 축소하여(그렇기 때문에 처음에 해상도가 너무 낮은 이미지 사용하면 안됨) 중요한 특징에 집중하여 계산에 효율을 높일 수 있고 특징 추출은 이미지의 크기 회전 이동 등에 불변한 특징을 추출하기 때문에 일반화된 특징을 얻을 수 있다.
특징 추출의 기본 원리
1. 지역성 : 이미지의 작은 지역 영역을 선택하고 해당 영역의 특징 추출
2. 불변성 : 이미지의 이동 회전 크기 등에도 불변성 유지
3. 반복성 : 이미지의 다른 부분에서도 특징 추출은 반복 가능, 일관된 특징 추출이 가능해야함
특징 추출 알고리즘
1. SIFT : 크기와 회전에 불변하며, 노이즈와 다양한 변형에 강건한 특징을 추출하는 데에 사용
기본 원리 : 특징점 검출 > 주위 영역 정보 추출 > 특징 기술자 생성 > 특징 매칭
장점:
- 크기와 회전에 불변: SIFT는 다양한 이미지 크기와 회전에 대해 불변한 특징점을 검출하여 이미지 스케일 변화나 회전에 강건합니다.
- 고유한 특징 추출: SIFT는 이미지의 고유한 특징을 추출하여 다른 이미지와 구별하기 쉬운 특징 기술자를 생성합니다.
- 효율적인 매칭: 특징 기술자를 사용하여 이미지 간 매칭을 효율적으로 수행할 수 있어, 객체 추적 등 다양한 응용에 유용합니다.
단점:
- 계산 비용: SIFT는 복잡한 계산을 필요로 하기 때문에 큰 이미지에서는 속도가 느릴 수 있습니다.
- 노이즈에 민감: 노이즈가 많은 이미지에서는 잘못된 특징점이 검출될 수 있고, 이에 따라 특징 기술자가 왜곡될 수 있습니다.
- 특징 선택에 따른 변동성: 특징점을 선택하는 기준에 따라 매칭 결과가 변할 수 있습니다. 적절한 특징점 선택이 중요합니다.
2. SURF : SIFT 특징점 검출 알고리즘을 기반으로 개선된 컴퓨터 비전 알고리즘
기본 원리 : Gaussian 이미지 피라미드: 이미지 크기를 다양하게 축소하여 생성한 피라미드 구조. 다양한 스케일에서 특징 검출 수행 ->
Hessian 행렬: 이미지에서 주변 픽셀의 변화율을 나타내는 행렬. 특징점 검출을 위해 특정 값들을 계산하여 후보 특징점 선별 ->
특징점 검출: Hessian 행렬의 값에 기반하여 이미지에서 특징점 후보들을 찾아냄 ->
특징 기술자: 특징점을 중심으로 주변 정보를 기반으로 특징을 표현하는 기술자 생성. 이미지의 변환에 강건하게 유지.변환에도 강건하게 유지됩니다.
장점:
- 빠른 처리 속도: 이미지 피라미드와 특정 알고리즘을 사용하여 빠른 특징 검출 가능.
- 크기 및 회전 불변성: 특징 기술자가 크기와 회전에 강건하여 다양한 변형에서도 특징 매칭 가능.
- 다양한 응용: 이미지 매칭, 객체 인식, 영상 스티칭 등 다양한 컴퓨터 비전 작업에 활용.
단점:
- 특징 검출 불가능한 경우: 특정 이미지에서 특징을 잘 검출하지 못할 수 있음.
- 높은 계산 복잡도: 특징점 검출과 기술자 생성에 높은 계산 비용이 요구될 수 있음.
- 정확성 문제: 특정 환경에서 잘못된 특징 매칭이 발생할 수 있음. 추가 필터링이 필요할 수 있음.
3. ORB
SIFT나 SURF보다 빠르면서도 비슷한 성능을 제공하므로 실시간 응용 프로그램 및 리소스 제한 환경에서 많이 사용. 또한 무엇보다도 오픈소스 라이브러리인 OpenCV에서 구현되어 쉽게 활용할 수 있다, 로봇 비전분야에 많이 사용
장점:
- 빠른 처리 속도: FAST와 BRIEF를 조합하여 빠른 특징점 검출 및 기술자 생성 가능.
- 강건성: 회전 불변성과 정확한 특징 기술자 생성으로 다양한 변형에서도 강건한 특징 매칭 가능.
- 리소스 제한 환경에 적합: 빠른 처리 속도와 간단한 구현으로 리소스 제한된 환경에서 효과적으로 사용 가능.
단점:
- 정확성 제한: SIFT나 SURF보다 정확성이 상대적으로 낮을 수 있음.
- 특징 검출 한계: 특정 이미지에서 특징을 잘 검출하지 못할 수 있음.
- 높은 차원 기술자: BRIEF의 이진 기술자는 차원이 높아서 찾는 매칭 쌍의 개수를 증가시키는데 한계가 있을 수 있음.
특징 디스크립터
이미지 간의 특징을 수치적으로 표현하여 매칭, 특징 추출과 다른 개념( 특징 추출은 이미지에서 키포인트를 찾는 과정을 의미하고, 특징 디스크립터는 키포인트 주변 영역의 특성을 벡터로 표현하는 과정을 의미)