image augmentation 이미지 증감

이미지 증강 (Image augmentation)은 기계 학습과 컴퓨터 비전 작업에서 사용되는 기술

이미지 데이터셋을 다양한 방법으로 변형하여 데이터의 다양성을 증가시키는 과정

이를 통해 모델의 일반화 성능을 향상

일반적으로 이미지 증강은 다음과 같은 변형을 포함

1. 이동 (Translation): 이미지를 수평 또는 수직으로 이동
2. 회전 (Rotation): 이미지를 회전
3. 확대/축소 (Scaling): 이미지를 확대하거나 축소
4. 반전 (Flip): 이미지를 좌우 또는 상하로 반전
5. 밝기 조절 (Brightness adjustment): 이미지의 밝기를 조절
6. 색상 변환 (Color transformation): 이미지의 색상을 변환
7. 잡음 추가 (Noise addition): 이미지에 잡음을 추가
8. 잘라내기 (Cropping): 이미지의 일부분을 크롭

 

이러한 이미지 증강 기법은 데이터셋에 다양성을 추가하고, 과적합을 방지하며, 모델의 일반화 능력을 향상

TensorFlow, Keras, OpenCV 등의 라이브러리에서 이미지 증강을 위한 다양한 함수와 도구를 제공

 

작업 주의 사항

임의로 이미지를 회전하면 모서리 바깥 쪽에 중요한 이미지 부분이 있을 수 있다

이미지 회전 후에는  빈 부분(검정패딩) 부분으로 채운다

회전하지 않는 사물의 경우(거리 표지판)

 

이미지 증감 라이브러리

1. albumentation : 다른 데이터 증강 라이브러리에 비해 높은 속도와 효율성 제공, Cython은 파이썬으로 작성된 프로그램

Cpython은 파이썬 문법으로 작성된 프로그램을 한줄한줄 c로 바꿔서 읽게함, Cython은 파이썬으로 작성된 프로그램을 c 언어로 실행시키는 거라 더 빠름

https://albumentations.ai/

pip install -U albumentations

 

 

 

+ Recent posts