Post

7-(2) 데이터 증강(Data Augmentation)이란 무엇이며, 이미지 데이터에서 주로 사용하는 증강 기법에는 어떤 것들이 있나요?

7-(2) 데이터 증강(Data Augmentation)이란 무엇이며, 이미지 데이터에서 주로 사용하는 증강 기법에는 어떤 것들이 있나요?

🟢 7-(2). Data Augmentation이란?

Data Augmentation이란, 기존 학습 데이터를 다양한 방식으로 인위적으로 변형하여 데이터의 다양성과 양을 증가시키는 기법. 이는 모델의 일반화 성능을 향상시키고, 과적합(overfitting)을 방지하는 데 매우 유용하다.


⚪ 주요 목적

  • 데이터 부족 문제 해결
  • 모델의 일반화(generalization) 향상
  • Overfitting 방지
  • 다양한 환경/상황에 대한 강건함(Robustness) 확보

⚪ Computer Vision 예시

  • 회전 (Rotation)
  • 자르기 (Cropping)
  • 좌우반전 (Flipping)
  • 밝기/색조 조절 (Color Jittering)
  • 노이즈 추가 (Gaussian noise) (과제#5)
  • Cutout, Mixup, CutMix 등 고급 기법

augmentation


⚪ 요약하면

  • 학습 데이터의 다양성을 높여 더 일반적인 feature를 학습하도록 유도
  • 특히 의료영상(Medical Imaging) 등 데이터가 적은 분야에서 필수적으로 사용됨
  • 대부분의 CNN, Transformer 모델에서도 기본 전처리로 사용됨

🟢 예시 답안 (코드잇 제공)

  • 데이터 증강(Data Augmentation)이란 기존 데이터에 다양한 변형을 가하여 새로운 학습 데이터를 생성하는 기법입니다. 딥러닝 모델은 많은 데이터를 필요로 하지만, 충분한 양의 데이터를 확보하기 어려운 경우가 많습니다. 데이터 증강을 활용하면 기존 데이터를 다양하게 변형하여 모델의 일반화 성능을 향상시킬 수 있습니다. 이를 통해 과적합(overfitting)을 방지하고, 모델이 특정 패턴에 치우치지 않도록 학습할 수 있습니다.
    이미지 데이터에서 자주 사용하는 데이터 증강 기법에는 다음과 같은 것들이 있습니다.
  • 첫째, 회전(Rotation)입니다. 이미지를 특정 각도로 회전시켜 모델이 다양한 방향에서의 데이터를 학습할 수 있도록 합니다.
  • 둘째, 수평/수직 뒤집기(Flipping)입니다. 특히 수평 뒤집기는 이미지 데이터가 좌우 대칭성을 가질 때 효과적인 방법입니다.
  • 셋째, 잘라내기(Cropping) 및 크기 변환(Scaling)입니다. 이미지의 일부분을 랜덤하게 잘라내거나 확대 및 축소하여 다양한 시각적 변화를 학습할 수 있습니다.
  • 넷째, 밝기 및 색상 변화(Brightness & Color Jittering)입니다. 이미지의 밝기, 대비, 색조 등을 조정하여 다양한 조명 환경에서도 모델이 잘 작동하도록 만듭니다.
  • 다섯째, 노이즈 추가(Adding Noise)입니다. 이미지에 랜덤한 노이즈를 추가하여, 모델이 깨끗한 데이터뿐만 아니라 노이즈가 포함된 데이터도 잘 인식할 수 있도록 학습합니다.
    이러한 데이터 증강 기법들은 이미지 데이터의 다양성을 증가시키고, 모델이 보다 일반적인 특징을 학습하도록 돕는 중요한 역할을 합니다.
This post is licensed under CC BY 4.0 by the author.

© 2025 Soohyun Jeon ⭐

🌱 Mostly to remember, sometimes to understand.