728x90 레이블보존1 [PYTHON] Data Augmentation : 이미지 및 텍스트 증강 시 레이블 보존(Label Preserving) 확인을 위한 3가지 해결 방법 딥러닝 모델의 성능을 끌어올리기 위한 가장 보편적인 전략은 데이터를 인위적으로 늘리는 데이터 증강(Data Augmentation)입니다. 하지만 무분별한 증강은 오히려 독이 될 수 있습니다. 증강된 데이터가 원래의 레이블(Label) 의미를 상실하거나 다른 클래스의 특성을 갖게 되는 'Semantic Drift' 현상이 발생하기 때문입니다. 예를 들어 숫자 '6' 이미지를 180도 회전하면 '9'가 되어 레이블이 오염됩니다. 본 포스팅에서는 파이썬(Python)을 활용하여 이미지와 텍스트 데이터를 증강할 때, 데이터의 정체성(Label Identity)이 훼손되지 않았는지 검증하는 레이블 보존(Label Preserving) 확인법과 실무적인 해결책을 7가지 핵심 예제와 함께 제시합니다.1. 레이블 보.. 2026. 4. 21. 이전 1 다음 728x90