본문 바로가기

728x90

calibration2

[PYTHON] 모델 Calibration의 3가지 핵심 지표와 서비스 신뢰도 해결 방법 딥러닝 모델이 "이 이미지는 고양이일 확률이 99%입니다"라고 출력했을 때, 실제로 100개의 샘플 중 99개가 고양이여야 우리는 그 모델을 신뢰(Trust)할 수 있습니다. 하지만 현대의 복잡한 신경망, 특히 거대 언어 모델(LLM)이나 깊은 ResNet 계열은 예측 성능(Accuracy)은 높지만, 자신의 예측에 대해 지나치게 확신하는 과잉 확신(Overconfidence) 경향을 보입니다. 이러한 확률 값의 왜곡은 자율주행, 의료 진단, 금융 사기 탐지 등 실패 비용이 막대한 서비스에서 치명적인 문제를 일으킵니다. 본 포스팅에서는 모델의 예측 확률을 실제 빈도와 일치시키는 Calibration의 수학적 해석과 이를 시각화하는 Reliability Diagram, 그리고 Python을 통한 7가지 해.. 2026. 4. 28.

[PYTHON] TensorRT FP16 양자화 오차를 해결하는 3가지 Calibration 데이터 선정 방법 딥러닝 모델을 실무 환경, 특히 NVIDIA GPU 기반의 엣지 디바이스나 클라우드 서버에 배포할 때 TensorRT는 선택이 아닌 필수입니다. 하지만 단순히 모델을 FP16(Half Precision)으로 변환한다고 해서 모든 문제가 해결되지는 않습니다. 특정 도메인(의료, 정밀 제조, 자율주행)에서는 아주 미세한 양자화 오차가 모델의 신뢰성을 무너뜨리기도 합니다. 본 포스팅에서는 Python 환경에서 TensorRT 최적화 시 FP16 및 INT8 양자화 과정에서 발생하는 오차를 최소화하기 위한 전략적인 Calibration 데이터 선정 알고리즘과 실무 코드를 깊이 있게 다룹니다. 1%의 정확도 손실도 허용하지 않는 시니어 엔지니어를 위한 가이드를 확인해 보세요.1. FP16 양자화와 Calibrat.. 2026. 4. 20.

이전 1 다음

728x90

티스토리툴바