728x90 전처리전략1 [PYTHON] 데이터 분석의 적, 이상치(Outlier) 판단 기준 3가지와 완벽 해결 방법 데이터 분석과 머신러닝 모델링의 성패는 '데이터의 품질'에 달려 있습니다. 그리고 그 품질을 결정짓는 가장 큰 변수가 바로 이상치(Outlier)입니다. 이상치는 측정 오류, 시스템 결함, 혹은 실제로 발생한 희귀한 사건일 수 있습니다. 이를 단순히 삭제할 것인가, 아니면 조정할 것인가를 결정하기 위해서는 명확한 통계적 판단 기준이 필요합니다. 본 포스팅에서는 실무에서 가장 신뢰받는 3가지 이상치 탐지 기법과 이를 파이썬으로 해결하는 최적의 전략을 다룹니다.1. 이상치(Outlier) 판단을 위한 3가지 핵심 통계 기준무엇을 이상치로 볼 것인가는 주관적 판단이 아닌 데이터의 분포와 특성에 근거해야 합니다.① IQR(Interquartile Range) 방식: 사분위수 기반 해결데이터의 중앙 50% 범위를.. 2026. 4. 7. 이전 1 다음 728x90