본문 바로가기
728x90

효율적인코딩2

[PYTHON] __slots__ 사용으로 메모리 사용량을 40% 이상 줄이는 방법과 해결 원리 파이썬은 개발의 편의성을 극대화한 언어이지만, 대규모 데이터를 다루는 환경에서는 메모리 효율성 문제에 직면하곤 합니다. 특히 수만 개, 수백만 개의 인스턴스를 생성해야 하는 서비스라면 파이썬 객체 하나가 차지하는 '보이지 않는 비용'을 반드시 제어해야 합니다. 오늘 다룰 __slots__는 단순한 문법적 설탕을 넘어, 파이썬의 동적 특성을 제어하여 물리적인 메모리 점유율을 획기적으로 낮추는 강력한 해결책입니다.1. 일반 클래스의 메모리 관리 방식: __dict__의 오버헤드파이썬의 일반적인 클래스 인스턴스는 자유로운 속성 추가를 지원하기 위해 __dict__라는 딕셔너리 구조를 내부에 가집니다. 이 딕셔너리는 해시 테이블(Hash Table) 구조로 작동하며, 다음과 같은 특징 때문에 메모리를 많이 소모.. 2026. 3. 15.
[PYTHON] 빅데이터 처리를 위한 Pandas 메모리 70% 절약 방법과 Dtype 최적화 차이 해결 데이터 분석가와 소프트웨어 엔지니어에게 Pandas는 축복과도 같은 라이브러리지만, 대용량 데이터를 다룰 때는 '메모리 킬러'로 돌변하곤 합니다. 파이썬의 동적 타이핑 특성상 Pandas는 데이터를 읽어올 때 안전을 위해 필요 이상의 메모리를 할당하는 경향이 있습니다. 본 가이드에서는 Dtype(데이터 타입) 최적화를 통해 메모리 사용량을 획기적으로 줄이는 전문적인 방법과 데이터 손실 없이 최적화하는 핵심 전략을 다룹니다.1. 왜 Pandas 메모리 최적화가 중요한가?로컬 환경에서 8GB 이상의 CSV 파일을 로드하려고 시도하다 MemoryError를 마주한 적이 있다면, 메모리 관리의 절실함을 느끼셨을 겁니다. Pandas는 기본적으로 정수형 데이터에 int64, 실수형에 float64를 할당합니다. .. 2026. 2. 22.
728x90