본문 바로가기
728x90

파이썬데이터처리2

[PYTHON] 효율적인 데이터 처리 : 고차 함수 3가지 지연 평가 특성과 성능 해결 방법 파이썬을 사용하여 대규모 데이터셋을 처리할 때, 메모리 부족(Out of Memory) 현상은 개발자를 가장 괴롭히는 문제 중 하나입니다. 수백만 개의 데이터를 리스트에 담아 한꺼번에 연산하는 방식은 직관적이지만 리소스 측면에서는 매우 비효율적입니다. 이러한 문제를 근본적으로 해결해 주는 파이썬의 핵심 메커니즘이 바로 고차 함수(High-order Function)와 그들의 지연 평가(Lazy Evaluation) 특성입니다. 본 포스팅에서는 map, filter, reduce 세 가지 함수의 작동 원리를 심층 분석하고, 왜 이들이 메모리 효율성을 극대화하는 최적의 해결 방법이 되는지 구체적인 차이점을 통해 살펴봅니다.1. 지연 평가(Lazy Evaluation)란 무엇인가?일반적인 리스트 컴프리헨션이나.. 2026. 3. 4.
[PYTHON] CSV 파일 읽기 & 쓰기 완벽 가이드 : csv 모듈부터 pandas까지 CSV(Comma-Separated Values) 파일은 가장 널리 사용되는 데이터 저장 형식 중 하나로, 다양한 플랫폼과 언어에서 쉽게 읽고 쓸 수 있다는 장점이 있다. Python은 이러한 CSV 파일을 손쉽게 다룰 수 있는 csv 모듈과 pandas 라이브러리를 제공한다.본 글에서는 Python에서 CSV 파일을 읽고 쓰는 기본 방법부터, 실무에서 유용한 고급 활용 팁까지 실제 코드 예제와 함께 상세히 소개한다. 특히 csv 모듈과 pandas의 차이점, 각 방식의 장단점도 비교하여 독자의 실력 향상에 실질적인 도움을 줄 것이다.1. CSV 파일이란?CSV는 각 행이 레코드(record)를 나타내고, 각 열이 쉼표(,)로 구분되는 단순한 텍스트 파일이다. 구조는 단순하지만 Excel, 데이터베이스,.. 2025. 7. 25.
728x90