본문 바로가기
728x90

파일읽기3

[PYTHON] 메모리 효율을 결정하는 2가지 파일 읽기 기법 : readline()과 readlines()의 결정적 차이 및 대용량 데이터 해결 방법 파이썬(Python)을 이용한 데이터 처리 과정에서 파일 입출력은 가장 빈번하게 발생하는 작업입니다. 특히 텍스트 파일을 한 줄씩 읽어 처리해야 할 때, 우리는 readline()과 readlines()라는 두 가지 선택지 사이에서 고민하게 됩니다. 겉보기에는 비슷해 보이지만, 내부적인 동작 방식과 메모리 점유율 측면에서는 극명한 차이를 보입니다. 본 글에서는 이 두 메서드의 본질적인 특성을 분석하고, 실무에서 수 기가바이트(GB) 이상의 대용량 파일을 다룰 때 발생하는 성능 병목 현상을 해결하는 전문적인 방법을 제시합니다.1. readline()과 readlines()의 본질적 동작 메커니즘파일 객체는 기본적으로 이터레이터(Iterator)처럼 동작하며, 포인터(Pointer) 위치에 따라 읽기 작업을.. 2026. 3. 11.
[PYTHON] pathlib으로 더 똑똑하게 파일 처리하기 Python의 pathlib 모듈은 파일과 디렉토리 경로를 객체 지향적으로 다룰 수 있게 해주는 표준 라이브러리입니다. 기존의 os.path 방식보다 가독성이 높고 직관적이기 때문에, 최근에는 많은 개발자들이 pathlib을 선호하고 있습니다.pathlib이란?pathlib은 Python 3.4부터 표준 라이브러리로 포함된 모듈로, Path 클래스를 중심으로 경로 조작과 파일 입출력을 효율적으로 수행할 수 있습니다.기본 사용법from pathlib import Path# 현재 디렉토리 기준current = Path('.')# 특정 파일 경로 생성file_path = current / 'data' / 'example.txt'print(file_path.resolve())pathlib의 주요 기능경로 객체화.. 2025. 7. 26.
[PYTHON] CSV 파일 읽기 & 쓰기 완벽 가이드 : csv 모듈부터 pandas까지 CSV(Comma-Separated Values) 파일은 가장 널리 사용되는 데이터 저장 형식 중 하나로, 다양한 플랫폼과 언어에서 쉽게 읽고 쓸 수 있다는 장점이 있다. Python은 이러한 CSV 파일을 손쉽게 다룰 수 있는 csv 모듈과 pandas 라이브러리를 제공한다.본 글에서는 Python에서 CSV 파일을 읽고 쓰는 기본 방법부터, 실무에서 유용한 고급 활용 팁까지 실제 코드 예제와 함께 상세히 소개한다. 특히 csv 모듈과 pandas의 차이점, 각 방식의 장단점도 비교하여 독자의 실력 향상에 실질적인 도움을 줄 것이다.1. CSV 파일이란?CSV는 각 행이 레코드(record)를 나타내고, 각 열이 쉼표(,)로 구분되는 단순한 텍스트 파일이다. 구조는 단순하지만 Excel, 데이터베이스,.. 2025. 7. 25.
728x90