728x90 코딩테스트팁2 [PYTHON] 데이터 정제의 핵심 : 문자열 split() 함수의 마스터 가이드 파이썬 프로그래밍에서 가장 빈번하게 마주하는 데이터 타입은 단연 문자열(String)입니다. 웹 크롤링으로 수집한 텍스트 데이터부터 로그 파일의 한 줄까지, 우리가 다루는 정보의 대부분은 텍스트 형태로 존재합니다. 이러한 비정형 데이터를 분석하기 위해 가장 먼저 선행되어야 할 작업이 바로 '토큰화(Tokenization)', 즉 문자열을 의미 있는 단위로 쪼개어 리스트로 변환하는 것입니다. 오늘은 그 중심에 있는 split() 함수의 모든 것을 심층 분석합니다.1. split() 함수의 기본 메커니즘파이썬의 split() 메서드는 문자열을 특정 구분자를 기준으로 나누어 리스트(List) 형태로 반환합니다. 이 메서드의 진정한 강점은 직관적인 문법과 더불어 내부적인 최적화에 있습니다.기본 문법str.spl.. 2026. 2. 5. [JAVA] Scanner vs BufferedReader : 성능과 효율을 결정짓는 입력 방식의 모든 것 자바(Java)를 처음 접하면 가장 먼저 배우는 것 중 하나가 콘솔 입력입니다. 이때 우리는 보통 Scanner를 사용하곤 합니다. 하지만 알고리즘 문제를 풀거나 대용량 데이터를 처리하는 현업 프로젝트에 투입되면 "왜 BufferedReader를 써야 하는가?"라는 질문을 마주하게 됩니다. 단순히 '빠르다'는 이유를 넘어, 두 클래스가 내부적으로 어떻게 동작하며 어떤 상황에서 진가를 발휘하는지 전문적인 관점에서 심도 있게 분석해 보겠습니다.1. 왜 입력 방식의 선택이 중요한가?컴퓨터 시스템에서 I/O(Input/Output) 작업은 CPU 연산에 비해 압도적으로 느린 작업입니다. 표준 입력(System.in)으로부터 데이터를 읽어올 때, 매번 한 바이트씩 가져오느냐 아니면 한꺼번에 뭉텅이로 가져와 메모리.. 2026. 1. 20. 이전 1 다음 728x90