728x90 groupby3 [PYTHON] Pandas groupby를 활용한 데이터 요약의 3가지 핵심 단계와 집계 성능 해결 방법 7가지 파이썬 데이터 분석의 정점은 흩어져 있는 원천 데이터에서 의미 있는 인사이트를 추출하는 것입니다. 그 중심에는 Pandas의 groupby가 있습니다. 단순히 데이터를 그룹으로 묶는 것을 넘어, '분할(Split) - 적용(Apply) - 결합(Combine)'이라는 데이터 변환 파이프라인의 정수를 이해하는 것이 중요합니다. 본 포스팅에서는 2026년 실무 표준에 입각하여 groupby를 활용한 데이터 요약의 본질을 파헤칩니다. 초보자가 흔히 겪는 속도 저하 문제와 메모리 부족 현상을 해결하는 7가지 실전 사례(Examples)를 통해, 수백만 건의 로우 데이터를 단 몇 줄의 코드로 압축 요약하는 해결 방법을 제시합니다.1. Groupby의 핵심 메커니즘: Split-Apply-Combine의 차이Gro.. 2026. 3. 31. [PYTHON] pandas groupby 예제 : 실전 활용 완전 정복 데이터 분석의 핵심 기능 중 하나인 pandas의 groupby()는 복잡한 데이터셋을 집계·변환·필터링하는 데 매우 유용합니다. 본 글에서는 기본 개념(wikipedia의 split‑apply‑combine), 단순 집계부터 transform, apply를 활용한 실전 예시까지 단계적으로 안내합니다 1. split‑apply‑combine 구조 이해하기groupby는 크게 세 단계를 거칩니다:Split: 데이터를 지정한 컬럼 기준으로 그룹 나눔Apply: 각 그룹에 집계나 변환 적용Combine: 결과를 하나의 구조로 합침이 구조는 pandas 공식 문서에서도 동일하게 정의되어 있습니다2. 기본 집계 예제import pandas as pddf = pd.DataFrame({ 'city': ['A',.. 2025. 7. 25. [ORACLE] MAX() 함수로 그룹 별 최대 값 구하는 법 Oracle SQL에서 MAX() 함수는 집계 함수(Aggregate Function) 중 하나로, 지정된 칼럼 내에서 가장 큰 값을 반환합니다. 이 함수는 숫자형뿐 아니라 날짜형 데이터에도 사용되며, 그룹 단위 또는 전체 데이터에서의 최댓값을 추출하는 데 유용합니다. 본 글에서는 실무 개발자가 이해하기 쉽도록 다양한 예제와 함께 MAX 함수의 사용법을 정리했습니다.1. MAX() 함수 개요MAX() 함수는 SQL에서 특정 칼럼의 최댓값을 반환합니다. NULL 값은 자동으로 제외됩니다.SELECT MAX(salary) FROM employees;2. 기본 사용법2.1 숫자형 데이터SELECT MAX(salary) FROM employees;직원 급여 중 최고 급여를 반환합니다.2.2 날짜형 데이터SELE.. 2025. 6. 1. 이전 1 다음 728x90