본문 바로가기
728x90

데이터분석40

[PYTHON] 머신러닝 입문부터 실전까지: 파이썬으로 배우는 스마트 예측 기술 머신러닝(Machine Learning)은 데이터를 기반으로 스스로 학습하고 예측하는 인공지능 기술의 핵심입니다. 오늘날 고객 분석, 이미지 분류, 추천 시스템, 금융 예측 등 다양한 분야에 활용되고 있으며, 파이썬은 머신러닝 구현에 있어 가장 널리 사용되는 언어입니다.1. 파이썬으로 머신러닝을 해야 하는 이유Scikit-learn, TensorFlow, Keras 등 다양한 머신러닝 라이브러리 제공간결한 문법으로 빠른 프로토타이핑 가능Pandas, NumPy, Matplotlib과의 탁월한 호환성대규모 커뮤니티 및 문서 지원으로 학습 자료가 풍부2. 머신러닝 분류유형정의예시지도학습 (Supervised Learning)입력과 정답 데이터를 학습하여 예측스팸 메일 분류, 가격 예측비지도학습 (Unsupe.. 2025. 7. 20.
[ORACLE] USER_MVIEWS : 실시간 성능 혁신을 위한 물화 뷰(Materialized View) 전략 현대 데이터베이스 환경에서 대규모 집계 및 분석 쿼리는 성능에 치명적인 영향을 미칠 수 있습니다. Oracle의 Materialized View(물화 뷰)는 이러한 문제를 해결하는 강력한 솔루션으로, 사전에 결과를 저장해 조회 속도를 극적으로 향상시킵니다. 이러한 물화 뷰의 정의와 상태를 관리할 수 있는 핵심 뷰가 USER_MVIEWS입니다. 본 글에서는 USER_MVIEWS의 구조, 실전 활용법, 그리고 고급 성능 최적화 전략을 전문가 관점에서 심층적으로 분석합니다.USER_MVIEWS란 무엇인가?USER_MVIEWS는 현재 사용자가 소유한 모든 물화 뷰의 정보를 담고 있는 Oracle 데이터 딕셔너리 뷰입니다. 이 뷰를 통해 물화 뷰의 정의, 최신 상태, 리프레시 방식 등을 한눈에 파악할 수 있습니다.. 2025. 7. 16.
[ORACLE] PERCENTRANK() 함수로 누적 백분위 구하는 방법 PERCENT_RANK()는 Oracle SQL의 윈도(분석) 함수 중 하나로, 지정한 정렬 기준에 따라 각 행이 전체 데이터 내에서 어떤 순위 백분율을 갖는지 알려주는 함수입니다. 특히 동점자가 있는 경우, 해당 순위의 비율을 계산해 주는 점이 CUME_DIST()와의 중요한 차이점입니다.1. 기본 문법PERCENT_RANK() OVER ( PARTITION BY column1 ORDER BY column2)PARTITION BY: 그룹을 나누는 기준 (선택 사항)ORDER BY: 순위를 매기는 기준 (필수)2. PERCENT_RANK() 계산 공식PERCENT_RANK는 다음의 수식으로 계산됩니다:(RANK - 1) / (전체 행 수 - 1)이 공식에 따라 첫 번째 행의 백분율은 항상 0이 되며,.. 2025. 6. 22.
[ORACLE] REGR_AVGY() 함수로 회귀 분석 평균 Y값 활용 법 REGR_AVGY() 함수는 Oracle SQL에서 회귀 분석 시 사용되는 종속 변수(y)의 평균값을 계산하는 통계 함수입니다. 이 함수는 x, y 모두 NULL이 아닌 데이터를 기준으로 y의 평균값을 반환합니다. 1. REGR_AVGY 함수란?REGR_AVGY 함수는 회귀 분석에서 유효한 데이터(x와 y 모두 NULL이 아닌 행)를 기반으로 종속 변수 y의 평균값을 계산합니다. 이는 AVG() 함수와는 다른 통계적 맥락에서 쓰입니다.2. 기본 문법REGR_AVGY(y_expr, x_expr)y_expr: 종속 변수 (Y축), x_expr: 독립 변수 (X축). 두 인자는 수치형 데이터여야 하며, 둘 중 하나라도 NULL이면 해당 행은 계산에서 제외됩니다.3. REGR_AVGY와 AVG의 차이점항목REG.. 2025. 6. 2.
[ORACLE] REGR_R2() 함수로 회귀 분석의 신뢰도 측정하는 법 REGR_R2() 함수는 Oracle SQL에서 선형 회귀 분석의 설명력(R²)을 계산하는 데 사용하는 통계 함수입니다. 1. REGR_R2 함수란?REGR_R2(y, x)는 선형 회귀식 y = a + bx의 설명력(R², 결정 계수)을 반환합니다. 이 값은 0에서 1 사이이며, x가 y의 변동을 얼마나 설명하는지를 나타냅니다.2. 기본 문법REGR_R2(y_expr, x_expr)두 인자는 수치형 칼럼이어야 하며, 둘 다 NULL이 아닌 행만 분석에 포함됩니다.3. REGR_R2 해석 기준R² 값설명력1완벽한 선형 설명력0.7~0.9높은 설명력0.4~0.7보통의 설명력0.1~0.4약한 설명력0전혀 설명하지 못함4. 실전 예제 1: 매출과 광고비 분석CREATE TABLE sales_data ( mon.. 2025. 6. 2.
[ORACLE] REGR_AVGX() 함수로 데이터 회귀 분석 시작하기 REGR_AVGX() 함수는 Oracle SQL에서 선형 회귀 분석 중 독립 변수(x)의 평균값을 계산하는 데 사용되는 통계 함수입니다. 1. REGR_AVGX 함수란?REGR_AVGX(y, x) 함수는 x와 y가 모두 NULL이 아닌 레코드만을 대상으로 x의 평균값을 반환합니다. 일반적인 AVG() 함수와 달리 회귀 분석에 필요한 유효 데이터 기준으로 동작합니다.2. 기본 문법REGR_AVGX(y_expr, x_expr)y_expr: 종속 변수, x_expr: 독립 변수. 두열 모두 수치형이어야 하며, NULL은 계산에서 제외됩니다.3. REGR_AVGX와 AVG의 차이항목REGR_AVGX(y, x)AVG(x)NULL 필터링x와 y 모두 NULL이 아닌 행만 포함x가 NULL이 아닌 행만 포함회귀 연산.. 2025. 6. 2.
728x90