본문 바로가기
728x90

상관계수2

[PYTHON] 상관계수 히트맵 해석하는 3가지 방법과 데이터 노이즈 해결 방안 데이터 분석의 초기에 우리는 변수들 사이의 관계를 파악하기 위해 상관계수 히트맵(Correlation Heatmap)을 가장 먼저 그려봅니다. 단순히 색깔이 진하고 연함을 넘어, 이 지표가 비즈니스적으로 어떤 의미를 갖는지, 그리고 분석 결과의 신뢰도를 떨어뜨리는 다중공선성 문제를 어떻게 해결해야 하는지가 숙련된 분석가의 역량을 결정짓습니다. 본 글에서는 파이썬을 활용한 상관계수 히트맵의 완벽한 해석 가이드와 실무 적용 예시를 다룹니다.1. 상관계수의 종류와 히트맵 해석의 기초히트맵은 보통 -1에서 1 사이의 값을 가지는 피어슨 상관계수를 시각화합니다. 하지만 데이터의 성격에 따라 스피어먼이나 켄달 타우를 사용해야 할 때도 있습니다. 각 지표의 차이와 히트맵 색상 농도에 따른 해석 기준을 표로 정리했습니.. 2026. 4. 26.
[ORACLE] REGR_SYY() 함수란? 분산 분석 및 상관 계수 해석 방법 REGR_SYY() 함수는 Oracle SQL에서 회귀 분석 시 사용되는 통계 함수 중 하나로, 종속 변수(y)의 편차 제곱합(Sum of Squares of Deviations)을 반환합니다. 이는 회귀 분석의 신뢰도와 설명력을 판단할 수 있는 중요한 지표입니다.1. REGR_SYY 함수란?REGR_SYY는 주어진 y 값(종속 변수)의 평균과의 편차 제곱합을 계산하는 함수입니다. 수학적으로는 다음과 같이 표현됩니다:REGR_SYY(y, x) = ∑(y_i - 평균_y)^2REGR_SYY는 회귀 분석에서 결정계수(R²) 계산 등에 사용됩니다.2. 기본 문법REGR_SYY(y_expr, x_expr)y_expr: 종속 변수x_expr: 독립 변수두 인자 모두 수치형이어야 하며, NULL이 아닌 쌍만 계산에.. 2025. 6. 2.
728x90