본문 바로가기
728x90

데이터분석24

[PYTHON] Jupyter Notebook 설치 및 실행 완벽 가이드 Python은 데이터 분석, 인공지능, 통계, 교육 등 다양한 분야에서 널리 사용되는 언어입니다. 특히 Jupyter Notebook은 코드 실행과 시각화, 설명을 동시에 진행할 수 있는 도구로, 실무뿐 아니라 교육 현장에서도 매우 큰 가치를 제공합니다. 본 글에서는 Jupyter Notebook을 설치하는 여러 가지 방법과 함께, 설치 이후 필수적으로 알아야 할 팁과 설정까지 한 번에 안내합니다.Jupyter Notebook이란?Jupyter Notebook은 웹 기반의 인터랙티브 개발 환경으로, 코드 실행 결과를 즉시 확인하면서 시각적 자료와 문서 작성을 동시에 진행할 수 있습니다. Python뿐만 아니라 R, Julia 등 다양한 언어를 지원합니다.주요 특징Markdown을 통한 문서화와 코드의 혼.. 2025. 7. 23.
[PYTHON] Python으로 배우는 실전 머신러닝 입문 머신러닝(Machine Learning)은 데이터에서 스스로 패턴을 학습하고 예측하거나 결정을 내리는 알고리즘을 만드는 기술입니다. Python은 그 간결한 문법과 풍부한 라이브러리 생태계 덕분에 머신러닝 분야에서 가장 많이 사용되는 언어로 자리 잡았습니다. 이 글에서는 Python 기반 머신러닝의 실용적인 예제부터 실제 모델 구축 방법까지, 깊이 있고 독창적인 내용을 제공하여 초보자도 쉽게 실무로 연결할 수 있도록 구성했습니다.Python이 머신러닝에 적합한 이유다양한 라이브러리: scikit-learn, TensorFlow, PyTorch, XGBoost 등 머신러닝에 최적화된 라이브러리 제공커뮤니티: 전 세계적으로 활발한 커뮤니티와 오픈소스 생태계가독성: 수학적 개념을 직관적으로 코드로 구현 가능생.. 2025. 7. 23.
[PYTHON] 머신러닝 입문부터 실전까지: 파이썬으로 배우는 스마트 예측 기술 머신러닝(Machine Learning)은 데이터를 기반으로 스스로 학습하고 예측하는 인공지능 기술의 핵심입니다. 오늘날 고객 분석, 이미지 분류, 추천 시스템, 금융 예측 등 다양한 분야에 활용되고 있으며, 파이썬은 머신러닝 구현에 있어 가장 널리 사용되는 언어입니다.1. 파이썬으로 머신러닝을 해야 하는 이유Scikit-learn, TensorFlow, Keras 등 다양한 머신러닝 라이브러리 제공간결한 문법으로 빠른 프로토타이핑 가능Pandas, NumPy, Matplotlib과의 탁월한 호환성대규모 커뮤니티 및 문서 지원으로 학습 자료가 풍부2. 머신러닝 분류유형정의예시지도학습 (Supervised Learning)입력과 정답 데이터를 학습하여 예측스팸 메일 분류, 가격 예측비지도학습 (Unsupe.. 2025. 7. 20.
[ORACLE] USER_MVIEWS : 실시간 성능 혁신을 위한 물화 뷰(Materialized View) 전략 현대 데이터베이스 환경에서 대규모 집계 및 분석 쿼리는 성능에 치명적인 영향을 미칠 수 있습니다. Oracle의 Materialized View(물화 뷰)는 이러한 문제를 해결하는 강력한 솔루션으로, 사전에 결과를 저장해 조회 속도를 극적으로 향상시킵니다. 이러한 물화 뷰의 정의와 상태를 관리할 수 있는 핵심 뷰가 USER_MVIEWS입니다. 본 글에서는 USER_MVIEWS의 구조, 실전 활용법, 그리고 고급 성능 최적화 전략을 전문가 관점에서 심층적으로 분석합니다.USER_MVIEWS란 무엇인가?USER_MVIEWS는 현재 사용자가 소유한 모든 물화 뷰의 정보를 담고 있는 Oracle 데이터 딕셔너리 뷰입니다. 이 뷰를 통해 물화 뷰의 정의, 최신 상태, 리프레시 방식 등을 한눈에 파악할 수 있습니다.. 2025. 7. 16.
[ORACLE] PERCENTRANK() 함수로 누적 백분위 구하는 방법 PERCENT_RANK()는 Oracle SQL의 윈도(분석) 함수 중 하나로, 지정한 정렬 기준에 따라 각 행이 전체 데이터 내에서 어떤 순위 백분율을 갖는지 알려주는 함수입니다. 특히 동점자가 있는 경우, 해당 순위의 비율을 계산해 주는 점이 CUME_DIST()와의 중요한 차이점입니다.1. 기본 문법PERCENT_RANK() OVER ( PARTITION BY column1 ORDER BY column2)PARTITION BY: 그룹을 나누는 기준 (선택 사항)ORDER BY: 순위를 매기는 기준 (필수)2. PERCENT_RANK() 계산 공식PERCENT_RANK는 다음의 수식으로 계산됩니다:(RANK - 1) / (전체 행 수 - 1)이 공식에 따라 첫 번째 행의 백분율은 항상 0이 되며,.. 2025. 6. 22.
[ORACLE] REGR_AVGY() 함수로 회귀 분석 평균 Y값 활용 법 REGR_AVGY() 함수는 Oracle SQL에서 회귀 분석 시 사용되는 종속 변수(y)의 평균값을 계산하는 통계 함수입니다. 이 함수는 x, y 모두 NULL이 아닌 데이터를 기준으로 y의 평균값을 반환합니다. 1. REGR_AVGY 함수란?REGR_AVGY 함수는 회귀 분석에서 유효한 데이터(x와 y 모두 NULL이 아닌 행)를 기반으로 종속 변수 y의 평균값을 계산합니다. 이는 AVG() 함수와는 다른 통계적 맥락에서 쓰입니다.2. 기본 문법REGR_AVGY(y_expr, x_expr)y_expr: 종속 변수 (Y축), x_expr: 독립 변수 (X축). 두 인자는 수치형 데이터여야 하며, 둘 중 하나라도 NULL이면 해당 행은 계산에서 제외됩니다.3. REGR_AVGY와 AVG의 차이점항목REG.. 2025. 6. 2.
728x90