본문 바로가기

728x90

중복제거2

[PYTHON] 데이터 정제의 마법사, 집합(Set)의 핵심 매커니즘 : 중복 제거와 무순서의 미학 파이썬(Python) 프로그래밍에서 데이터를 효율적으로 관리하기 위해 우리는 다양한 자료구조를 사용합니다. 그중에서도 집합(Set)은 수학의 집합 개념을 프로그래밍 언어로 완벽하게 구현해낸 독특한 도구입니다. 리스트(List)나 튜플(Tuple)이 데이터의 '나열'에 집중한다면, 집합은 데이터의 '존재 여부'와 '유일성'에 집중합니다. 단순히 데이터를 담는 바구니를 넘어, 대규모 데이터 처리에서 성능 최적화의 핵심 열쇠가 되는 집합의 두 가지 결정적 특징인 중복 불가(Uniqueness)와 순서 없음(Unordered)에 대해 심층적으로 분석해 보겠습니다.1. 특징 하나: 중복 불가(Uniqueness) - 데이터 결벽증의 미학집합의 가장 강력한 특징은 동일한 값을 허용하지 않는다는 점입니다. 집합에 아.. 2026. 2. 4.

[JAVA] Java HashSet의 중복 제거 원리 : hashCode()와 equals()의 깊은 이해 자바에서 HashSet은 중복을 허용하지 않는 데이터를 관리할 때 가장 먼저 선택되는 강력한 도구입니다. 하지만 단순히 "중복이 안 된다"는 현상만 알고 사용하는 것과, 내부에서 어떤 메커니즘을 통해 객체의 동일성을 판단하는지 이해하는 것은 천차만별의 결과를 낳습니다. 특히 커스텀 객체를 HashSet에 담을 때 발생할 수 있는 논리적 오류를 방지하기 위해서는 hashCode()와 equals()의 상관관계를 명확히 알아야 합니다. 이 글에서는 JVM 내부에서 HashSet이 데이터를 저장하고 비교하는 과정을 단계별로 분석하여, 데이터 무결성을 지키는 핵심 비법을 공유합니다.1. HashSet의 정체: 사실은 HashMap이다?많은 초급 개발자가 간과하는 사실 중 하나는 HashSet이 내부적으로 Has.. 2026. 1. 17.

이전 1 다음

728x90

티스토리툴바