[파이썬] 집합의 중복 제거와 유일한 값

01 Sep 2023

파이썬에서는 데이터에서 중복된 원소를 제거하고 유일한 값을 얻는 작업을 쉽게 할 수 있습니다. 이를 위해 파이썬의 집합(Set) 자료형을 사용할 수 있습니다. 집합은 중복을 허용하지 않고, 순서가 없는 자료형으로, 유일한 값만 포함됩니다.

중복 제거하기

만약 리스트나 튜플 등의 시퀀스에서 중복된 값을 제거하고 싶다면, 다음과 같이 집합 자료형으로 변환한 후 다시 리스트나 튜플 등으로 변환할 수 있습니다.

numbers = [1, 2, 3, 2, 4, 3, 5]
unique_numbers = list(set(numbers))
print(unique_numbers)

위의 예제에서 numbers는 중복된 값을 포함하는 리스트입니다. set(numbers)를 통해 중복을 제거한 후, list()를 사용하여 다시 리스트로 변환합니다. 이렇게 하면 unique_numbers에는 중복이 제거된 유일한 값들만 포함됩니다.

때로는 데이터에서 유일한 값들만 확인하고 싶을 수 있습니다. 예를 들어, 다음과 같은 텍스트에서 유일한 단어들만 확인하고 싶다면 어떻게 할까요?

text = "apple orange apple banana orange pear"
unique_words = set(text.split())
print(unique_words)

위의 예제에서 text는 공백을 기준으로 단어들이 구분된 텍스트입니다. text.split()을 통해 단어들을 분리하고, set()을 사용하여 중복을 제거합니다. 이렇게 하면 unique_words에는 유일한 단어들만 포함됩니다.

집합의 중복 제거와 유일한 값 확인은 파이썬 프로그래밍에서 자주 사용되는 작업 중 하나입니다. 이를 잘 활용하여 데이터를 처리하면, 보다 효율적이고 정확한 결과를 얻을 수 있습니다.