[파이썬] 집합의 중복 제거와 유일한 값
파이썬에서는 데이터에서 중복된 원소를 제거하고 유일한 값을 얻는 작업을 쉽게 할 수 있습니다. 이를 위해 파이썬의 집합(Set) 자료형을 사용할 수 있습니다. 집합은 중복을 허용하지 않고, 순서가 없는 자료형으로, 유일한 값만 포함됩니다.
중복 제거하기
만약 리스트나 튜플 등의 시퀀스에서 중복된 값을 제거하고 싶다면, 다음과 같이 집합 자료형으로 변환한 후 다시 리스트나 튜플 등으로 변환할 수 있습니다.
numbers = [1, 2, 3, 2, 4, 3, 5]
unique_numbers = list(set(numbers))
print(unique_numbers)
위의 예제에서 numbers
는 중복된 값을 포함하는 리스트입니다. set(numbers)
를 통해 중복을 제거한 후, list()
를 사용하여 다시 리스트로 변환합니다. 이렇게 하면 unique_numbers
에는 중복이 제거된 유일한 값들만 포함됩니다.
유일한 값 확인하기
때로는 데이터에서 유일한 값들만 확인하고 싶을 수 있습니다. 예를 들어, 다음과 같은 텍스트에서 유일한 단어들만 확인하고 싶다면 어떻게 할까요?
text = "apple orange apple banana orange pear"
unique_words = set(text.split())
print(unique_words)
위의 예제에서 text
는 공백을 기준으로 단어들이 구분된 텍스트입니다. text.split()
을 통해 단어들을 분리하고, set()
을 사용하여 중복을 제거합니다. 이렇게 하면 unique_words
에는 유일한 단어들만 포함됩니다.
집합의 중복 제거와 유일한 값 확인은 파이썬 프로그래밍에서 자주 사용되는 작업 중 하나입니다. 이를 잘 활용하여 데이터를 처리하면, 보다 효율적이고 정확한 결과를 얻을 수 있습니다.