[python] 정규표현식을 이용한 한글 추출하기
정규표현식은 문자열에서 특정한 패턴을 검색하거나 추출할 때 유용한 도구입니다. 이번에는 Python에서 정규표현식을 이용하여 한글을 추출하는 방법을 알아보겠습니다.
정규표현식 패턴 작성하기
한글을 추출하기 위해서는 정규표현식 패턴을 작성해야 합니다. 파이썬에서 한글을 나타내는 유니코드 범위는 \uAC00-\uD7A3
입니다. 이 범위를 사용하여 정규표현식 패턴을 작성해봅시다.
import re
pattern = re.compile("[\uAC00-\uD7A3]+")
문자열에서 한글 추출하기
이제 작성한 정규표현식 패턴을 이용하여 문자열에서 한글을 추출해보겠습니다. 패턴과 re.findall()
함수를 사용하여 문자열에서 한글을 추출할 수 있습니다.
text = "안녕하세요, 반갑습니다. Hello, 你好!"
result = pattern.findall(text)
print(result)
위의 코드를 실행하면 아래와 같은 결과를 얻을 수 있습니다.
['안녕하세요', '반갑습니다']
전체 코드
아래는 한글을 추출하는 전체 코드입니다.
import re
pattern = re.compile("[\uAC00-\uD7A3]+")
text = "안녕하세요, 반갑습니다. Hello, 你好!"
result = pattern.findall(text)
print(result)
결론
정규표현식을 이용하여 한글을 추출하는 방법에 대해 알아보았습니다. 이를 응용하여 문자열에서 한글을 추출하고 다양한 용도로 활용할 수 있습니다. 자유롭게 실험해보세요!