[python] 정규표현식을 이용한 한글 추출하기

정규표현식은 문자열에서 특정한 패턴을 검색하거나 추출할 때 유용한 도구입니다. 이번에는 Python에서 정규표현식을 이용하여 한글을 추출하는 방법을 알아보겠습니다.

정규표현식 패턴 작성하기

한글을 추출하기 위해서는 정규표현식 패턴을 작성해야 합니다. 파이썬에서 한글을 나타내는 유니코드 범위는 \uAC00-\uD7A3입니다. 이 범위를 사용하여 정규표현식 패턴을 작성해봅시다.

import re

pattern = re.compile("[\uAC00-\uD7A3]+")

문자열에서 한글 추출하기

이제 작성한 정규표현식 패턴을 이용하여 문자열에서 한글을 추출해보겠습니다. 패턴과 re.findall() 함수를 사용하여 문자열에서 한글을 추출할 수 있습니다.

text = "안녕하세요, 반갑습니다. Hello, 你好!"

result = pattern.findall(text)
print(result)

위의 코드를 실행하면 아래와 같은 결과를 얻을 수 있습니다.

['안녕하세요', '반갑습니다']

전체 코드

아래는 한글을 추출하는 전체 코드입니다.

import re

pattern = re.compile("[\uAC00-\uD7A3]+")

text = "안녕하세요, 반갑습니다. Hello, 你好!"

result = pattern.findall(text)
print(result)

결론

정규표현식을 이용하여 한글을 추출하는 방법에 대해 알아보았습니다. 이를 응용하여 문자열에서 한글을 추출하고 다양한 용도로 활용할 수 있습니다. 자유롭게 실험해보세요!