[python] 정규표현식을 이용한 영문자와 특수문자 추출하기

정규표현식은 문자열에서 원하는 패턴을 찾을 때 유용하게 사용됩니다. 이번에는 Python에서 정규표현식을 사용하여 영문자와 특수문자를 추출하는 방법에 대해 알아보겠습니다.

영문자와 특수문자 추출하기

Python에서는 re 모듈을 사용하여 정규표현식을 적용할 수 있습니다.

import re

text = "Hello, World! 2021년은 좋은 해가 될 것입니다."
pattern = r"[a-zA-Z]+|[^\w\s]"

result = re.findall(pattern, text)
print(result)

위의 예제 코드에서는 영문자를 추출하기 위해 [a-zA-Z]+ 정규표현식 패턴을 사용하였습니다. 이 패턴은 하나 이상의 영문자를 찾아내는 역할을 합니다.

특수문자를 추출하기 위해 [^\w\s] 정규표현식 패턴을 사용하였습니다. 이 패턴은 알파벳과 숫자를 제외한 모든 문자를 찾아냅니다.

결과값으로는 추출된 영문자와 특수문자가 리스트 형태로 반환됩니다.

예시 결과

위의 예제 코드를 실행한 결과는 다음과 같습니다.

['Hello', ',', 'World', '!', '2021년은', '좋은', '해가', '될', '것입니다', '.']

영문자인 “Hello”, “World”와 특수문자인 “,”, “!”, “.”, “2021년은”, “좋은”, “해가”, “될”, “것입니다”가 추출되었습니다.

결론

정규표현식은 문자열에서 필요한 패턴을 쉽게 추출할 수 있는 강력한 도구입니다. Python의 re 모듈을 사용하여 영문자와 특수문자를 추출하는 방법을 알아보았습니다. 정규표현식을 유연하게 활용하여 문자열 처리를 더욱 효율적으로 할 수 있습니다.

참고자료: