[python] 정규표현식을 이용한 영문자와 특수문자 추출하기
정규표현식은 문자열에서 원하는 패턴을 찾을 때 유용하게 사용됩니다. 이번에는 Python에서 정규표현식을 사용하여 영문자와 특수문자를 추출하는 방법에 대해 알아보겠습니다.
영문자와 특수문자 추출하기
Python에서는 re
모듈을 사용하여 정규표현식을 적용할 수 있습니다.
import re
text = "Hello, World! 2021년은 좋은 해가 될 것입니다."
pattern = r"[a-zA-Z]+|[^\w\s]"
result = re.findall(pattern, text)
print(result)
위의 예제 코드에서는 영문자를 추출하기 위해 [a-zA-Z]+
정규표현식 패턴을 사용하였습니다. 이 패턴은 하나 이상의 영문자를 찾아내는 역할을 합니다.
특수문자를 추출하기 위해 [^\w\s]
정규표현식 패턴을 사용하였습니다. 이 패턴은 알파벳과 숫자를 제외한 모든 문자를 찾아냅니다.
결과값으로는 추출된 영문자와 특수문자가 리스트 형태로 반환됩니다.
예시 결과
위의 예제 코드를 실행한 결과는 다음과 같습니다.
['Hello', ',', 'World', '!', '2021년은', '좋은', '해가', '될', '것입니다', '.']
영문자인 “Hello”, “World”와 특수문자인 “,”, “!”, “.”, “2021년은”, “좋은”, “해가”, “될”, “것입니다”가 추출되었습니다.
결론
정규표현식은 문자열에서 필요한 패턴을 쉽게 추출할 수 있는 강력한 도구입니다. Python의 re
모듈을 사용하여 영문자와 특수문자를 추출하는 방법을 알아보았습니다. 정규표현식을 유연하게 활용하여 문자열 처리를 더욱 효율적으로 할 수 있습니다.
참고자료:
- Python
re
모듈 문서: https://docs.python.org/3/library/re.html