[python] 정규표현식을 이용한 모든 문자와 숫자, 특수문자 추출하기

정규표현식은 문자열에서 특정한 패턴을 찾거나 추출할 때 유용하게 사용됩니다. 이번에는 Python에서 정규표현식을 이용하여 문자와 숫자, 특수문자를 추출하는 방법을 알아보겠습니다.

필요한 모듈 import하기

먼저, 정규표현식을 사용하기 위해 re 모듈을 import해야 합니다. 다음과 같이 코드를 작성해줍니다.

import re

문자와 숫자 추출하기

문자와 숫자를 추출하기 위해서는 \w를 사용할 수 있습니다. \w[a-zA-Z0-9_]와 동일한 의미로, 영문 대소문자, 숫자, 언더스코어(_)를 모두 포함합니다.

다음은 문자와 숫자를 추출하는 코드입니다.

text = "Hello123#@!"

result = re.findall(r'\w', text)
print(result)

위 코드를 실행하면 다음과 같은 결과가 출력됩니다.

['H', 'e', 'l', 'l', 'o', '1', '2', '3']

특수문자 추출하기

특수문자를 추출하기 위해서는 \W를 사용할 수 있습니다. \W\w의 반대로, 영문 대소문자, 숫자, 언더스코어를 제외한 모든 문자를 포함합니다.

다음은 특수문자를 추출하는 코드입니다.

text = "Hello123#@!"

result = re.findall(r'\W', text)
print(result)

위 코드를 실행하면 다음과 같은 결과가 출력됩니다.

['#', '@', '!']

정리

Python에서 정규표현식을 이용하여 문자와 숫자, 특수문자를 추출하는 방법에 대해 알아보았습니다. \w는 문자와 숫자를 추출할 때 사용하고, \W는 특수문자를 추출할 때 사용합니다. 이를 활용하여 문자열을 원하는 패턴에 맞게 추출하거나 처리할 수 있습니다.

더 자세한 정보는 Python 정규표현식 공식 문서를 참고해주세요.