[python] 정규표현식을 이용한 알파벳 추출

정규표현식은 문자열에서 원하는 패턴을 찾거나 추출하는데 유용한 도구입니다. 이번에는 Python에서 정규표현식을 사용하여 알파벳만 추출하는 방법에 대해 알아보겠습니다.

1. re 모듈 import하기

먼저, 정규표현식을 사용하기 위해 Python의 내장 모듈인 re를 import해야 합니다. 다음과 같은 코드를 통해 re 모듈을 import할 수 있습니다.

import re

2. 알파벳 추출하기

입력받은 문자열에서 알파벳만 추출하기 위해 정규표현식 패턴을 사용합니다. re.sub() 함수를 사용하여 문자열에서 패턴에 맞는 부분을 다른 문자열로 치환할 수 있습니다. 다음은 알파벳을 제외한 다른 문자를 제거하는 코드입니다.

import re

def extract_alphabet(text):
    pattern = r'[^a-zA-Z]'
    alphabet = re.sub(pattern, '', text)
    return alphabet

위 코드에서 [^a-zA-Z]는 대문자와 소문자를 제외한 모든 문자와 매치됩니다. 따라서 re.sub() 함수를 통해 해당 패턴을 빈 문자열로 치환하면 알파벳만 남게 됩니다.

3. 예시

다음은 알파벳 추출 함수를 사용하는 예시 코드입니다.

text = "Hello World! 123"
result = extract_alphabet(text)
print(result)  # Output: HelloWorld

위 코드를 실행하면 “Hello World! 123” 문자열에서 알파벳인 “HelloWorld”만 추출해 출력합니다.

정규표현식을 사용하여 알파벳을 추출하는 방법에 대해 알아보았습니다. 이를 응용하여 여러분의 프로젝트에서 유용하게 활용해보세요!

참고 자료