[python] 정규표현식을 이용한 영문자 추출하기

정규표현식은 문자열 패턴을 검색하거나 추출하기 위한 강력한 도구입니다. 이번에는 파이썬에서 정규표현식을 사용하여 영문자만 추출하는 방법을 알아보겠습니다.

import re

def extract_english_letters(text):
    pattern = re.compile('[a-zA-Z]')
    letters = re.findall(pattern, text)
    return ''.join(letters)

# 예시 텍스트
text = "Hello, World! 1234"
english_letters = extract_english_letters(text)
print(english_letters)

위의 코드에서는 re 모듈을 사용하여 정규표현식 패턴을 정의합니다. [a-zA-Z]는 영문자를 의미하며, 대소문자를 모두 포함합니다.

re.findall() 함수를 사용하여 패턴에 매칭되는 모든 문자들을 추출한 후, join() 함수를 통해 문자열로 변환합니다.

위의 예시 코드를 실행하면, HelloWorld라는 결과가 출력됩니다. 숫자와 구두점은 제외되고 영문자만 추출된 것을 확인할 수 있습니다.

정규표현식은 매우 강력한 도구이기 때문에, 다양한 패턴을 정의하여 문자열에서 원하는 부분만 추출할 수 있습니다. 더 자세한 내용은 파이썬 공식 문서나 다른 참고 자료를 참조하시기 바랍니다.

참고 자료