정규 표현식은 텍스트에서 패턴을 찾아내는 강력한 도구입니다. 이러한 패턴을 사용하여 문자열을 매칭하고, 필요에 따라 원하는 형식으로 치환할 수 있습니다. 이번 포스트에서는 Python에서 정규 표현식의 매칭 결과를 문자열 치환하는 방법을 살펴보겠습니다.
re 모듈
Python에서 정규 표현식을 사용하기 위해서는 re
모듈을 import해야 합니다. re
모듈은 다양한 정규 표현식 기능을 제공하며, 매칭 결과를 문자열 치환하는데 사용할 수 있는 함수들을 포함하고 있습니다.
import re
re.sub()
함수
re.sub()
함수는 정규 표현식으로 매칭되는 부분을 다른 문자열로 치환하는 함수입니다. 기본적인 사용법은 다음과 같습니다:
re.sub(pattern, replacement, string)
pattern
: 매칭하고자 하는 정규 표현식 패턴입니다.replacement
: 치환하고자 하는 문자열입니다.string
: 대상 문자열입니다.
예제
아래 예제를 통해 re.sub()
함수의 사용법을 확인해보겠습니다.
import re
# 정규 표현식으로 이메일 주소 찾기
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
string = "Contact us at support@example.com for any inquiries."
# 이메일 주소를 [email]으로 치환
replaced_string = re.sub(pattern, "[email]", string)
print(replaced_string)
출력 결과:
Contact us at [email] for any inquiries.
위의 예제에서는 주어진 문자열 string
에서 정규 표현식 패턴인 이메일 주소를 찾아 [email]
로 치환하였습니다. re.sub()
함수는 첫 번째 매개변수로 정규 표현식 패턴을, 두 번째 매개변수로 치환할 문자열을 전달합니다. re.sub()
함수는 정규 표현식으로 매칭되는 모든 부분을 치환하며, 새로운 치환된 문자열을 반환합니다.
여기서 사용된 정규 표현식은 이메일 주소를 찾기 위한 간단한 패턴입니다. 이메일 주소 패턴은 [A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}
로 구성되어 있습니다.
결론
Python에서 정규 표현식의 매칭 결과를 문자열 치환하기 위해서는 re.sub()
함수를 사용할 수 있습니다. 이를 통해 특정 문자열 패턴을 찾아내고, 다른 문자열로 치환하는 작업을 수행할 수 있습니다. 정규 표현식은 이를 통해 문자열 처리와 데이터 변형에 매우 유용한 도구가 될 수 있습니다.