[python] 정규표현식을 이용한 문자열 추출
이번에는 Python에서 정규표현식을 사용하여 문자열을 추출하는 방법에 대해 알아보겠습니다.
정규표현식은 특정 패턴을 가진 문자열을 찾거나 추출하는데 유용한 도구입니다. Python에서는 re
모듈을 사용하여 정규표현식을 다룰 수 있습니다.
1. re 모듈 import하기
import re
먼저 re
모듈을 import해야 합니다.
2. 정규표현식 패턴 작성하기
pattern = r'정규표현식 패턴'
원하는 문자열을 추출하기 위해 정규표현식 패턴을 작성해야 합니다. 패턴은 문자열의 구조를 기술하는데 사용됩니다. r
접두사를 붙여서 raw string으로 처리하도록 해야 합니다.
3. 문자열에서 패턴 매칭하기
result = re.search(pattern, 문자열)
입력된 패턴과 문자열을 매치하여 결과를 얻을 수 있습니다. re.search()
함수는 문자열에서 패턴과 일치하는 첫 번째 부분을 찾습니다. 일치하는 부분이 없으면 None
을 반환합니다.
4. 추출한 문자열 사용하기
if result:
extracted_string = result.group()
print(extracted_string)
매치된 결과가 있다면, result.group()
함수를 사용하여 매치된 문자열을 추출할 수 있습니다. 추출한 문자열을 이후에 사용하거나 출력할 수 있습니다.
전체 코드 예시
import re
pattern = r'정규표현식 패턴'
string = "추출하고자 하는 문자열입니다."
result = re.search(pattern, string)
if result:
extracted_string = result.group()
print(extracted_string)
이렇게 정규표현식을 이용하여 Python에서 문자열을 추출할 수 있습니다.
더 자세한 내용은 Python re 모듈 공식 문서를 참고하시기 바랍니다.