[python] 정규표현식을 이용한 날짜 추출하기
정규표현식은 문자열에서 특정한 패턴을 검색하거나 추출하는 강력한 도구입니다. 이번 포스트에서는 Python에서 정규표현식을 사용하여 문자열에서 날짜를 추출하는 방법을 알아보겠습니다.
정규표현식 패턴 작성하기
첫 번째로, 날짜의 패턴을 정의해야 합니다. 예를 들어, YYYY-MM-DD
형식으로 된 날짜를 추출하고 싶다면 다음과 같은 정규표현식 패턴을 사용할 수 있습니다.
import re
date_pattern = r'\d{4}-\d{2}-\d{2}'
위의 예제에서 r
은 raw string을 의미합니다. 이는 백슬래시(\
)를 이스케이프 문자로 인식하지 않도록 하는 역할을 합니다.
날짜 추출하기
이제 정의한 패턴을 문자열에 적용하여 날짜를 추출해보겠습니다. 다음은 예시 문자열에서 날짜를 추출하는 코드입니다.
text = "오늘은 2022-01-01입니다."
match = re.search(date_pattern, text)
if match:
date = match.group()
print(date)
else:
print("날짜를 찾을 수 없습니다.")
위의 예제에서 re.search()
함수는 문자열에서 정규표현식 패턴과 일치하는 첫 번째 항목을 찾아줍니다. group()
메서드를 사용하여 일치하는 패턴을 추출할 수 있습니다.
결과 확인하기
위의 코드를 실행하면 다음과 같은 결과가 출력됩니다.
2022-01-01
예시 문자열에서 정확하게 날짜를 추출하는 것을 확인할 수 있습니다.