[python] 정규표현식을 이용한 날짜 추출하기

정규표현식은 문자열에서 특정한 패턴을 검색하거나 추출하는 강력한 도구입니다. 이번 포스트에서는 Python에서 정규표현식을 사용하여 문자열에서 날짜를 추출하는 방법을 알아보겠습니다.

정규표현식 패턴 작성하기

첫 번째로, 날짜의 패턴을 정의해야 합니다. 예를 들어, YYYY-MM-DD 형식으로 된 날짜를 추출하고 싶다면 다음과 같은 정규표현식 패턴을 사용할 수 있습니다.

import re

date_pattern = r'\d{4}-\d{2}-\d{2}'

위의 예제에서 r은 raw string을 의미합니다. 이는 백슬래시(\)를 이스케이프 문자로 인식하지 않도록 하는 역할을 합니다.

날짜 추출하기

이제 정의한 패턴을 문자열에 적용하여 날짜를 추출해보겠습니다. 다음은 예시 문자열에서 날짜를 추출하는 코드입니다.

text = "오늘은 2022-01-01입니다."

match = re.search(date_pattern, text)
if match:
    date = match.group()
    print(date)
else:
    print("날짜를 찾을 수 없습니다.")

위의 예제에서 re.search() 함수는 문자열에서 정규표현식 패턴과 일치하는 첫 번째 항목을 찾아줍니다. group() 메서드를 사용하여 일치하는 패턴을 추출할 수 있습니다.

결과 확인하기

위의 코드를 실행하면 다음과 같은 결과가 출력됩니다.

2022-01-01

예시 문자열에서 정확하게 날짜를 추출하는 것을 확인할 수 있습니다.

참고 자료