[python] 정규표현식을 이용한 숫자 추출

정규표현식은 텍스트 데이터에서 특정 패턴을 찾거나 추출하는 강력한 도구입니다. 이번에는 파이썬에서 정규표현식을 이용하여 텍스트에서 숫자를 추출하는 방법을 알아보겠습니다.

1. re 모듈 import하기

먼저, 파이썬에서 정규표현식을 사용하기 위해 re 모듈을 import해야 합니다. 다음과 같이 코드를 작성합니다.

import re

2. 숫자 추출하기

정규표현식을 이용하여 텍스트에서 숫자를 추출하는 방법은 다양합니다. 가장 간단한 방법은 \d+ 패턴을 사용하는 것입니다. 이 패턴은 연속된 숫자들을 찾아줍니다.

text = "Hello 123 World"
numbers = re.findall(r'\d+', text)
print(numbers)

위 코드에서 re.findall() 함수는 주어진 문자열에서 패턴과 일치하는 모든 부분을 리스트로 반환합니다. 따라서 위 코드는 문자열에서 숫자를 추출하여 numbers 변수에 저장하고, 출력합니다.

3. 결과 확인하기

실행하면 다음과 같은 결과가 출력됩니다.

['123']

위 예시에서는 “Hello 123 World”라는 문자열에서 숫자 “123”을 정상적으로 추출하였습니다.

4. 다른 정규표현식 패턴 사용하기

만약 다른 종류의 숫자 패턴을 추출하고 싶다면, regex101.com과 같은 온라인 정규표현식 테스트 사이트를 활용해볼 수 있습니다. 이 사이트에서 다양한 정규표현식 패턴을 실험하고, 원하는 결과를 얻을 수 있습니다.

5. 결론

이렇게 파이썬의 re 모듈을 사용하여 정규표현식을 이용한 숫자 추출 방법을 알아보았습니다. 정규표현식은 텍스트 데이터 처리에 매우 유용한 도구이므로, 다양한 상황에서 활용할 수 있습니다. 자주 사용해보면서 익숙해지도록 노력해보세요!