[python] 정규표현식을 이용한 선택할 수 있는 문자열 추출하기

정규표현식은 문자열에서 특정 패턴을 찾거나 추출하기 위해 사용되는 강력한 도구입니다. 파이썬에서는 re 모듈을 이용하여 정규표현식을 쉽게 활용할 수 있습니다.

이번 예제에서는 주어진 문자열에서 특정 패턴을 가진 문자열을 선택하여 추출하는 방법에 대해 알아보겠습니다.

코드 예제

다음은 주어진 문자열에서 숫자로 시작하는 문자열을 추출하는 예제입니다.

import re

text = "1abc 2def 3ghi 4jkl 5mno"

pattern = r"\d\w+"

result = re.findall(pattern, text)

print(result)  # 출력: ['1abc', '2def', '3ghi', '4jkl', '5mno']

코드 설명

  1. re 모듈을 import 하여 정규표현식을 사용할 준비를 합니다.
  2. 주어진 문자열을 text 변수에 저장합니다.
  3. 패턴을 정의하기 위해 pattern 변수를 사용합니다. 이 패턴은 숫자로 시작하고 그 뒤에 한 개 이상의 단어 문자가 오는 패턴을 의미합니다. (\d는 숫자를 의미하고, \w+는 한 개 이상의 단어 문자를 의미합니다.)
  4. re.findall(pattern, text)를 사용하여 주어진 패턴을 가진 모든 문자열을 찾습니다.
  5. 결과는 result 변수에 저장됩니다.
  6. print(result)를 사용하여 결과를 출력합니다.

결과

위 예제를 실행하면 다음과 같은 결과가 출력됩니다.

['1abc', '2def', '3ghi', '4jkl', '5mno']

결론

정규표현식을 이용하여 특정 패턴을 가진 문자열을 추출하는 방법을 알아보았습니다. 이를 활용하면 다양한 문자열 처리 작업을 쉽고 효과적으로 수행할 수 있습니다.

더 많은 정보를 원하시면 파이썬 공식 문서를 참고해보세요.