[python] 정규표현식을 이용한 선택할 수 있는 문자열 추출하기
정규표현식은 문자열에서 특정 패턴을 찾거나 추출하기 위해 사용되는 강력한 도구입니다. 파이썬에서는 re
모듈을 이용하여 정규표현식을 쉽게 활용할 수 있습니다.
이번 예제에서는 주어진 문자열에서 특정 패턴을 가진 문자열을 선택하여 추출하는 방법에 대해 알아보겠습니다.
코드 예제
다음은 주어진 문자열에서 숫자로 시작하는 문자열을 추출하는 예제입니다.
import re
text = "1abc 2def 3ghi 4jkl 5mno"
pattern = r"\d\w+"
result = re.findall(pattern, text)
print(result) # 출력: ['1abc', '2def', '3ghi', '4jkl', '5mno']
코드 설명
re
모듈을import
하여 정규표현식을 사용할 준비를 합니다.- 주어진 문자열을
text
변수에 저장합니다. - 패턴을 정의하기 위해
pattern
변수를 사용합니다. 이 패턴은 숫자로 시작하고 그 뒤에 한 개 이상의 단어 문자가 오는 패턴을 의미합니다. (\d
는 숫자를 의미하고,\w+
는 한 개 이상의 단어 문자를 의미합니다.) re.findall(pattern, text)
를 사용하여 주어진 패턴을 가진 모든 문자열을 찾습니다.- 결과는
result
변수에 저장됩니다. print(result)
를 사용하여 결과를 출력합니다.
결과
위 예제를 실행하면 다음과 같은 결과가 출력됩니다.
['1abc', '2def', '3ghi', '4jkl', '5mno']
결론
정규표현식을 이용하여 특정 패턴을 가진 문자열을 추출하는 방법을 알아보았습니다. 이를 활용하면 다양한 문자열 처리 작업을 쉽고 효과적으로 수행할 수 있습니다.
더 많은 정보를 원하시면 파이썬 공식 문서를 참고해보세요.