[파이썬] 정규 표현식의 매칭 결과 문자열 길이

정규 표현식은 문자열에서 패턴을 매칭시켜 원하는 정보를 추출하는 강력한 도구입니다. 이때, 패턴과 매칭된 결과 문자열의 길이를 알고 싶을 때도 있습니다. 이번 블로그 포스트에서는 Python에서 정규 표현식의 매칭 결과 문자열의 길이를 구하는 방법을 살펴보겠습니다.

Python에서는 re 모듈을 사용하여 정규 표현식을 처리할 수 있습니다. 먼저, 필요한 패키지를 import합니다.

import re

다음으로, 정규 표현식을 사용하여 매칭 결과를 얻습니다. 이 예제에서는 re.findall() 함수를 사용합니다.

text = "Hello, World! This is a sample text."

pattern = r"\b\w+\b"
matches = re.findall(pattern, text)

위의 코드에서는 \b\w+\b라는 정규 표현식을 사용하여 단어를 추출하고 있습니다. re.findall() 함수는 패턴과 매칭되는 모든 부분 문자열을 리스트로 반환합니다. 따라서 matches 리스트에는 매칭된 모든 단어가 들어있습니다.

이제, 매칭 결과 문자열의 길이를 알아보겠습니다. Python의 내장 함수인 len() 함수를 사용하면 됩니다.

lengths = [len(match) for match in matches]

위의 코드에서는 리스트 내포를 사용하여 matches 리스트의 각 요소의 길이를 구하고, 이를 lengths 리스트에 저장하고 있습니다.

결과적으로, lengths 리스트에는 매칭된 각 단어의 길이가 저장되어 있습니다.

이제 lengths 리스트를 출력해보겠습니다.

print(lengths)

출력 결과는 다음과 같을 것입니다.

[5, 5, 8, 4, 6, 4]

이렇게 정규 표현식의 매칭 결과 문자열의 길이를 구할 수 있습니다. 이를 응용하여 다양한 패턴을 매칭하고 문자열의 길이를 계산할 수 있습니다.

정리

정규 표현식은 문자열 처리에 있어서 강력한 도구이므로, 다양한 상황에서 유용하게 활용할 수 있습니다. 패턴 매칭 결과를 활용하여 다양한 작업을 수행할 수 있으니, 적절히 응용하여 문제를 해결해 보시기 바랍니다.