[python] 정규표현식을 이용한 공백 문자열 제거하기
공백 문자열을 제거하는 작업은 문자열 처리에서 자주 사용되는 작업 중 하나입니다. 파이썬에서는 정규표현식을 사용하여 간단하게 공백 문자열을 제거할 수 있습니다. 이번 포스트에서는 정규표현식을 이용하여 공백 문자열을 제거하는 방법을 알아보겠습니다.
1. re
모듈 임포트하기
정규표현식을 사용하기 위해 우선 파이썬의 re
모듈을 임포트해야 합니다. re
모듈은 정규표현식을 처리할 수 있는 다양한 함수를 제공합니다.
import re
2. 공백 문자열 제거하기
정규표현식을 이용하여 공백 문자열을 제거하는 방법은 간단합니다. re.sub()
함수를 사용하여 문자열 내의 공백을 찾아 다른 문자열로 대체하면 됩니다. 아래의 예제를 살펴보겠습니다.
import re
text = " Hello, world! "
cleaned_text = re.sub("\s+", " ", text).strip()
print(cleaned_text) # 출력: "Hello, world!"
위의 예제에서는 re.sub()
함수를 사용하여 공백을 찾아서 한 개의 공백으로 대체한 후, strip()
함수를 사용하여 문자열 앞뒤에 남은 공백을 제거합니다. 결과적으로 “Hello, world!”라는 문자열이 출력됩니다.
3. 정규표현식 설명
위 예제에서 사용한 정규표현식에 대해 간단히 설명하면 다음과 같습니다.
\s+
: 하나 이상의 공백 문자에 매칭됩니다.
정규표현식의 패턴을 변경하면 다른 문자열도 제거할 수 있습니다. 예를 들어, 탭 문자를 제거하고 싶다면 \t+
로 패턴을 변경하면 됩니다.