[javascript] 자바스크립트 정규식을 활용한 문자열 분리

자바스크립트에서 문자열을 분리하고 특정 패턴에 맞는 문자열을 추출하는 작업은 정규식을 사용하여 간단히 처리할 수 있습니다. 정규식을 이용하면 효율적으로 원하는 결과를 얻을 수 있습니다.

문자열을 공백 기준으로 분리하기

자바스크립트에서 문자열을 공백을 기준으로 분리하는 방법은 split 메서드를 사용하는 것이 일반적입니다. 하지만 정규식을 활용하여 더 다양한 경우에 대응할 수 있습니다.

예를 들어, 다음과 같은 문자열이 있다고 가정해 봅시다.

const sentence = "The quick brown fox jumps over the lazy dog";

이 문자열을 공백을 기준으로 분리하여 배열로 얻고 싶다면, 다음과 같은 코드를 사용할 수 있습니다.

const words = sentence.split(/\s+/);
console.log(words);

위 코드에서 정규식 /\\s+/는 하나 이상의 공백을 나타내는 패턴을 의미합니다. 따라서 split 메서드는 이 패턴에 맞는 부분을 찾아 배열로 분리하여 반환합니다.

특정 문자열 패턴에 맞는 부분 추출하기

때로는 문자열에서 특정한 패턴에 맞는 부분만을 추출해야 하는 경우가 있습니다. 예를 들어, 이메일 주소나 전화번호와 같은 특정 형식의 문자열을 찾아내는 작업은 정규식으로 간단히 수행할 수 있습니다.

이메일 주소에서 도메인 부분만을 추출하는 예제를 살펴보겠습니다.

const email = "user@example.com";
const domain = email.match(/@(.+)/)[1];
console.log(domain);

위 코드에서 match 메서드를 사용하여 이메일 주소에서 @를 기준으로 도메인 부분을 추출하고 있습니다. 정규식 /@(.+)/에서 괄호는 그룹을 나타내며, [1]은 첫 번째 그룹을 의미합니다.

결론

자바스크립트에서는 정규식을 활용하여 문자열을 효율적으로 분리하고 원하는 부분을 추출할 수 있습니다. 정규식은 강력한 도구이므로 잘 숙지하고 활용한다면 다양한 문자열 처리에 유용하게 활용할 수 있습니다.

참고 문헌: MDN Web Docs - 정규 표현식