[javascript] 정규 표현식으로 URL에서 도메인 추출하기
인터넷에서 작업할 때 종종 URL 에서 도메인을 추출해야 할 때가 있습니다. 이때 정규 표현식을 사용하면 간편하게 도메인을 추출할 수 있습니다.
JavaScript를 사용한 예제
const url = "https://www.example.com/path";
const domain = url.match(/^(?:https?:\/\/)?(?:[^@\n]+@)?(?:www\.)?([^:\/\n?]+)/img)[0];
console.log(domain);
위 코드에서 url.match(/^(?:https?:\/\/)?(?:[^@\n]+@)?(?:www\.)?([^:\/\n?]+)/img)[0]
는 URL에서 도메인을 추출하기 위한 정규 표현식입니다.
/^(?:https?:\/\/)?(?:[^@\n]+@)?(?:www\.)?([^:\/\n?]+)/img
정규 표현식은 다음과 같은 요소로 구성됩니다:
^
: 문자열의 시작(?:https?:\/\/)?
:http://
또는https://
를 나타내며,?
를 사용하여 없어도 된다고 표시함(?:[^@\n]+@)?
:@
를 나타내며,?
를 사용하여 없어도 된다고 표시함(?:www\.)?
:www.
를 나타내며,?
를 사용하여 없어도 된다고 표시함([^:\/\n?]+)
: 도메인을 나타내는 부분으로,^
로 시작하지 않고:
,/
,?
이 없는 문자열을 반환함
결과
위 코드에서 console.log(domain)
을 실행하면 www.example.com
이 출력됩니다.
이제 정규 표현식을 사용하여 JavaScript에서 URL에서 도메인을 추출하는 방법에 대해 알게 되었습니다.
참고: 이 예제는 “https://www.example.com/path” 이라는 특정 URL에 대해 도메인을 추출하는 방법을 보여주기 위한 것이며, 실제 URL에 따라 정규 표현식을 수정해야 할 수 있습니다.