[typescript] 정규 표현식을 사용하여 HTML 태그 안에 있는 내용 추출하는 방법
아래는 HTML 태그 안에 있는 내용을 추출하는 TypeScript 코드의 예시입니다.
function extractContent(html: string): string[] {
const regex = /<[^>]*>([^<]+)<\/[^>]*>/g;
const matches = html.match(regex);
return matches || [];
}
const htmlString = '<div>Hello, World!</div><p>This is a paragraph.</p>';
const contentArray = extractContent(htmlString);
console.log(contentArray); // ["Hello, World!", "This is a paragraph."]
이 예시 코드는 <div>
나 <p>
와 같은 HTML 태그 안에 있는 텍스트 내용을 추출하는 방법을 보여줍니다. 정규 표현식 /<[^>]*>([^<]+)<\/[^>]*>/g
는 <
로 시작하고 >
로 끝나는 태그 안에 있는 내용을 매칭합니다. 그리고 해당 내용은 괄호로 묶여 배열에 저장됩니다.
이 방법을 사용하여 TypeScript에서 정규 표현식을 활용해 HTML 태그 안에 있는 내용을 추출할 수 있습니다.
참고문헌: