[typescript] 정규 표현식을 사용하여 HTML 태그 안에 있는 내용 추출하는 방법

아래는 HTML 태그 안에 있는 내용을 추출하는 TypeScript 코드의 예시입니다.

function extractContent(html: string): string[] {
  const regex = /<[^>]*>([^<]+)<\/[^>]*>/g;
  const matches = html.match(regex);
  return matches || [];
}

const htmlString = '<div>Hello, World!</div><p>This is a paragraph.</p>';
const contentArray = extractContent(htmlString);
console.log(contentArray);  // ["Hello, World!", "This is a paragraph."]

이 예시 코드는 <div><p>와 같은 HTML 태그 안에 있는 텍스트 내용을 추출하는 방법을 보여줍니다. 정규 표현식 /<[^>]*>([^<]+)<\/[^>]*>/g<로 시작하고 >로 끝나는 태그 안에 있는 내용을 매칭합니다. 그리고 해당 내용은 괄호로 묶여 배열에 저장됩니다.

이 방법을 사용하여 TypeScript에서 정규 표현식을 활용해 HTML 태그 안에 있는 내용을 추출할 수 있습니다.

참고문헌: