[swift] SwiftSoup을 이용해 웹페이지의 텍스트를 추출하는 방법은 무엇인가요?

웹 스크래핑은 웹페이지에서 데이터를 추출하고 분석하는 프로세스입니다. SwiftSoup은 Swift에서 HTML을 처리하고 웹페이지에서 데이터를 추출하는 데 사용되는 강력한 라이브러리입니다.

아래는 SwiftSoup을 사용하여 웹페이지에서 텍스트를 추출하는 단계별 예제 코드입니다.

1. SwiftSoup 설치

먼저, SwiftSoup을 프로젝트에 설치해야 합니다. CocoaPods를 사용할 경우, Podfile에 다음 라인을 추가하고 터미널에서 pod install 명령을 실행하세요.

pod 'SwiftSoup'

2. SwiftSoup 라이브러리 임포트

프로젝트의 파일 상단에 SwiftSoup 라이브러리를 임포트합니다.

import SwiftSoup

3. 웹페이지에서 텍스트 추출

guard let url = URL(string: "https://www.example.com") else {
    return
}

do {
    let html = try String(contentsOf: url)
    let doc: Document = try SwiftSoup.parse(html)
    let text: String = try doc.text()
    print(text)
} catch {
    print("Error: \(error)")
}

위의 코드에서, URL(string: "https://www.example.com") 부분을 추출하려는 웹페이지의 URL로 변경하세요.

결과 텍스트 추출

위의 코드를 실행하면 웹페이지에서 추출한 텍스트가 콘솔에 출력됩니다. 이제 이 텍스트를 필요에 따라 사용하면 됩니다.


참고: SwiftSoup - GitHub