[go] Go 언어로 동적 웹 페이지 크롤링하기
Go 언어는 강력한 도구 세트를 제공하여 웹 크롤링과 스크래핑 작업에 이상적인 선택입니다. 이 글에서는 Go 언어를 사용하여 동적 웹 페이지를 크롤링하는 방법에 대해 알아보겠습니다.
필요한 패키지 설치하기
먼저, Go 언어에서 웹 크롤링을 가능하게 해주는 패키지를 가져와야 합니다. goquery
패키지는 HTML 문서를 파싱하고 DOM을 조작하는 데 사용됩니다.
go get github.com/PuerkitoBio/goquery
동적 웹 페이지 크롤링 코드 작성하기
이제 패키지를 가져왔으니, 동적 웹 페이지를 크롤링하는 코드를 작성해보겠습니다. 다음은 예시입니다.
package main
import (
"fmt"
"github.com/PuerkitoBio/goquery"
)
func main() {
// 크롤링할 웹 페이지 URL
url := "https://example.com"
// 웹 페이지 가져오기
doc, err := goquery.NewDocument(url)
if err != nil {
panic(err)
}
// 웹 페이지에서 원하는 정보 추출하기
doc.Find("h1").Each(func(i int, s *goquery.Selection) {
// <h1> 태그의 텍스트 출력하기
fmt.Println(s.Text())
})
}
위의 코드는 https://example.com
웹 페이지에서 <h1>
태그의 텍스트를 가져와서 출력합니다.
실행결과 확인하기
이제 위의 코드를 실행해보겠습니다. 터미널에서 다음 명령어를 실행합니다.
go run main.go
실행 결과는 다음과 같을 것입니다.
Welcome to Example.com
결론
Go 언어는 간단하면서도 빠른 웹 크롤링을 가능하게 해주는 강력한 언어입니다. goquery
패키지를 이용하여 동적 웹 페이지를 크롤링하는 작업을 쉽게 수행할 수 있습니다. 다음에 웹 크롤링 작업이 필요하다면 Go 언어를 고려해보세요.
참고 자료: