[python] HTTPie를 사용하여 웹 페이지의 링크를 추출하는 방법은 어떻게 되나요?
-
HTTPie를 설치합니다. 터미널에서
pip install httpie
명령을 실행하여 설치합니다. -
HTTPie를 사용하여 웹 페이지에 GET 요청을 보냅니다. 아래 명령을 사용하여 원하는 웹 페이지로 이동하세요:
http GET <URL>
여기서
은 링크를 추출하려는 웹 페이지의 주소입니다. -
응답을 확인하고 링크를 추출합니다. HTTPie의 응답은 JSON 형식으로 제공됩니다. JSON을 파싱하여 웹 페이지의 링크를 추출할 수 있습니다. 예를 들어, 다음과 같이 명령을 실행하여 링크를 추출할 수 있습니다:
http GET <URL> | jq '.links[].href'
이 명령은 jq 도구를 사용하여 .links[].href 키를 추출합니다.
프로그램적으로 링크를 추출하는 것이 더 효율적이라면, Python의 requests 모듈을 사용하여 GET 요청을 보내고 응답을 파싱할 수 있습니다. 이렇게 추출된 링크를 다양한 방법으로 처리할 수 있습니다.