Selenium(Edge/Chrome)

Selenium「ページ内のリンクURLを全て取得」

Edge/Chromeの現在のページ内のリンクURLを全て取得

Excel VBAマクロでEdge/Chromeを自動操作する際、
ページ内のリンクURLを全て取得したいケースがあります。

  • 検索結果のリンクURLを、一覧形式で保存したい。
  • 特定のHPのリンク先を、エクセル保存したい。

Linkデータからhref情報(URLリンク情報)を、for eachで取得するだけです。

Edge/Chromeでページ内のリンクURLを全て取得するコード

'■SeleniumBasicでページ内のリンクURLを取得する。
Dim driver As New Selenium.WebDriver
Public Sub sample()
    '■Chromeで起動
    driver.Start "chrome" 'Edgeの場合は driver.Start "edge"
    driver.Get "https://vba-create.jp/"
    
    Dim LinkURL As Variant 'As HTMLAnchorElement
    
    For Each LinkURL In driver.FindElementsByTag("a").Attribute("href")
        Debug.Print LinkURL
    Next LinkURL
    
End Sub

注意点

上記のサンプルコードはWebページの内のURLリンクを取得しています。
現在のページ情報などを取得したい場合は以下参照。

SeleniumBasicについて

Internet Explorer11 のサポート期限が2022年6月までと、スクレイピング自体入れ替えていく必要があります。
今一番スムーズなのはSeleniumBasicを使用したスクレイピングと考えます。

但し、VBAでのネット記事は少なく困っている方も多いと思います。
弊社で代行開発も可能ですので、お気軽にご用命ください。

コメント

タイトルとURLをコピーしました