Selenium(Edge/Chrome)

Edge/Chromeでhead要素・body要素/ページソースを取得【PageSource】【Selenium】【ExcelVBA】

VBAでEdge/Chromeを起動し、Webページ内のhead要素を取得・body要素を取得する方法です。
基本的にはId要素やName要素を取得する場合と取得の仕方は同一です。

IEの場合はhead要素、body要素を簡単に取得できましたが、Seleniumの場合はAttributeで取得します。

Webページのhead要素・body要素を取得するサンプルコード


Dim driver As New WebDriver
'■Chrome/EdgeのHEAD/BODY/ソースすべてを取得する
Public Sub sample()
    driver.Start "chrome"
    driver.Get ("https://vba-create.jp")
    
    '■HEAD要素を取得
    MsgBox driver.FindElementsByTag("HEAD")(1).Attribute("outerHTML")
    
    '■BODY要素を取得
    MsgBox driver.FindElementsByTag("BODY")(1).Attribute("outerHTML")
    
    '■ページのソースすべて取得
    MsgBox driver.PageSource
End Sub

SeleniumBasicについて

Internet Explorer11 のサポート期限が2022年6月までと、スクレイピング自体入れ替えていく必要があります。
今一番スムーズなのはSeleniumBasicを使用したスクレイピングと考えます。

但し、VBAでのネット記事は少なく困っている方も多いと思います。
弊社で代行開発も可能ですので、お気軽にご用命ください。

コメント

タイトルとURLをコピーしました