VBAでEdge/Chromeを起動し、Webページ内のhead要素を取得・body要素を取得する方法です。
基本的にはId要素やName要素を取得する場合と取得の仕方は同一です。
IEの場合はhead要素、body要素を簡単に取得できましたが、Seleniumの場合はAttributeで取得します。
Webページのhead要素・body要素を取得するサンプルコード
Dim driver As New WebDriver
'■Chrome/EdgeのHEAD/BODY/ソースすべてを取得する
Public Sub sample()
driver.Start "chrome"
driver.Get ("https://vba-create.jp")
'■HEAD要素を取得
MsgBox driver.FindElementsByTag("HEAD")(1).Attribute("outerHTML")
'■BODY要素を取得
MsgBox driver.FindElementsByTag("BODY")(1).Attribute("outerHTML")
'■ページのソースすべて取得
MsgBox driver.PageSource
End Sub
SeleniumBasicについて
Internet Explorer11 のサポート期限が2022年6月までと、スクレイピング自体入れ替えていく必要があります。
今一番スムーズなのはSeleniumBasicを使用したスクレイピングと考えます。
但し、VBAでのネット記事は少なく困っている方も多いと思います。
弊社で代行開発も可能ですので、お気軽にご用命ください。
コメント