VBAでリンク情報を取得するためのサブルーチン「linkValue」

VBAのIE(InternetExplorer)制御に便利なサブルーチンを紹介しています。

「linkvalueサブルーチン」の詳しい解説については、以下より確認してください。

データ抽出やインターフェースの自動化にしても必ず最初は指定したURLをIEで起動させるところから始まります。 こちらの処理は何度も利用されるプログラムですので、そのような処理をサブルーチン化させると色々なメリットが生まれます。ここでは、そのようなサブルーチン化のメリットも含めて解説しています。

サブルーチンとは

サブルーチンとは、プログラム処理の中で繰り返し利用されるルーチン作業をモジュール化(部品化)してまとめたものになります。また、呼び出す側をメインルーチンと呼ぶのに対して「サブルーチン」と呼ばれます。

メリット

繰り返し利用されるルーチン作業をモジュール化(部品化)することで、同じ処理のプログラムを何度も書く手間が省け、プログラムも全体的に見やすくなります。これによりプログラムソースの可読性や保守性を高く保つことができます。

関連性の高いサブルーチン

Function linkValue(objIE As InternetExplorer, _
                   keywords As String) As String
                  
  Dim objLink As Object

  For Each objLink In objIE.document.Links

    If InStr(objLink.outerHTML, keywords) > 0 Then

      linkValue = objLink.href

      Exit For

    End If

  Next

End Function

こちらは戻り値を返すFunctionステートメントに引数を2つ設定しているlinkvalueサブルーチンになります。こちらの構文と引数の内容は以下になります。尚、引数はすべて参照渡しで渡されます。

linkValue("IEオブジェクト","抽出する要素の一意のキーワード")
構文classValue(objIE,className,tagName,valueType)
引数名データ型内容値の事例初期値省略
objIEInternetExplorerInternetExplorerオブジェクトを指定します。objIE,
objIE2
×
keywordsString抽出する要素の一意のキーワードを文字列で指定します。"VBAのIE制御"×

引数objIEは必須項目で、文書ドキュメントを抽出するnternetExplorerオブジェクトを指定します。InternetExplorerオブジェクトを引数に設定することで、複数のオブジェクトを処理することができます。

引数keywordsは必須項目で、抽出する要素の一意のキーワードを文字列で指定します。「抽出する要素の一意のキーワード」というのは、抽出したい要素データ内で他とまったく被らないキーワードのことを指します。

例えば下記の場合、「こちらは一意のアンカーテキストです。」というキーワードは他では利用されていないキーワードですので、こちらを「一意のキーワード」と判断します。他にも「アンカーテキストです。」「です。」も一意のキーワードとして利用することもできます。

こちらの詳細については、「文書ドキュメント取得の処理の考え方」を確認してください。

<a href="#a1">こちらは一意のアンカーテキストではありません。</a>
<a href="#a2">こちらは一意のアンカーテキストではありません。</a>
<a href="#a3">こちらは一意のアンカーテキストです。</a>
<a href="#a4">こちらは一意のアンカーテキストではありません。</a>
<a href="#a5">こちらは一意のアンカーテキストではありません。</a>

Dim objLink As Object

こちらは、変数宣言でメモリ領域を割り当てるDimステートメントを利用してオブジェクト変数objLinkに「オブジェクト型(Object)」を変数宣言しています。

先に説明すると、データ型はオブジェクト型(Object)を利用せず、より具体的なデータ型を宣言するほうがよいとされています。理由としては、補助入力機能など利便性のよさなどが挙げられます。

こちらについては本来であれば、「HTMLLinkElement型」または「HTMLDocument型」などを指定するのがよいのでしょうか処理速度の観点からいうと必ずしもよいというわけではなりません。

他にもいくつか検証したのですが、以下のようにHTML関連のデータ型を選択した場合とオブジェクト型(Object)ではどれもオブジェクト型(Object)を選択した方が処理速度が速い結果となりました。

ですので、こちらで解説している内容のほとんどはオブジェクト型(Object)を選択しています。特に変更してもらっても問題ありませんので、自由に変更してください。

回数・処理オブジェクト型(Object)HTMLLinkElement型HTMLDocument型
1回目27.3418秒31.6074秒31.9866秒
2回目28.3105秒34.0234秒33.9478秒
  For Each objLink In objIE.document.Links

   (処理省略)

  Next

こちらでは、For Each~NextステートメントのコレクションにDocumentオブジェクトのLinksプロパティで取得したコレクションを設定しています。また、オブジェクトを格納する変数にはオブジェクト変数objLinkを設定しています。こちらでは、Linksプロパティで取得したすべてのa要素の要素数だけループ処理を行っています。

If InStr(objLink.outerHTML, keywords) > 0 Then
    
      linkValue = objLink.href
      
      Exit For

    End If

こちらでは、If~Then~Elseステートメントを利用して要素内の文書ドキュメントに引数keywordsのキーワードが含まれていないかチェックしています。

キーワードが含まれているかをチェックするには、指定したキーワードで最初に見つかった文字位置を返すInStr関数を利用しています。要素の文書ドキュメントに「引数keywords」のキーワードが含まれている場合は必ず「0」以上の値を返すので、比較演算子を利用して「0」以上の場合を条件式としています。

そして、キーワードが含まれている場合は戻り値linkvalueに要素オブジェクトのhrefプロパティを利用して指定した要素のリンクURL代入演算子で格納しています。リンクURLの抽出が完了するとループ処理をする必要がありませんので、ループ処理を回避するExit Forステートメントを利用してループから抜け出します。