VBAで画像情報を取得するためのサブルーチン「imageValue」

VBAのIE(InternetExplorer)制御に便利なサブルーチンを紹介しています。

「imageValueサブルーチン」の詳しい解説については、以下より確認してください。

データ抽出やインターフェースの自動化にしても必ず最初は指定したURLをIEで起動させるところから始まります。 こちらの処理は何度も利用されるプログラムですので、そのような処理をサブルーチン化させると色々なメリットが生まれます。ここでは、そのようなサブルーチン化のメリットも含めて解説しています。

サブルーチンとは

サブルーチンとは、プログラム処理の中で繰り返し利用されるルーチン作業をモジュール化(部品化)してまとめたものになります。また、呼び出す側をメインルーチンと呼ぶのに対して「サブルーチン」と呼ばれます。

メリット

繰り返し利用されるルーチン作業をモジュール化(部品化)することで、同じ処理のプログラムを何度も書く手間が省け、プログラムも全体的に見やすくなります。これによりプログラムソースの可読性や保守性を高く保つことができます。

関連性の高いサブルーチン

Function imageValue(objIE As InternetExplorer, _
                    keywords As String) As Collection
                    
  Dim objImg As Object
  Dim arrImg As Collection

  Set arrImg = New Collection

  For Each objImg In objIE.document.images

    With objImg

      If InStr(.outerHTML, keywords) > 0 Then

        arrImg.Add .src, "src" '画像URL
        arrImg.Add .alt, "alt" 'alt属性
        arrImg.Add .Width, "width" 'width属性
        arrImg.Add .Height, "height" 'height属性
    
        Exit For
    
      End If
    
    End With

  Next
  
  Set imageValue = arrImg

End Function

こちらは戻り値を返すFunctionステートメントに引数を2つ設定しているlinkvalueサブルーチンになります。こちらの構文と引数の内容は以下になります。尚、引数はすべて参照渡しで渡されます。

imageValue("IEオブジェクト","格納するimg要素の一意のキーワード")
構文imageValue(objIE,keywords)
引数名データ型内容値の事例初期値省略
objIEInternetExplorerInternetExplorerオブジェクトを指定します。objIE,
objIE2
×
keywordsString格納するimg要素の一意のキーワードを文字列で指定します。"VBAの参照設定"×

引数objIEは必須項目で、文書ドキュメントを抽出するnternetExplorerオブジェクトを指定します。InternetExplorerオブジェクトを引数に設定することで、複数のオブジェクトを処理することができます。

引数keywordsは必須項目で、格納するimg要素の一意のキーワードを文字列で指定します。「格納するimg要素の一意のキーワード」というのは、格納するimg要素データ内で他とまったく被らないキーワードのことを指します。

例えば下記の場合、「こちらは一意のアンカーテキストです。」というキーワードは他では利用されていないキーワードですので、こちらを「一意のキーワード」と判断します。他にも「アンカーテキストです。」「です。」も一意のキーワードとして利用することもできます。

こちらの詳細については、「文書ドキュメント取得の処理の考え方」を確認してください。

<a href="#a1">こちらは一意のアンカーテキストではありません。</a>
<a href="#a2">こちらは一意のアンカーテキストではありません。</a>
<a href="#a3">こちらは一意のアンカーテキストです。</a>
<a href="#a4">こちらは一意のアンカーテキストではありません。</a>
<a href="#a5">こちらは一意のアンカーテキストではありません。</a>

  Dim objImg As Object
  Dim arrImg As Collection

こちらは、変数宣言でメモリ領域を割り当てるDimステートメントを利用してオブジェクト変数objImgに「オブジェクト型(Object)」を、オブジェクト変数arrImgに「Collection型」を変数宣言しています。

エクセルVBAで連想配列を作成する場合はCollectionオブジェクトを利用しますので、オブジェクト変数objIEは「InternetExplorer型」で宣言しています。

また、データ型はオブジェクト型(Object)を利用せず、より具体的なデータ型を宣言するほうがよいとされています。理由としては、補助入力機能など利便性のよさなどが挙げられます。

こちらについては本来であれば、「HTMLImage型」または「HTMLDocument型」などを指定するのがよいのでしょうか処理速度の観点からいうと必ずしもよいというわけではなりません。

他にもいくつか検証したのですが、以下のようにHTML関連のデータ型を選択した場合とオブジェクト型(Object)ではどれもオブジェクト型(Object)を選択した方が処理速度が速い結果となりました。

ですので、こちらで解説している内容のほとんどはオブジェクト型(Object)を選択しています。特に変更してもらっても問題ありませんので、自由に変更してください。

回数・処理オブジェクト型(Object)HTMLImage型HTMLDocument型
1回目27.3418秒31.6074秒31.9866秒
2回目28.3105秒34.0234秒33.9478秒
  Set arrImg = New Collection

こちらでは、オブジェクトを参照するSetステートメントを利用してオブジェクト変数arrImgCollectionオブジェクトを生成しています。こちらで記述しなくても宣言時に以下のように記述することもできますので、覚えておきましょう。

Dim arrImg As New Collection

  For Each objImg In objIE.document.images

   (処理省略)

  Next

こちらでは、For Each~NextステートメントのコレクションにDocumentオブジェクトのimagesプロパティで取得したコレクションを設定しています。また、オブジェクトを格納する変数にはオブジェクト変数objImgを設定しています。こちらでは、imagesプロパティで取得したすべてのimg要素の要素数だけループ処理を行っています。

    With objImg

      If InStr(.outerHTML, keywords) > 0 Then

        arrImg.Add .src, "src" '画像URL
        arrImg.Add .nameProp, "nameProp" '画像ファイル名
        arrImg.Add .alt, "alt" 'alt属性
        arrImg.Add .Width, "width" 'width属性
        arrImg.Add .Height, "height" 'height属性
    
        Exit For
    
      End If
    
    End With

まず、1つのオブジェクトに対して処理をまとめるWithステートメントのオブジェクト名に「objImg」を設定しています。そして、If~Then~Elseステートメントを利用して要素内の文書ドキュメントに引数keywordsのキーワードが含まれていないかチェックしています。

キーワードが含まれているかをチェックするには、指定したキーワードで最初に見つかった文字位置を返すInStr関数を利用しています。要素の文書ドキュメントに「引数keywords」のキーワードが含まれている場合は「0」以上の値を返すので、比較演算子を利用して「0」以上の場合を条件式としています。

そして、キーワードが含まれている場合はIf文内の処理を行います。こちらの処理は指定したimg要素を連想配列に格納する処理になります。連想配列に格納する場合はCollectionオブジェクトAddメソッドを利用します。利用方法については以下のような形で記述していきます。

arrImg.Add 配列に格納する要素, キー

連想配列に格納したらループ処理をする必要がありませんので、ループ処理を回避するExit Forステートメントを利用してループから抜け出します。

  Set imageValue = arrImg

そして、Setステートメントを利用して戻り値imageValue格納したimg要素の連想配列代入演算子でセットしています。