業務効率化のネタ帳

RPAとかVBAとか

UiPathのお勉強 その36(UiPath RPA アソシエイト資格試験 練習問題36)

UiPath RPA アソシエイト資格試験の練習問題を通じて、知識の理解を深めましょう。

 

問題:

Native 画像スクレイピング (Native screen scraping) メソッドはどのように動作しますか。

  1. バックグラウンドで実行される。
  2. 非表示のテキストを抽出する。
  3. テキスト位置を抽出する。
  4. Citrix をサポートする。

正解:

3

 

 

今回のポイント

 

画面スクレイピングメソッド(指定した UI 要素や .pdf ファイルなどのドキュメントからデータを抽出することができるアクティビティ)には、下記、3つの種類があります。

 

■フルテキスト

[フルテキスト] は既定のメソッドです。高速で正確ですが、[ネイティブ] メソッドと違ってテキストの画面座標を抽出することはできません。

■ネイティブ

[ネイティブ] メソッドは、グラフィックス デバイス インターフェイス (GDI) でテキストをレンダリングするように設計されたアプリケーションでのみ機能します。

(補足)グラフィックス デバイス インターフェイス (GDI) とは

GDIとは、Windowsに搭載された、グラフィック処理を行うプログラムのことである。

GDIは、主に画面表示や印刷をコントロールする。GDIを用いてアプリケーションソフトの出力を行えば、機種や装置の違いを補正し、出力命令をプリンタドライバやディスプレイドライバが処理できる形に変換してから、それぞれのドライバに送ることができる。

ちなみに、GDIで対処しきれない高速な描画や動画、3DCGなどの処理を行うためのAPIが、Microsoft社によって提供されているDirectXである。

Graphic Device Interfaceとは何? Weblio辞書

OCR

OCR は 100% 正確というわけではありませんが、他の 2 つのメソッドでは抽出できないテキストを抽出するのに便利な場合があり、Citrix を含むすべてのアプリケーションで機能します。

(補足)Citrix とは

簡単に言うと、シトリックスシステムズ社が手掛ける、コンピュータの仮想化や遠隔操作のソフトウェアのことです。

 

それぞれの違いをまとめると下記の通り。

機能メソッド 速度 精度 バックグラウンドでの実行 テキスト位置の抽出 隠されたテキストの抽出 Citrix サポート
フルテキスト 10/10 100% × ×
ネイティブ 8/10 100% × × ×
OCR 3/10 98% × ×

出力メソッドまたは画面スクレイピング メソッド (uipath.com)

 

ロボットが画面の内容を読み取る際に、フルテキストは、要素の違いを考えることなく、文章を全て読み取ります。ネイティブはGDIを利用して、OCRは画像認識技術を使用して、要素を区別します。

 

ネイティブとOCRは、画面に表示されているものしか認識できません。対して、フルテキストは、バックグラウンドで、しかも画面に表示されていないテキストも読み取ることができます。

 

OCRは文字の認識を誤ることもあり、不正確な部分がありますが、Citrix社の仮想PC上の文字を認識することができます。

 

よって、3 が正解です。