コンテンツへスキップ

テキスト認識(OCR)によるクリック

RPAでは、クリックをシミュレートする方法が3つあります。

  1. 要素のタップ: UIツリーのDOM要素から現在の要素を特定し、クリックします。

  2. タップ(x, y): 現在の画面のX軸とY軸の座標からクリック位置を特定します。

  3. テキスト認識(OCR)によるクリック: 現在の画面上のテキストの位置を認識してクリックします。

以下では、テキスト認識(OCR)によるクリック機能の詳細を説明します。

パラメータ

  • 一致するテキストを入力

  • 画面上にテキストを入力できます。

  • ページ上に一致するオブジェクトが複数ある場合

  • 単一要素を取得

  • 要素リストを取得

  • オブジェクトが一致した後にクリック

  • オン:要素が見つかった後にクリック

  • オフ:要素が見つかった後のみクリック

  • クリック位置

  • 中心点

  • 一致したオブジェクト領域内のランダムな位置

  • カスタム

  • 中心点からのオフセット

  • 要素の中心点からのオフセット値でクリック位置を調整できます。

  • タップの種類

  • シングルタップ

  • ダブルタップ

  • 長押し

  • 要素検出後の遅延

出力

出力パラメータ

テキストエリア: { "height": 30, "left": 343, "width": 142, "top": 332, "centerY": 347, "centerX": 414, "bottom": 362, "right": 485 }

出力フィールドの説明

| キー | 説明 |

| :------ | :------------------------------------------------- |

| height | 要素の高さ |

| width | 要素の幅 |

| top | 要素の上端のY座標 |

| left | 要素の左端のX座標 |

| bottom | 要素の下端のY座標 |

| right | 要素の右端のX座標 |

| centerY |要素の中心のY座標 |

| centerX | 要素の中心のX座標 |

実行ログ

  • 開始時刻
  • 終了時刻
  • 実行時間 (ms)
  • ステータス (成功/失敗)

例えば、クラウドフォンのデスクトップで、Chromeブラウザをクリックする操作を想定します。

設定は以下のとおりです。

  • 一致するテキストを入力: "Chrome"
  • ページ上に複数の一致するオブジェクトがある場合: "単一要素を取得"
  • オブジェクトが一致した後にクリック: "オン"
  • クリック位置: "中央点"
  • タップの種類: "シングルタップ"
  • 要素検出後の遅延時間: "0"

出力パラメータ:

テキストエリア: { "height": 30, "left": 343, "width": 142, "top": 332, "centerY": 347, "centerX": 414, "bottom": 362, "right": 485 }

関連ノード

要素をタップ

JSスクリプトを実行