跳转到内容
Last updated

通过文本识别 (OCR) 实现点击

RPA 提供三种模拟点击的方式:

  1. 点击元素: 通过 UI 树的 DOM 元素定位并点击当前元素。

  2. 点击(x, y): 通过当前屏幕的 X 轴和 Y 轴坐标定位点击位置。

  3. 通过文本识别 (OCR) 实现点击: 通过识别当前屏幕上的文本位置来实现点击。

以下详细介绍通过文本识别 (OCR) 实现点击的功能。

参数

  • 输入匹配文本

  • 您可以在屏幕上输入文本。

  • 当页面上存在多个匹配对象时

  • 获取单个元素

  • 获取元素列表

  • 匹配对象后点击

  • 开启:找到元素后点击

  • 关闭:仅找到元素

  • 点击位置

  • 中心点

  • 匹配对象区域内的随机点

  • 自定义

  • 相对于中心点的偏移量

  • 您可以通过相对于元素中心点的偏移量来调整点击位置。

  • 点击类型

  • 单击

  • 双击

  • 长按

  • 找到元素后的延迟

输出

输出参数

文本区域:{ "height": 30, "left": 343, "width": 142, "top": 332, "centerY": 347, "centerX": 414, "bottom": 362, "right": 485 }

输出字段说明

| 键 | 说明 |

| :------ | :------------------------------------------------- |

| height | 元素高度 |

| width | 元素宽度 |

| top | 元素顶部的 Y 轴坐标 |

| left | 元素左侧的 X 轴坐标 |

| bottom | 元素底部的 Y 轴坐标 |

| right | 元素右侧的 X 轴坐标 |

| centerY |元素中心的 Y 轴坐标 |

| centerX | 元素中心的 X 轴坐标 |

执行日志

  • 开始时间

  • 结束时间

  • 持续时间 (毫秒)

  • 状态 (成功/失败)

示例

例如,在云手机桌面上,希望点击 Chrome 浏览器。

配置如下:

  • 输入匹配文本: "Chrome"

  • 当页面上存在多个匹配对象时: "获取单个元素"

  • 匹配对象后点击: "开启"

  • 点击位置: "中心点"

  • 点击类型: "单击"

  • 找到元素后延迟: "0"

输出参数:

文本区域: { "height": 30, "left": 343, "width": 142, "top": 332, "centerY": 347, "centerX": 414, "bottom": 362, "right": 485 }

相关节点

点击元素

运行 JS 脚本