跳转到内容

RPA

/

步骤

/

/

OCR 文字识别点击

Last updated 1 个月前

通过文本识别 (OCR) 实现点击

RPA 提供三种模拟点击的方式：

点击元素: 通过 UI 树的 DOM 元素定位并点击当前元素。
点击(x, y): 通过当前屏幕的 X 轴和 Y 轴坐标定位点击位置。
通过文本识别 (OCR) 实现点击: 通过识别当前屏幕上的文本位置来实现点击。

以下详细介绍通过文本识别 (OCR) 实现点击的功能。

参数

输入匹配文本
您可以在屏幕上输入文本。
当页面上存在多个匹配对象时
获取单个元素
获取元素列表
匹配对象后点击
开启：找到元素后点击
关闭：仅找到元素
点击位置
中心点
匹配对象区域内的随机点
自定义
相对于中心点的偏移量
您可以通过相对于元素中心点的偏移量来调整点击位置。
点击类型
单击
双击
长按
找到元素后的延迟

输出

输出参数

文本区域：{ "height": 30, "left": 343, "width": 142, "top": 332, "centerY": 347, "centerX": 414, "bottom": 362, "right": 485 }

输出字段说明

| 键 | 说明 |

| :------ | :------------------------------------------------- |

| height | 元素高度 |

| width | 元素宽度 |

| top | 元素顶部的 Y 轴坐标 |

| left | 元素左侧的 X 轴坐标 |

| bottom | 元素底部的 Y 轴坐标 |

| right | 元素右侧的 X 轴坐标 |

| centerY |元素中心的 Y 轴坐标 |

| centerX | 元素中心的 X 轴坐标 |

执行日志

开始时间
结束时间
持续时间 (毫秒)
状态 (成功/失败)

示例

例如，在云手机桌面上，希望点击 Chrome 浏览器。

配置如下：

输入匹配文本: "Chrome"
当页面上存在多个匹配对象时: "获取单个元素"
匹配对象后点击: "开启"
点击位置: "中心点"
点击类型: "单击"
找到元素后延迟: "0"

输出参数：

文本区域: { "height": 30, "left": 343, "width": 142, "top": 332, "centerY": 347, "centerX": 414, "bottom": 362, "right": 485 }

相关节点

点击元素

运行 JS 脚本

Tap x y

Swipe Page