指定区域详细信息 - OcrV5Details
函数简介
识别窗口范围内的文字并返回详细信息,使用PP-OCRv5模型,支持自定义模型。x1、y1、x2、y2 传 0, 0, 0, 0 为窗口整个客户区,返回数据为相对窗口坐标。
接口名称
OcrV5Details
DLL调用
long OcrV5Details(long ola, int x1, int y1, int x2, int y2);
参数说明
| 参数名 | 类型 | 说明 |
|---|---|---|
| ola | 长整数型 | OLAPlug对象的指针,由 CreateCOLAPlugInterFace 接口生成。 |
| x1 | 整数型 | 区域左上角X坐标 |
| y1 | 整数型 | 区域左上角Y坐标 |
| x2 | 整数型 | 区域右下角X坐标 |
| y2 | 整数型 | 区域右下角Y坐标 |
示例
C++
long instance = CreateCOLAPlugInterFace();
BindWindow(instance, hwnd, 0, 0, 0);
// 使用PP-OCRv5模型识别并返回详细信息
long resultPtr = OcrV5Details(instance, 0, 0, 0, 0);
char* json = GetStringFromPtr(instance, resultPtr);
// json 包含 Regions 数组及 Text 字段
FreeStringPtr(instance, resultPtr);
Python
# 待补充
返回值
字符串指针地址,返回识别到的JSON字符串,如:
{
"Regions": [
{
"Score": 0,
"Text": "bbbbbb",
"Center": { "x": 100, "y": 200 },
"Vertices": [
{ "x": 75, "y": 190 },
{ "x": 125, "y": 190 },
{ "x": 125, "y": 210 },
{ "x": 75, "y": 210 }
],
"Angle": 0
}
],
"Text": "bbbbbb"
}
| 字段名 | 类型 | 说明 |
|---|---|---|
| Regions | 数组 | Regions 结果列表,详见下方字段说明。 |
| Text | 字符串 | 识别文本。 |
Regions 元素字段说明:
| 字段名 | 类型 | 说明 |
|---|---|---|
| Score | 整数 | 识别置信度分值。 |
| Text | 字符串 | 识别文本。 |
| Center | 对象 | 中心点坐标对象。 |
| Vertices | 数组 | 顶点坐标集合。 |
| Angle | 整数 | 角度值。 |
Regions[].Center 字段说明:
| 字段名 | 类型 | 说明 |
|---|---|---|
| x | 整数 | X 坐标。 |
| y | 整数 | Y 坐标。 |
Regions[].Vertices 元素字段说明:
| 字段名 | 类型 | 说明 |
|---|---|---|
| x | 整数 | X 坐标。 |
| y | 整数 | Y 坐标。 |
- Regions:所有识别到的数据集
- Score:识别评分,分值越高越准确
- Center:识别结果中心点
- Vertices:识别结果的4个顶点
- Angle:识别结果角度
返回的字符串指针需调用 FreeStringPtr 释放内存。
注意事项
- 字体比较特殊或者背景复杂识别不准确的,建议用图像识别来处理
