指定区域详细信息 - OcrV5Details

函数简介

识别窗口范围内的文字并返回详细信息，使用PP-OCRv5模型，支持自定义模型。x1、y1、x2、y2 传 0, 0, 0, 0 为窗口整个客户区，返回数据为相对窗口坐标。

接口名称

OcrV5Details

DLL调用

long OcrV5Details(long ola, int x1, int y1, int x2, int y2);

参数说明

参数名	类型	说明
ola	长整数型	OLAPlug对象的指针，由 CreateCOLAPlugInterFace 接口生成。
x1	整数型	区域左上角X坐标
y1	整数型	区域左上角Y坐标
x2	整数型	区域右下角X坐标
y2	整数型	区域右下角Y坐标

示例

C++

long instance = CreateCOLAPlugInterFace();
BindWindow(instance, hwnd, 0, 0, 0);
// 使用PP-OCRv5模型识别并返回详细信息
long resultPtr = OcrV5Details(instance, 0, 0, 0, 0);
char* json = GetStringFromPtr(instance, resultPtr);
// json 包含 Regions 数组及 Text 字段
FreeStringPtr(instance, resultPtr);

Python

# 待补充

返回值

字符串指针地址，返回识别到的JSON字符串，如：

{
    "Regions": [
        {
            "Score": 0,
            "Text": "bbbbbb",
            "Center": { "x": 100, "y": 200 },
            "Vertices": [
                { "x": 75, "y": 190 },
                { "x": 125, "y": 190 },
                { "x": 125, "y": 210 },
                { "x": 75, "y": 210 }
            ],
            "Angle": 0
        }
    ],
    "Text": "bbbbbb"
}

字段名	类型	说明
Regions	数组	Regions 结果列表，详见下方字段说明。
Text	字符串	识别文本。

Regions 元素字段说明：

字段名	类型	说明
Score	整数	识别置信度分值。
Text	字符串	识别文本。
Center	对象	中心点坐标对象。
Vertices	数组	顶点坐标集合。
Angle	整数	角度值。

Regions[].Center 字段说明：

字段名	类型	说明
x	整数	X 坐标。
y	整数	Y 坐标。

Regions[].Vertices 元素字段说明：

字段名	类型	说明
x	整数	X 坐标。
y	整数	Y 坐标。

Regions：所有识别到的数据集
Score：识别评分，分值越高越准确
Center：识别结果中心点
Vertices：识别结果的4个顶点
Angle：识别结果角度

返回的字符串指针需调用 FreeStringPtr 释放内存。

注意事项

字体比较特殊或者背景复杂识别不准确的，建议用图像识别来处理