Skip to content

从字库中识别文字 - OcrFromDictPtrDetails

函数简介

从字库中识别指定图片的文字并返回详细信息,需提前加载数据库。支持多个字库同时识别,多个字库用 \| 分割,如 dict1\|dict2

接口名称

OcrFromDictPtrDetails

DLL调用

long OcrFromDictPtrDetails(long instance, long ptr, string colorJson, string dict_name, double matchVal);

参数说明

参数名类型说明
instance长整数型OLAPlug对象的指针,由 CreateCOLAPlugInterFace 接口生成。
ptr长整数型图像指针。
colorJson字符串颜色模型配置字符串,用于限定图像匹配中的颜色范围,格式说明见 颜色模型说明 - ColorModel。JSON格式示例:[{"StartColor":"3278FA","EndColor":"6496FF","Type":0}];简化格式示例:`3278FA-000000。
dict_name字符串字库名称,为空时搜索所有字库;多个字库用 | 分割,如 dict1|dict2
matchVal双精度浮点数匹配值。

示例

SDK 调用

cpp
#include "OLAPlugServer.h"

OLAPlugServer ola;
auto result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9);
// result 含 Regions、Text 等字段,SDK 已解析为对象
csharp
using OLAPlug;

var ola = new OLAPlugServer();
var result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9);
// result 含 Regions、Text 等字段,SDK 已解析为对象
python
from OLAPlugServer import OLAPlugServer

ola = OLAPlugServer()
result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9)
# result 含 Regions、Text 等字段,SDK 已解析为对象
java
import com.olaplug.OLAPlugServer;

OLAPlugServer ola = new OLAPlugServer();
var result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9);
// result 含 Regions、Text 等字段,SDK 已解析为对象
cpp
var ola = com("OlaPlug.OlaSoft")
var result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9)
// result 含 Regions、Text 等字段,SDK 已解析为对象
vbscript
Set ola = CreateObject("OlaPlug.OlaSoft")
result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9)
' result 含 Regions、Text 等字段,SDK 已解析为对象
text
.局部变量 ola, OLAPlug
ola.创建 ()
result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9)
' result 含 Regions、Text 等字段,SDK 已解析为对象
aardio
import OLAPlugServer;
var ola = OLAPlugServer();
var result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9);
// result 含 Regions、Text 等字段,SDK 已解析为对象
text
变量 ola <类型 = OLAPlugServer>
ola = 新建 OLAPlugServer
自动 result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9)
// result 含 Regions、Text 等字段,SDK 已解析为对象
cpp
#include "OLAPlugServer.h"

OLAPlugServer ola;
auto result = ola.OcrFromDictPtrDetails(0, "value", "num", 0.9);
// result 含 Regions、Text 等字段,SDK 已解析为对象

原生 DLL 调用

cpp
long instance = CreateCOLAPlugInterFace();
long ptr = OcrFromDictPtrDetails(instance, 0, "value", "num", 0.9);
if (ptr != 0) {
    char buffer[512] = {0};
    GetStringFromPtr(ptr, buffer, sizeof(buffer));
    FreeStringPtr(ptr);
}
csharp
using System.Runtime.InteropServices;
using System.Text;

[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern long CreateCOLAPlugInterFace();
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int GetStringFromPtr(long ptr, StringBuilder lpString, int size);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int FreeStringPtr(long ptr);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int GetStringSize(long ptr);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern long OcrFromDictPtrDetails(long ola, long ptr, string colorJson, string dict_name, int matchVal);

long instance = CreateCOLAPlugInterFace();
long ptr = OcrFromDictPtrDetails(instance, 0, "value", "num", 0.9);
if (ptr != 0) {
    StringBuilder sb = new StringBuilder(GetStringSize(ptr) + 1);
    GetStringFromPtr(ptr, sb, sb.Capacity);
    FreeStringPtr(ptr);
    string result = sb.ToString();
}
python
from ctypes import CDLL, c_int, c_int64, create_string_buffer

ola = CDLL("OLAPlug_x64.dll")
ola.CreateCOLAPlugInterFace.restype = c_int64
instance = ola.CreateCOLAPlugInterFace()
ptr = ola.OcrFromDictPtrDetails(instance, 0, "value", "num", 0.9)
if ptr:
    buf = create_string_buffer(512)
    ola.GetStringFromPtr(ptr, buf, 512)
    ola.FreeStringPtr(ptr)
    result = buf.value.decode("utf-8")

返回值

返回值说明
(返回值)字符串指针地址,返回识别到的JSON字符串,如:。
json
{
    "Regions": [
        {
            "Score": 0,
            "Text": "bbbbbb",
            "Center": { "x": 100, "y": 200 },
            "Vertices": [
                { "x": 75, "y": 190 },
                { "x": 125, "y": 190 },
                { "x": 125, "y": 210 },
                { "x": 75, "y": 210 }
            ],
            "Angle": 0
        }
    ],
    "Text": "bbbbbb"
}
字段名类型说明
Regions数组Regions 结果列表,详见下方字段说明。
Text字符串识别文本。

Regions 元素字段说明:

字段名类型说明
Score整数识别置信度分值。
Text字符串识别文本。
Center对象中心点坐标对象。
Vertices数组顶点坐标集合。
Angle整数角度值。

Regions[].Center 字段说明:

字段名类型说明
x整数X 坐标。
y整数Y 坐标。

Regions[].Vertices 元素字段说明:

字段名类型说明
x整数X 坐标。
y整数Y 坐标。
  • Regions:所有识别到的数据集
  • Score:识别评分,分值越高越准确
  • Center:识别结果中心点
  • Vertices:识别结果的4个顶点
  • Angle:识别结果角度

返回的字符串指针需调用 FreeStringPtr 释放内存。