主题
指定图片详细信息 - OcrFromPtrDetails
函数简介
对指定图片进行文字识别并返回详细信息。
接口名称
OcrFromPtrDetailsDLL调用
long OcrFromPtrDetails(long ola, long imgPtr);参数说明
| 参数名 | 类型 | 说明 |
|---|---|---|
| ola | 长整数型 | OLAPlug对象的指针,由 CreateCOLAPlugInterFace 接口生成。 |
| imgPtr | 长整数型 | 源图片对象的指针。 |
示例
SDK 调用
cpp
#include "OLAPlugServer.h"
OLAPlugServer ola;
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
long imgPtr = ola.LoadImage("images/scene.png");
auto detail = ola.OcrFromPtrDetails(imgPtr);
// detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
// 各字段说明见 OcrDetails 返回值文档csharp
using OLAPlug;
var ola = new OLAPlugServer();
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
long imgPtr = ola.LoadImage("images/scene.png");
var detail = ola.OcrFromPtrDetails(imgPtr);
// detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
// 各字段说明见 OcrDetails 返回值文档python
from OLAPlugServer import OLAPlugServer
ola = OLAPlugServer()
# LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
imgPtr = ola.LoadImage("images/scene.png")
detail = ola.OcrFromPtrDetails(imgPtr)
# detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
# 各字段说明见 OcrDetails 返回值文档java
import com.olaplug.OLAPlugServer;
OLAPlugServer ola = new OLAPlugServer();
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
long imgPtr = ola.LoadImage("images/scene.png");
var detail = ola.OcrFromPtrDetails(imgPtr);
// detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
// 各字段说明见 OcrDetails 返回值文档cpp
var ola = com("OlaPlug.OlaSoft")
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
var imgPtr = ola.LoadImage("images/scene.png")
var detail = ola.OcrFromPtrDetails(imgPtr)
// detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
// 各字段说明见 OcrDetails 返回值文档vbscript
Set ola = CreateObject("OlaPlug.OlaSoft")
' LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
imgPtr = ola.LoadImage("images/scene.png")
detail = ola.OcrFromPtrDetails(imgPtr)
' detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
' 各字段说明见 OcrDetails 返回值文档text
.局部变量 ola, OLAPlug
ola.创建 ()
' LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
imgPtr = ola.LoadImage(“images/scene.png“)
detail = ola.OcrFromPtrDetails(imgPtr)
' detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
' 各字段说明见 OcrDetails 返回值文档aardio
import OLAPlugServer;
var ola = OLAPlugServer();
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
var imgPtr = ola.LoadImage("images/scene.png");
var detail = ola.OcrFromPtrDetails(imgPtr);
// detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
// 各字段说明见 OcrDetails 返回值文档text
变量 ola <类型 = OLAPlugServer>
ola = 新建 OLAPlugServer
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
长整数 imgPtr = ola.LoadImage("images/scene.png")
自动 detail = ola.OcrFromPtrDetails(imgPtr)
// detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
// 各字段说明见 OcrDetails 返回值文档cpp
#include "OLAPlugServer.h"
OLAPlugServer ola;
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
long imgPtr = ola.LoadImage("images/scene.png");
auto detail = ola.OcrFromPtrDetails(imgPtr);
// detail.Regions 为识别框列表,detail.Text 为合并后的识别文本
// 各字段说明见 OcrDetails 返回值文档原生 DLL 调用
cpp
long instance = CreateCOLAPlugInterFace();
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
long imgPtr = LoadImage(instance, "images/scene.png");
long detailJsonPtr = OcrFromPtrDetails(instance, imgPtr);
if (detailJsonPtr != 0) {
char detailJson[512] = {0};
GetStringFromPtr(detailJsonPtr, detailJson, sizeof(detailJson));
FreeStringPtr(detailJsonPtr);
}csharp
using System.Runtime.InteropServices;
using System.Text;
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int GetStringFromPtr(long ptr, StringBuilder lpString, int size);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int FreeStringPtr(long ptr);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int GetStringSize(long ptr);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern long CreateCOLAPlugInterFace();
long instance = CreateCOLAPlugInterFace();
// LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
long imgPtr = LoadImage(instance, "images/scene.png");
long detailJsonPtr = OcrFromPtrDetails(instance, imgPtr);
if (detailJsonPtr != 0) {
StringBuilder detailJson = new StringBuilder(GetStringSize(detailJsonPtr) + 1);
GetStringFromPtr(detailJsonPtr, detailJson, detailJson.Capacity);
FreeStringPtr(detailJsonPtr);
string detailJsonStr = detailJson.ToString();
}python
from ctypes import CDLL, c_int, c_int64, create_string_buffer
ola = CDLL("OLAPlug_x64.dll")
ola.CreateCOLAPlugInterFace.restype = c_int64
instance = ola.CreateCOLAPlugInterFace()
# LoadImage 加载本地图,或 Capture(0,0,0,0) 截取绑定窗口客户区
imgPtr = LoadImage(instance, "images/scene.png")
detailJsonPtr = OcrFromPtrDetails(instance, imgPtr)
if detailJsonPtr:
buf = create_string_buffer(512)
ola.GetStringFromPtr(detailJsonPtr, buf, 512)
ola.FreeStringPtr(detailJsonPtr)
detailJson = buf.value.decode("utf-8")返回值
| 返回值 | 说明 |
|---|---|
| (返回值) | 字符串指针地址,返回识别到的JSON字符串,如:。 |
json
{
"Regions": [
{
"Score": 0,
"Text": "bbbbbb",
"Center": { "x": 100, "y": 200 },
"Vertices": [
{ "x": 75, "y": 190 },
{ "x": 125, "y": 190 },
{ "x": 125, "y": 210 },
{ "x": 75, "y": 210 }
],
"Angle": 0
}
],
"Text": "bbbbbb"
}| 字段名 | 类型 | 说明 |
|---|---|---|
| Regions | 数组 | Regions 结果列表,详见下方字段说明。 |
| Text | 字符串 | 识别文本。 |
Regions 元素字段说明:
| 字段名 | 类型 | 说明 |
|---|---|---|
| Score | 整数 | 识别置信度分值。 |
| Text | 字符串 | 识别文本。 |
| Center | 对象 | 中心点坐标对象。 |
| Vertices | 数组 | 顶点坐标集合。 |
| Angle | 整数 | 角度值。 |
Regions[].Center 字段说明:
| 字段名 | 类型 | 说明 |
|---|---|---|
| x | 整数 | X 坐标。 |
| y | 整数 | Y 坐标。 |
Regions[].Vertices 元素字段说明:
| 字段名 | 类型 | 说明 |
|---|---|---|
| x | 整数 | X 坐标。 |
| y | 整数 | Y 坐标。 |
- Regions:所有识别到的数据集
- Score:识别评分,分值越高越准确
- Center:识别结果中心点
- Vertices:识别结果的4个顶点
- Angle:识别结果角度
返回的字符串指针需调用 FreeStringPtr 释放内存。
注意事项
| 项目 | 说明 |
|---|---|
| 字体比较特殊或者背景复杂识别不准确的 | 字体比较特殊或者背景复杂识别不准确的,建议用图像识别来处理。 |
