包含 通用 OCR(含 PP-OCR/V5 系列)、字库识字与找字、字库/词条维护 以及 OCR 参数配置。输入多为 区域截图或内存图(来自 图像处理);输出多为 字符串或 JSON,部分需 GetStringFromPtr / FreeStringPtr。
| 主线 | 含义 | 典型接口前缀 |
|---|
| 通用 OCR | 通用文字检测识别,不依赖预录字库 | Ocr、OcrFromPtr、OcrDetails 及 V5 对应 OcrV5* |
| 字库识字 | 与自建/导入字库匹配 | OcrFromDict* |
| 找字 | 在图中 定位 字串坐标 | FindStr* |
| 字库维护 | txt/sqlite 等导入导出、词条增删 | ImportTxtDict、ExportDict、ImportDictWord、RemoveDict* 等 |
| 对比 | Ocr / OcrFromPtr / OcrDetails | OcrV5* |
|---|
| 典型用途 | 传统/默认 OCR 管线 | 新版模型(如 ppocrv5),细节见各页 type 与配置 |
| 参数 | 区域或指针 + 详情结构体返回值差异见 Details 后缀 | 同样有 Details / FromPtr 变体 |
选型:新项目优先按 更新日志 推荐选 V5;老脚本兼容保留 Ocr。
变体命名:
- 无后缀 / FromBmpData:输入为 区域 或 BMP 内存。
- FromPtr:输入为
OLAImage 句柄。 - Details:返回 更丰富的框、置信度 等(JSON/结构以详情页为准)。
| 接口 | 差异 |
|---|
OcrFromDict / Details | 区域 OCR,结果限制在 字库 内。 |
OcrFromDictPtr / PtrDetails | 输入为 内存图。 |
与通用 OCR 差异:识别空间受 字库词条 约束,适合 固定字体 UI;需先 加载/导入字库 等。
| 接口 | 差异 |
|---|
FindStr、FindStrDetail | 在指定区域 找字,返回位置信息。 |
FindStrFromPtr 等 | 源为 指针图。 |
FindStrAll、FindStrFromPtrAll | 全部 出现位置,而非第一个。 |
与 OCR 差异:Find 强调 坐标;Ocr 强调 文本内容。有时需两者配合:先 Find 再裁剪 OCR。
| 接口 | 说明 |
|---|
FastNumberOcr、FastNumberOcrFromPtr | 数字专用 快速路径,参数更少、约束更强。 |
| 接口 | 差异 |
|---|
ExportTxtDict、ImportTxtDict | txt 字库 与内存结构互导,适合开发期。 |
InitDictFromTxt | 导入到数据库(正式环境推荐入库)。 |
InitDictFromDir | 从 目录批量 加载字库图。 |
ImportDictWord、RemoveDictWord、RemoveDict | 词条/整库维护。 |
GetDictImage | 读字库中某字对应图。 |
与 数据库:db 传 0 时常表示 默认库(需已 OpenDatabase,见各页说明)。
| 接口 | 说明 |
|---|
GetOcrConfig、SetOcrConfig | 整块配置读写。 |
SetOcrConfigByKey | 键值 细调(与 ppocrv5 等参数对应,见详情页)。 |
| 需求 | 建议 |
|---|
| 任意界面抓字 | OcrV5 或 Ocr + 合适区域 |
| 游戏/UI 固定美术字 | 建字库 + OcrFromDict* |
| 只要数字 | FastNumberOcr |
| 要点坐标做点击 | FindStr* / FindStrAll |
- 字库:系统字体 生成字库、枚举字体。
- 图像处理:截图与预处理。