主题
文字识别模块总览 - Overview
本分类做什么
包含 通用 OCR(含 PP-OCR/V5 系列)、字库识字与找字、字库/词条维护 以及 OCR 参数配置。输入多为 区域截图或内存图(来自 图像处理);输出多为 字符串或 JSON,部分需 GetStringFromPtr / FreeStringPtr。
一、产品线划分:OCR 引擎 vs 字库 vs 找字
| 主线 | 含义 | 典型接口前缀 |
|---|---|---|
| 通用 OCR | 通用文字检测识别,不依赖预录字库 | OcrEx、OcrFromPtrEx、OcrDetailsEx(推荐);兼容 Ocr/OcrDetails 等 |
| OCR 模型 | 加密包加载、打包、按句柄调参、模型列表/信息 | OcrLoadModel、OcrListModels、OcrGetModelInfo、OcrSetModelConfig 等 |
| 字库识字 | 与自建/导入字库匹配 | OcrFromDict* |
| 找字 | 在图中 定位 字串坐标 | FindStr* |
| 字库维护 | txt/sqlite 等导入导出、词条增删 | ImportTxtDict、ExportDict、ImportDictWord、RemoveDict* 等 |
二、OcrEx 系列(推荐)
| 对比 | OcrEx / OcrFromPtrEx / OcrFromBmpDataEx | OcrDetailsEx 等 |
|---|---|---|
| 返回值 | 识别文本字符串 | JSON(Regions、Score、Vertices 等) |
| 模型 | 末参 modelHandle:0=内置 mobile;>0=OcrLoadModel 句柄 | 同上 |
变体命名:
- 无后缀 / FromBmpData:区域或 BMP 内存输入。
- FromPtr:
OLAImage句柄输入。 - Details:返回框与置信度 JSON。
模型与配置:见 OCRModelInfo与ModelConfig说明、OCR模型配置说明;加密包魔数 OLAOENC1(与 YOLO OLAYENC1 区分)。
三、Ocr 系列(兼容)
| 接口 | 说明 |
|---|---|
Ocr / OcrFromPtr / OcrFromBmpData | 旧版无 modelHandle,默认识别管线 |
OcrDetails / *Details | 返回 JSON 详情,字段与 OcrDetailsEx 类似 |
选型:新项目请用 OcrEx + modelHandle(0 为内置 PP-OCR mobile)。原 OcrV5 系列已移除,请迁移到 OcrEx 等等价接口。
四、字库识字:OcrFromDict*
| 接口 | 差异 |
|---|---|
OcrFromDict / Details | 区域 OCR,结果限制在 字库 内。 |
OcrFromDictPtr / PtrDetails | 输入为 内存图。 |
与通用 OCR 差异:识别空间受 字库词条 约束,适合 固定字体 UI;需先 加载/导入字库 等。
五、找字:FindStr*
| 接口 | 差异 |
|---|---|
FindStr、FindStrDetail | 在指定区域 找字,返回位置信息。 |
FindStrFromPtr 等 | 源为 指针图。 |
FindStrAll、FindStrFromPtrAll | 全部 出现位置,而非第一个。 |
与 OCR 差异:Find 强调 坐标;Ocr 强调 文本内容。有时需两者配合:先 Find 再裁剪 OCR。
六、快速数字
| 接口 | 说明 |
|---|---|
FastNumberOcr、FastNumberOcrFromPtr | 数字专用 快速路径,参数更少、约束更强。 |
七、字库文件与数据库
| 接口 | 差异 |
|---|---|
ExportTxtDict、ImportTxtDict | txt 字库 与内存结构互导,适合开发期。 |
InitDictFromTxt | 导入到数据库(正式环境推荐入库)。 |
InitDictFromDir | 从 目录批量 加载字库图。 |
ImportDictWord、RemoveDictWord、RemoveDict | 词条/整库维护。 |
GetDictImage | 读字库中某字对应图。 |
与 数据库:db 传 0 时常表示 默认库(需已 OpenDatabase,见各页说明)。
八、OCR 配置
| 接口 | 说明 |
|---|---|
| OcrListModels、OcrGetModelInfo | 已加载模型列表与生命周期/诊断信息,详见 OCRModelInfo与ModelConfig说明 |
OcrSetModelConfig、OcrSetModelConfigByKey、OcrGetModelConfig | 按 模型句柄 调参(Ex 系列推荐),详见 OCR模型配置说明 |
九、快速选型
| 需求 | 建议 |
|---|---|
| 任意界面抓字 | OcrEx + modelHandle=0 或自定义模型 |
| 自定义 NCNN 模型 | OcrEncryptModel → OcrLoadModel → OcrEx |
| 窗口/UI 固定美术字 | 建字库 + OcrFromDict* |
| 只要数字 | FastNumberOcr |
| 要点坐标做点击 | FindStr* / FindStrAll |
