欢迎来到纳米网!
首页 > 公众号文章>正文

瑞芯微RV1126B OCR文字识别:CTPN+CRNN技术详解

1. OCR文字识别简介

文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。所以一般包含两个步骤:

文字检测:解决的问题是哪里有文字,文字的范围有多少。

文字识别:对定位好的文字区域进行识别,主要解决的问题是每个文字是什么,将图像中的文字区域进转化为字符信息。

我们的OCR算法是基于CTPN+CRNN设计的。CTPN是一种文字检测算法,能有效的检测出复杂场景的横向分布的文字,是目前比较好的文字检测算法。CRNN算法主要用于端到端地对不定长的文本序列进行识别,不用先对单个文字进行切割,而是将文本识别转化为时序依赖的序列学习问题,就是基于图像的序列识别。

基于EASY-EAI-Nano-TB硬件主板的运行效率:

2. 快速上手

2.1 开发环境准备

如果您初次阅读此文档,请阅读《入门指南/开发环境准备/Easy-Eai编译环境准备与更新》,并按照其相关的操作,进行编译环境的部署。

在PC端Ubuntu系统中执行run脚本,进入EASY-EAI编译环境,具体如下所示。

cd ~/develop_environment
./run.sh
v2-e1127efd76bcca3331922be6d17e546f_720w.webp

2.2 源码下载

在EASY-EAI编译环境下创建存放源码仓库的管理目录:

cd /opt
mkdir EASY-EAI-Toolkit
cd EASY-EAI-Toolkit

通过git工具,在管理目录内克隆远程仓库

git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-1126B.git
v2-67d8e73ccfe13280db05364195d1679f_720w.webp

注:

* 此处可能会因网络原因造成卡顿,请耐心等待。

* 如果实在要在gitHub网页上下载,也要把整个仓库下载下来,不能单独下载本实例对应的目录。

2.3 模型部署

要完成算法Demo的执行,需要先下载OCR算法模型。

百度网盘链接为:https://pan.baidu.com/s/1imI86u1O9xH6T6V_0k2jxw?pwd=1234 (提取码:1234 )。

v2-46f0cb43eaae629b1314d0d17447c5ff_720w.webp

同时需要把下载的OCR算法模型复制粘贴到Release/目录:

2.4 例程编译

进入到对应的例程目录执行编译操作,具体命令如下所示:

cd EASY-EAI-Toolkit-1126B/Demos/algorithm-ocr/
./build.sh cpres

注:

* 由于依赖库部署在板卡上,因此交叉编译过程中必须保持/mnt挂载。

* 若build.sh脚本带有cpres参数,则会把Release/目录下的所有资源都拷贝到开发板上。

v2-df6923692a41324b6d0723163516e212_720w.webp

2.5 例程运行及效果

通过串口调试或ssh调试,进入板卡后台,定位到例程部署的位置,如下所示:

cd /userdata/Demo/algorithm-ocr/
v2-9adf0d9785c79c39af55904739970245_720w.webp

运行例程命令如下所示:

sudo ./test-ocr test.jpg
v2-f3ec53bc5a0dcbffed899b587101e6bf_720w.webp

在EASY-EAI编译环境可以取回测试图片:

cp /mnt/userdata/Demo/algorithm-ocr/result.jpg .
v2-32a53dd3f520c8c09d4437f28b808afe_720w.webp

结果图片如下所示:

v2-9c533337a91fb36629d25264daca6bc8_720w.webp

API的详细说明,以及API的调用(本例程源码),详细信息见下方说明。

3. OCR文字识别API说明

3.1 引用方式

为方便客户在本地工程中直接调用我们的EASY EAI api库,此处列出工程中需要链接的库以及头文件等,方便用户直接添加。

v2-1bd7d06cf825a9a95eb5b4f14c1eef95_720w.webp

3.2 OCR检测初始化函数

设置OCR检测初始化函数原型如下所示。

int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);

具体介绍如下所示。

v2-c3158b2c8f0958ba7f9add2370c26e33_720w.webp

3.3 OCR检测运行函数

设置OCR检测运行原型如下所示。

int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);

具体介绍如下所示。

v2-bf4d465efb5915679af930e56afcbcea_720w.webp

3.4 OCR检测释放函数

设置OCR检测释放原型如下所示。

int ocr_det_release(rknn_app_context_t* app_ctx);

具体介绍如下所示。

v2-45a3c60f49dc43f42f55558b95145223_720w.webp

3.5 OCR识别初始化函数

OCR识别初始化函数原型如下所示。

int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);

具体介绍如下所示。

v2-6c480d211692a2dc01f54d3703abf6d9_720w.webp

3.6 OCR识别运行函数

OCR识别运行函数原型如下所示。

int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);

具体介绍如下所示。

v2-23d426dd9e0bfc9691061c75d04cb4f2_720w.webp

3.7 OCR识别释放函数

OCR识别释放函数原型如下所示。

int ocr_rec_release(rknn_app_context_t* app_ctx);

具体介绍如下所示。

v2-8ee67b1293b2862f66dd73b16e27bf14_720w.webp

4. OCR检测算法例程

例程目录为Demos/algorithm-ocr/test-ocr.cpp,操作流程如下。

v2-eaef5e3a1d097054406ba65aa3761af8_720w.webp
#include 
#include 
#include 
#include"ocr.h"

using namespace cv;
using namespace std;

#define INDENT "    "
#define THRESHOLD 0.3 // pixel score threshold
#define BOX_THRESHOLD 0.9 // box score threshold
#define USE_DILATION false // whether to do dilation, true or false
#define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type

int main(int argc, char **argv)
{
	if (argc != 2) {
		printf("%s n", argv[0]);
		return -1;
	}
	/* 参数初始化 */
	const char *img_path = argv[1];
	Mat input_image, rgb_img;
	input_image = imread(img_path);
	if (input_image.empty()) {
		cout 

猜你喜欢

  • 艾为电子AW9967FSR:高效升压型WLED驱动芯片详解

    艾为电子AW9967FSR:高效升压型WLED驱动芯片详解

    在消费电子持续追求轻薄化与长续航的当下,背光系统能效成为关键瓶颈。传统方案在轻载场景效率低下,散热性能不足,严重制约设备续航并带来可靠性风险。数模龙头艾为电子推出新一代升压型WLED驱动芯片——AW9967FSR,以科学先进的热管理技术,打造卓越的散热...

    2025-12-01
  • Microchip发布MCP服务器:革新AI驱动的产品数据访问方式

    Microchip发布MCP服务器:革新AI驱动的产品数据访问方式

    该服务器支持跨AI平台获取可信产品信息,简化工作流程、加速设计并提高生产力 为进一步兑现公司为嵌入式工程师开发AI解决方案的承诺,Microchip Technology Inc.(微芯科技公司)今日推出模型语境协议(MCP)服务器。作为AI接口,MCP服务器可直接连接兼容的AI...

    2026-01-23
  • Microchip第22届中国技术精英年会北京站成功闭幕,下一站深圳

    Microchip第22届中国技术精英年会北京站成功闭幕,下一

    Microchip第22届中国技术精英年会(MASTERs)北京站于今日圆满落幕!来自各地的技术专家、行业伙伴和客户齐聚一堂,共同探讨前沿技术与创新应用。活动伊始,Microchip大中华区副总裁Edward Ho先生为本站致开幕词,欢迎各位嘉宾的到来,并分享了对行业发展的展望...

    2026-01-23
  • 国星半导体车规级LED芯片获2025年广东省名优高新技术产品

    国星半导体车规级LED芯片获2025年广东省名优高新技术

    近日,广东省高新技术企业协会正式发布《2025年第二批广东省名优高新技术产品名单》,国星半导体自主研发的车规级LED芯片与垂直LED芯片两大系列产品成功入选。该认定严格围绕技术创新性、质量稳定性、市场成熟度及产业化能力四大维度进行评审,是广东省...

    2025-12-02
  • 云英谷科技荣登2025中国半导体企业影响力百强,专注OLED显示驱动芯片

    云英谷科技荣登2025中国半导体企业影响力百强,专注OLED

    11月14日,世界集成电路协会(WICA)主办的“2025全球半导体市场峰会”在上海成功召开。本次峰会发布了2026全球半导体市场趋势展望暨2025中国半导体企业影响力百强及集成电路新锐企业50强报告。云英谷科技股份有限公司荣登“2025中国半导体企业影响力百...

    2026-01-23
^