chi_sim.traineddata.gz

19 MB/编程其他

简介 相关 评论

简介

这是chi_sim.traineddata.gz下载,tesseract-ocr中英文数据包chi_sim.traineddata.gz eng.traineddata.gz.初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进。vIY红软基地

软件介绍

chi_sim.traineddata.gz我用不了那么多字,然后就按官方和网上的资料自己做了一个识别库,这个库只能识别训练过的文字。速度生成的文件应该跟训练的字数有关的,我实验了几个字,只有100多k。 但是发现一个很明显的问题是,默认的识别速度比较慢。识别四个很明显的字需要将近两秒。vIY红软基地

软件说明

为什么用3.05呢?vIY红软基地
从官方文档上看4.0版本(windows版本于2017年1月30号发布)显著的提高了识别率,同时也加大了性能的消耗。理论上我是应该用4.0。但这不是重点。重点是有windows的版本有诡异的bug! 花了好久没有解决。vIY红软基地
不过还好,4.0支持3.05版本的所有语法。换而言之,下面的所有内容在4.0都是可以用的。vIY红软基地

相关缺点

•大多数比较老,有部分内容已经不适用。vIY红软基地
•大部分只是就英文的训练进行探索,很少针对中文的训练。vIY红软基地
接下来尽可能详细的介绍自己tesseract训练中文识别的经验。vIY红软基地

软件截图

chi_sim.traineddata.gzvIY红软基地

展开

同类推荐

相关文章