

清华紫光OCR正式版是一款专业优秀的图像识别工具。最新版本的清华紫光OCR可以直接提取图片信息,并支持从TIF,BMP和PCX图片格式读取文本内容。
紫光OCR软件还支持简体/繁体中文、英文和手写中英文,能够快速完成识别,识别率和准确率高。
紫光OCR软件功能
在Windows环境下,Thunis OCR支持GB、BIG5、JIS和Shift-JIS。印刷体汉字识别中还加入了MMX优化技术,大大提高了识别速度。
我们只需要几秒钟就能识别出一个A4大小的中英文混排的打印纯文本文件。而且识别率很高,只有几个字有错误。
在这个版本中,增加了表格识别功能。选择识别表格选项后,它将首先自动识别表格的边框,然后识别表格中的单词。在所有单词被识别之后,单词将被原样恢复到表中。这次测试中的识别率也很不错。
但是我们的工程师在测试中发现,当文字靠近表格的边框线时,其识别效果并不是那么理想。
如果用户想识别一个图文混排的文档,紫光OCR还具有自动版面分析的功能。它会自动分析扫描的版面,划分应该识别的文字区域,然后进行识别。它对分割区域中的字符具有高识别率,
而且速度也很快。遗憾的是,该版本没有自动恢复版面功能,所以如果要将文件恢复到原来的版面,需要再次手动排版。
它的导出功能可以将带有表格的文档导出为RTF文件,从而允许用户在Word等应用程序中继续编辑。它还可以将扫描的图像格式转换成TIFF、BMP或PCZ,具有很大的灵活性。
其批量识别功能可以让用户一次性扫描所有多页稿件后再进行识别,避免了扫描一页识别一页的麻烦。该版本可实现多达10000页的批量识别。
这个版本还增加了一个非常实用的功能,就是手写识别。有了这个功能,许多以前手写的信件或文件可以被扫描进计算机,识别并保存为电子文件。
但是目前的手写识别功能还没有完全成熟,对书写有很高的要求,比如每个字之间要有一定的间隔,不能有连笔。尽管如此,手写识别功能可以在一定程度上减轻文本输入的负担。
OCR还具有自学功能。遇到生僻字,可以通过键盘输入来学习。利用该功能,用户可以自由添加一些原本不“认识”的单词,大大拓宽了中文OCR系统的识别字符集。
专业版OCR软件Thunis不仅可以识别纯文本文件,还可以识别复杂的图形和文档,从而最大限度地将人们从繁杂的文本重新录入工作中解放出来。
清华紫光OCR软件的特点
1.识别率高,速度快:对分割区域的字符识别率高,速度也很快。
2.导出功能:可以将带有表格的文档导出为RTF文件,从而允许用户在Word等应用程序中继续编辑。
3.自动版面分析:对图文混排的文档具有自动版面分析功能。它自动分析扫描的布局,划分要识别的文本区域,然后识别它们。
4.转换图像格式:这是非常灵活的转换扫描图像格式为TIFF,BMP或PCZ。
5.批量识别:允许用户一次性扫描所有多页稿件后再进行识别,避免了扫描一页识别一页的麻烦。该版本可实现多达10000页的批量识别。
6、手写体识别:手写的信件或文件就可以扫描到计算机中,识别出来后用电子文档的方式进行保存。
7、自学习:当遇到有生僻字时,可以通过键盘输入进行学习,用户就可以自由地添加一些本来不“认识”的字,大大拓宽了中文OCR系统的识别字符集。
8、汉字和英文混排、日文和英文混排、韩文和英文混排同时识别。
9、是唯一可以识别2万多汉字的多体文字识别系统,汉字识别国内最优。
10、支持多种环境接口。文通TH-OCR支持WINDOWS环境和GB、BIG5、GBK、JIS、
SHIFT-JIS和KSC等多种内码,适合全球各个地区使用。TH-OCR还具有自学习功能,不论什么生僻字,都可以通过键盘输入进行学习,大大拓宽了OCR系统的识别字符集。
清华紫光OCR使用方法
1.文件-打开,选择要识别的文件,可以是tif、bmp、jpg格式的
2.命令-识别,会自动识别的
3.识别完成后,软件左边的树状栏里会有图像文件名,用鼠标点开哪个加号,就是识别后的文本文件
4.单击它,软件右边上方是识别后的文本,下方是被识别的图像文件
5.这时用键盘移动光标,就能查看图像和对应文本,并能直接改动文本
6.二值图像就是只有黑白两色的图像,用windows自带的画图软件就能做出来
7.先用画图打开图像,图像-属性,将颜色改成黑白,再存盘就得到二值图像了
清华紫光OCR更新日志
1.修复若干bug;
2.优化细节问题;
-
欧美vpswindows另类 2023-06-12
-
生化危机3重制版啪啪mod 2023-06-12
-
囧次元官方app,囧次元官方地址 2023-06-12
-
在线种子搜索神器种子帝 2023-06-12
-
幸福宝8008隐藏入口2021年 2023-06-12
-
日剧网最新更新,收录最新日剧,追剧必备 2023-06-12