文章分类 | 推荐文章 | 最新文章 | 热点文章 | 最新软件 | 国产软件 | 国外软件 | 汉化补丁 | 设为首页 | 加入收藏
业界资讯 | 图形图像 | 操作系统 | 网络冲浪 | 工具软件 | 办公软件 | 媒体动画 | 精文荟萃 | 认证考试 | 网站建设 | 技术开发 | 专栏
当前位置:abcdown网络学院工具软件文字输入OCR软件使用宝典
精品广告
推荐TOP10
·在Word中输入特殊符号的四种方法
·输入法技巧放送:极点五笔技巧两则
·模拟键盘按键 自动输入文字
·你知道吗?IE地址栏中还能输入这些东西
·[韩服]韩文输入法教程
·Win 2000/XP系统输入法丢失解决方法
·极品五笔的安装方法
·拼音五笔输入法技巧集
·智能ABC输入法实用技巧
·五笔二级简码--五笔字型
阅读TOP10
·《三国志11》新武将完全中文名输入法
·WORD中要打目录,那些指引页码的点怎么打出来
·巧用搜狗输入法 面对特殊字符不再犯愁
·如何输入国际音标
·易学易用的数字五笔输入法
·试用简谱字库软件 轻松输入音乐简谱
·词组输入方法--五笔字型
·什么输入法最好用
·巧用全拼输入法
·让文本输入框只能输入数字

OCR软件使用宝典

日期:2008年6月27日 作者: 查看:[大字体 中字体 小字体]


OCR(Optical Character Recognition)是通过扫描仪,利用OCR软件,将点阵图形的的字符转变成文本的技术。很多人在使用这项技术的时候,因为方法不当,致使识别后的文本误码率很高。下面,我就将本人在使用当中总结的经验推荐给大家,希望能给你的工作带来方便。

  扫描阶段:识别率的高与低,很大程度取决于该阶段,其中原稿的质量起着决定性的作用。对于报纸等非常低劣的原稿,我们可通过扫描界面减小或增大亮度参数的方法提高识别率,如果还未达到要求,还可增大扫描时的分辩率。分辩率的提高会增大图像的大小,所以就会延长扫描时的时间。不过,对于太小的字体,或不太清楚的文字,适当增大分辩率,可提高识别率。对于杂志、书本等字迹清晰,对比强烈,质量比较好的原稿,可以把亮度设为0,分辩率设为300,在此基础上,根据预扫得到的图像,本着字体笔划即不能互相粘连漆黑一片,又不能断笔画少点的原则进行调整。

  版面分析阶段:扫描得到的是图像,要把图像转变为文本,需要OCR软件。现在市面的上OCR系统很多,而且有些OCR系统的智能化程度很高,连表格也都能正确识别。本文以笔者经常使用的北信OCR系统为例向大家介绍OCR使用的技巧。

  在识别前,首先要对扫描得到的图像进行校正,这是进行下一步工作的基础,所以在扫描时,应尽力使原稿摆正,若得到的图像还有点倾斜,就要进行倾斜校正。一般的OCR系统都有自动校正的功能,如果没有,那就只能手动校正了。

  现在的OCR系统,它还不能自动识别扫描得到的图像中的文字、表格、图形等元素,这就要求我们分别对不同的元素进行画框,定义其属性,以便OCR系统能够正确识别。在这里要注意,对于大小不同的文字,特别是横竖排版的文字,最好分别定义在不同的框中。对于图像中的污点,可以使用清除、橡皮擦等命令或工具消除。另外,画框时这要注意画框的次序,以避免识别后的文字“前言不搭后语”。   后处理阶段:一般的OCR软件都有后处理系统,识别后的文字,OCR会自动导入这一程序中。在这里,为了处理错误码,OCR软件提供了“前相关”、“后相关”等功能,以便从不同的侧面对当前错误码时行改正。有的OCR系统还有学习功能,开启该功能并让OCR系统经常性地进行“学习”,可以使软件的识别率逐渐得以提高。笔者使用的北信OCR系统,如果扫描参数设置得当,版面分析细致正确,这些前期工作做得好的话,识别后的文本几乎就不用修改。

  识别后得到的文本,它是根据扫描后的图像排版的,特别是像报纸,杂志等多栏式的原稿,它不合乎我们对日常文稿的排版要求,所以我们对识别后的文稿,一般这要进行一次排版操作。这种排版操作,OCR系统的后处理程序一般都不能完成,我们要借助Word、WPS等排版软件进行操作。

  在OCR后处理程序中,把文本保存为纯文本文件后退出。在Word、WPS中,打开或灌入刚才的文本文件(也可以使用复制、粘贴命令在Word、WPS中新建文件)。在Word中,“查找”“^P”(没有引号)标记(段落标记),全部或部分替换为“^S”(没有引号),或者是直接替换为空(就是在“替换”文本框中什么都不填)可以取消每行文字后的硬回车。在WPS(WPS2000手写输入系统)中,在菜单栏执行“工具→文字→段落重排”命令,可以自动对全部段落重新排列,这一功能,对OCR处理后的文本,只执行一个命令,就可以使所有段落排列的整整齐齐,特别推荐OCR使用着使用这一功能。最后,设置标题样式,首行缩进两个字符等……怎么样,一篇漂亮的文档出来了吧!

  现在市面上流行的OCR系统很多,比如清华紫光、中晶尚书等,而且你在购买扫描议的时候,厂商也大都会提供一套OCR软件,但是,笔者建议大家使用北信OCR系统,因为它的识别率很高,且在WPS2000手写系统中,能够方便的直接调用,使用非常方便。

  最后,我在简单地说一下WPS2000手写系统。WPS2000手写系统增强了文字输入及校对方面的功能,它支持手写输入、语音输入和OCR输入,对经常进行文字录入的人员来说,它应是首选的工具。它的语音校对功能可以极大地降低录入错误的概率。与OCR的结合,更会使录入工作的效率得到很大的提高。

  Microsoft Word不论多么强大,但在对OCR后的文字进行排版,特别是重新安排段落这一点,与WPS2000手写系统相比是相形见绌的(这一点是可以原谅的,因为它毕竟对中国人的文字使用不是十分了解),这是国产软件的又一次胜利!



上一篇:紫光拼音输入法崩溃之后的解决方案

下一篇:IPBook让网络打印机无处藏身


相关软件: 相关文章:
·体彩分析--数字宝典 v2.0 注册机
·Visual Basic 6.0 开发宝典
·MCSE制胜宝典MS Internet Security and Acceleration Serv
·vegas4新手宝典简体中文版
·Frontpage 2000宝典
·生活智慧宝典-应聘技巧讲座
·婚嫁宝典2006(喜事指南)电子读物
·单身男人恋爱4宝典(图)
·失恋名言恋爱宝典:恋爱的100个真相
·求爱宝典:爱情语句
·从零开始 无线网络终极应用宝典
·Sonic Foundry Vegas 4.0 新手宝典 之一 概貌一览(1)
·Sonic Foundry Vegas 4.0 新手宝典 之一 概貌一览(2)
·实用:网上购物消费者的宝典!

特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
[打印本页] [关闭窗口] 转载请注明来源:http://www.abcdown.net
首页 | 本站声明 | 下载帮助 | 发布软件 |
中文版权所有:ABC学院 浙ICP备05000717号