怎样提取图片中的文字

来源:百度文库时间:2012-03-16 14:02:52

  微软在Microsoft Office 2003中的工具组件中有一个“Microsoft Office Document Imaging”的组件包,它可以直接执行光学字符识别(OCR),下面笔者就为大家介绍利用Office 2003新增的OCR功能从图片中提取文字的方法。

  第一步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 即可安装运行(如图1所示)。

怎样提取图片中的文字

图1 安装组件

  第二步 打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。

  第三步 打开Microsoft Office Word 2003 ,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。如图2所示,在“打印机”下拉列表框中选择“Microsoft Office Document Imaging Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。

怎样提取图片中的文字

图2 选择打印机

  打开刚才保存的MDI类型文件(如图3所示),根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑了。

怎样提取图片中的文字

图3 将文本发送到Word

  提示:如果你不想将转换的内容输入到一个新的Word 文档中,而是希望粘贴到一个已经打开的Word 文档,只需在上面的操作中点击右键菜单的“复制”,然后再到指定文档中执行粘贴即可。

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站) 联系邮箱:rjfawu@163.com
多特网友 2014-04-26 08:08:10 回复
请问为什么我的是   应用程序缺少组件    
多特网友 2014-04-26 07:56:18 回复
为什么我的做到   将文本发送到Word  是黑色的  点不动    点上面的会出现       Microsoft Office Word 2003 系统不全部
多特网友 2013-03-11 16:12:33 回复
为什么我只能做成TAG格式的
多特网友 2013-03-11 16:12:33 回复
为什么我只能做成TAG格式的
多特网友 2014-04-26 07:56:18 回复
为什么我的做到   将文本发送到Word  是黑色的  点不动    点上面的会出现       Microsoft Office Word 2003 系统不全部
多特网友 2014-04-26 08:08:10 回复
请问为什么我的是   应用程序缺少组件