第1个回答 推荐于2017-10-10
最近常常需要把一篇文章输入电脑里,然后进行编辑,去了一位朋友的博客,才知道有这么一个可以让人偷懒的方法.呜呜~,那就是直接把文章扫描了,然后提取其中的文字. 因为不想安装其他的软件,这里就说说利用word来提取文字的方法.
首先利用Office 2003组件。运行Office 2003安装包,接着在勾选 “选择应用程序的高级自定义”这里要注意的是选择安装时要选自定义,而不是默认的“经典”.打开Office工具→Microsoft Office Document Imaging,按提示选择安装“扫描、OCR和索引服务筛选器”和“Microsoft Office Document Image Writer”.在安装Microsoft Office Document Imaging组件后,Windows XP系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机(虚拟打印机)。Imaging组件可以通过这个虚拟打印机,将PDF文件所保存的信息识别,从而达到将它直接转换输出到Word等文字编辑工具中的目的。
第二步:用Adobe Reader 打开想转换的PDF文件,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”,点确认然后将该PDF文件输出为 MDI格式的虚拟打印文件进行保存.运行 “Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→ 将文本发送到Word",在弹出的“将文本发送到Word”窗口中选中“所有页面”和“ 在输出时保持图片版式不变"确认后系统会提示“必须在您执行此操作前识别该文档中的文本(OCR)。这可能需要一些时间”,不管它,点击确定即可.识别完成后,系统会自动调出Word,这时就可以看到,那些扫描进去的不能编辑的文字,出现在Word编辑窗口中了.本回答被提问者采纳