1、1如何将扫描文件转换成可编辑的 Word 文档?豫竹千里草汉王 ocr 文字识别软件 V8.1 免费中文版,是一个带有 PDF 文件处理功能的 OCR 软件;具有识别正确率高,识别速度快的特点。有批量处理功能,避免了单页处理的麻烦;支持处理灰度、彩色、黑白三种色彩的 BMP、TIF、JPG、PDF 多种格式的图像文件;可识别简体、繁体和英文三种语言;具有简单易用的表格识别功能;具有TXT、RTF、HTM 和 XLS 多种输出格式,并有所见即所得的版面还原功能。新增打开与识别 PDF 文件功能,支持文字型 PDF 的直接转换和图像型 PDF 的 OCR 识别,既可以采用 OCR 的方式将 PDF
2、 文件转换为可编辑文档,也可以采用格式转换的方式直接转换文字型 PDF 文件为 RTF 文件或文本文件。下载地址:http:/. cn/baike/335364.shtml一、 PDF 文件转换为 RTF 文件操作步骤:1. 打开汉王 PDF OCR,单击工具栏内左边第二个图标或按 Ctrl+O 快捷键打开图像文件,然后找到并点选要识别的扫描文件。22. 单击对话框下方“PDF 转换为 RTF 文件”或“PDF 转换为 TXT 文件”按钮,弹出如下对话框。3. 按提示设置完成后,单击“确定”即可直接将 PDF 文件转换为可编辑文件。3【注】:PDF 文件转换为 RTF 文件时也可以选择下列操作
3、方法:点击“输出”菜单中“PDF 转换为 RTF 文件”和“PDF 转换为 TXT 文件”选项,或点击工具栏中“PDF 转换为 RTF 文件”按钮(左边第三个按钮)和“PDF 转换为 TXT 文件”按钮(左边第四个按钮) ,弹出下图对话框,您可以根据需要选择转换的图像页范围,点击“确定” ,系统自动导出文件。4特别提示: 如果勾选“转换后打开 RTF 文件” ,在转换后自动打开,如果不勾选则只转换保存文件,不打开。如果未安装 Word,导出后不能正确打开浏览,只能生成文件。二、快捷键与工具按钮1. 快捷键扫描文件: 按下“Ctrl+N”调出扫描程序,扫描图像文件。打开文件: 按下“Ctrl+O
4、”打开图像文件,追加图像文件。保存图像: 按下“Ctrl+S”键保存图像。图像反白: 按下“Ctrl+I”将图像反白。自动倾斜校正: 按下“Ctrl+D”进行自动倾斜校正。手动倾斜校正: 按下“Ctrl+M”进行手动倾斜校正。版面分析: 按下“F5”键,对选中的文件进行版面分析。5取消版面分析: 按下“Ctrl+Del”键,取消当前页的版面分析。取消当前栏: 按下“Del”键或“Esc”键,取消当前栏属性标识。版面识别: 按下“F8”键,对选中的文件进行识别。光标切换: 按下“F9”键,光标在剪刀、画线笔、鼠标三种状态间切换。左转图像: 按下“Ctrl+L”将图像左转 90 度。右转图像: 按
5、下“Ctrl+R”将图像右转 90 度。向后翻页: 按下“Page down”向后翻页。向前翻页: 按下“Page up” 向前翻页。撤消: 按下 “Ctrl+Z”键取消上一步操作。剪切: 按下“Ctrl+X”键剪切选中的内容。复制: 按下“Ctrl+C”键复制选中的内容。粘贴: 按下“Ctrl+V”键粘贴选中的内容。向后找可疑字: 按下“Ctrl+Tab”键。向前找可疑字: 按下“Shift+Tab”键。2.工具按钮:扫描图像。:打开扫描好的图像文件。6:将 PDF 文件转换为 RTF 文件。:将 PDF 文件转换为 TXT 文件。:图像放大。:图像缩小。:选中全部图像文件。 :对所选图像进
6、行分析识别。:对所选图像版面分析。:取消选中图像页的版面分析。:标记/修改当前图像框的属性。:取消当前图像框属性。:将光标切换成鼠标状态。:去除版面噪音,如黑点、黑框等。:在图像页上画线,弥补断线处或将表格填补成标准表格。:向前/向后翻页。三、 图像文件识别1.打开要识别的扫描文件。7根据要求选择,一般情况下分辨率 DPI 选择默认 300 即可。单击“确定” 。2.按 F8 快捷键或单击“开始识别”图标,弹出如下对话框:8可以对图像文字进行识别、编辑(不再赘述) 。四、 PDF 文件转换为 TXT 文件选择 PDF 转换成 TXT 文件,有太多不便。一是 TXT 格式只保存文字、表格部分,不保存图片;二是要转换成 Word 文档时尚需进行“复制” 、新建 Word 文档、 “粘贴”等操作后,才能保存为 Word 文档格式。一句话,太麻烦了!【附】TXT 是纯文本格式只保存文字、表格部分,不保存图片;RTF 是通用格式可以用 WORD、WPS 等文字处理软件编辑;HTML 是网页格式可以输出到 IE 等网络浏览器;XLS 格式可以用 Excel 等软件编辑。