KAIYUN如何提取图片上的文字并保存为可编辑的Word格式第四步,打开刚才保存的MDI类型文件(如图3所示),根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑了。提示:如果你不想将转换的内容输入到一个新的Word文档中,而是希望粘贴到一个已经打开的Word文档,只需在上面的操作中点击右键菜单的“复制”,然后再到指定文档中执行粘贴即可。
首先使用SnagIt的文字捕捉功能将文字提取出来。SnagIt当前版本为7.02,大小为8903KB,下载地址可以在找到,汉化补丁可以在找到。启动SnagIt,选择菜单“输入/区域”,选择菜单“工具/文字捕获”,然后我们打开要捕捉的文件窗口kaiyun登录入口登录,按下捕捉快捷键kaiyun登录入口登录,选定捕捉区域即可捕捉到文字kaiyun登录入口登录。
完成后可以选中全文,鼠标右击后选中“将文本发送到Word”项,则所选内容便会被Word打开并可以进行编辑了。
打开带有文字的图片或电子书籍,翻到你希望提取的页面,点击键盘上的打印屏幕键(PrintScreen)进行屏幕捕获;打开Windows自带的画图工具,将刚才捕获的屏幕截图kaiyun官网入口地址,粘贴进去,保存为一个.bmp文件;接着打开刚才保存的文件,在编辑器中进行修正,根据你所要提取的文字进行裁剪,尽量去除不要的部分;最后启动OCR软件,在OCR中打开刚才保存的修改文件,进行文字识别,然后可随心所欲进行编辑。
安装完成后会弹出扫描新文件对话框,单击[扫描仪]按钮,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项kaiyun官网入口地址。
然后单击[扫描]按钮即可进行扫描,点击[捕获]按钮即可得到图片画面,该图片会显示在“图例”框中Leabharlann Baidu然后选中该图片点击[发送]按钮会开始扫描,扫描完成后点[完成]按钮kaiyun官网入口地址,然后系统会自动打开识别程序Microsoft Office Document Imaging,用该文件就可以识别了。如果事先已有图片可直接选择用Microsoft Office Document Imaging打开。
接着用相应工具重排文字。此时我们发现提取的文字可能会有很多空格或段落错乱等现象,而且字号、字体等不合自己的心意。这时我们可以用熟悉的WPS或Word软件进行重新编排。我们以WPSOffice2003为例看看如何对付提取后文章的编排。
用WPSOffice2003打开提取文章;然后选择“工具”菜单下的“文字”/“段落重排”,这时你会看到提取文章重新进行排版;接下来选择“工具”菜单下的“文字”/“删除段首空格”命令,使得文章的每段参差不齐的行首空格被删除;再选择“工具”菜单下的“文字”/“增加段首空格”,文章变为正常的书写格式;提取文章一般都留有空段,为删除这些空段,继续选择“工具”菜单下的“文字”/“删除空段”命令,这时文章完全变为我们所要的形式;用你熟悉的界面任意编辑文章吧。
第三步,打开Microsoft Office Word 2003,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。如图2所示,在“打印机”下拉列表框中选择“Microsoft Office Document Imaging Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。