2022-11-24 12:12:29
为什么由pdf转换成word后出现乱七八糟的字

出现乱码是由于你的pdf文档是由扫描图片制作而成的,转换软件不能识别这些图片,所以转换后出现乱码。你必须使用ocr文字识别工具才能解决这一问题。
abbyy finereader 10 corporate edition 就是一款很好的ocr工具,你到网上搜索这个软件的破解版或者绿色版,可以找到下载地址。
pdf转换成word后乱七八糟的,都串行了,看不懂 - 百度...

这个是有可能发生的,其它文档转成pdf后能基本保持原来视觉效果(格式并不一定一样,因为不同文档采用的是不同的原来),如果你的pdf文档不是word生成的,那么转成word后格式是有可能差别很大的。
用pdf转换器转成word仍然是图片,怎么办?

pdf转word:(必须安装microsoft office 2003 或 2007)
1、打开pdf,选“打印”。
2、在“打印窗口”中选“microsoft office document image writer”,并选“文档和图章”,确定后生成mdi文件。
3、打开mdi,在“工具栏”中选“使用ocr识别文本”。(ocr需要一段时间)
4、ocr完成后,在“工具栏”中选“将文本发送到word”。在弹出窗口中选择“所有页面”和“在输出时保持图片版式不变”。系统会自动打开转换好的word文档,把它保存下来就ok了。
注:ocr存在一定的误差,需要进行校对。
pdf文档转换为word后遇见的问题

1. 乱码的问题是因为pdf内嵌了非标准的字体。这类问题一般用ocr识别来识别出文字 ,然后自己再校核排版处理,没有其他的好办法。
2. 分栏目前也只有你自己一栏栏复制到一个新的文件中后再排版。