2023-01-02 08:22:39
pdf复制到word里数字和标点都乱码 怎么办,急求 - 百...

首先你得知道pdf的文件格式与word是有本质区别的,简单说来,word是一种文本文件,pdf更倾向于是图片格式的文档,之所以word转换为pdf时很简单就是因为它是由页面实现转换的,而pdf转换为word时需要将文档拆解,在这个过程中就可能出现乱码或图形变形的错误,这个事难以避免的,但是对于多数的pdf文档来说,转换为word格式还是可以实现的。
你把邮箱留下,我给你一个我一直在用的转换器,感觉还不错,但是得提醒你,一般pdf里的图片转换为word后就会变成word里的绘图格式的文件,这个要注意。

如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。