2023-01-03 18:54:48
pdf转成word 乱码

我也留个邮箱,但既然你都是乱码,我的也可能都是,如果我的也是的话,我就不回你了。 wangweiipp@126.com
你这pdf是因为为了保护版权,里面的字体是特有的,一般的电脑系统里面没有,我用pitstop替换,也没有找到好的字体可以识别的,pitstop这是个adobe acrobat的插件。因为没有字体所以直接复制出来都不行,是乱码,pdf转换软件并没有转错,只是我们的电脑没有那种字体所以显示不出来,要改变字体也很难,反正我没有找到,然后我试了一下orc,结果识别率并不高,有的识别能出来。如果你有耐心的话,建议你orc后自己一个个的改过来。
pdf文件转换成word时 有乱码,

乱码是因为pdf内嵌了非标准字体,所以转换出来是乱码~~此类文件可以用ocr软件识别来处理~~~
有问题你可以hi偶~~~ 或者email我 wangjinling117@foxmail.com
adobe reader 9.1 复制pdf里面的文字,然后粘到word...

你说的没错,主要是pdf嵌入字体代码文件是非标准的,无法正确识别。
这种情况,一般不太好控制。少量乱码,尽量手工修改。乱码无法接受时,可以直接进行光学字符识别ocr,推荐你试试汉王pdf ocr 8.12版。有些乱码pdf文档在经过ocr后效果会比较好。