pdf转word
1. 如果不是图片类做成的pdf 你可以尝试用verypdf pdf2word 工具或者使用solid converter pdf 转换 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码,那么就先要把这些pdf文件转成位图形式(也就是常说的pdf转曲)然后再用工具转,当然这时候上面的2个工具基本无能为力了
2.对于是图片做成的pdf 那么我们就需要用ocr类软件进行识别了,你可以用比较简单的cajviewer来提取 但是只能是一页页提取文字,或者你可以使用readiris corporate 12软件来进行识别,但是readiris corporate 12呢需要下载支持韩语 日语还有简体中文的亚洲语言包才是识别中文,但是这个软件的ocr识别率是比较好的~~~~当然还有abbyy finereader 也是一款识别率很高的软件,关键还支持中文识别~~也是一款不可多得的ocr软件,这里我强力推荐这个软件
汉王pdf_converter能很快而且准确地将pdf文件转换成用word打开的rtf文件,并且是免费版的,下载网址
http://xiazai.zol.com.cn/detail/33/326858.shtml
如果转换后全是扫描图片,则用雪莹docconvert输出为jpg格式,再用汉王文豪7600进行识别