2022-12-09 17:56:03
pdf文件转成word

实现工具:office 2003中自带的microsoft office document imaging
应用情景:目前国外很多软件的支持信息都使用pdf方式进行发布,如果没有adobe reader,无法查看其内容,如果没有相关的编辑软件又无法编辑pdf文件。转换为doc格式则可以实现编辑功能。尽管有些软件也可以完成pdf转换为doc的工作,但很多都不支持中文,我们利用office 2003中的microsoft office document imaging组件来实现这一要求最为方便。
使用方法:
第一步:首先使用adobe reader打开待转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。
编辑提示:如果你在“名称”设置的下拉列表中没有找到“microsoft office document image writer”项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的“添加/删除组件”更新安装该组件。
第二步:运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
编辑提示:目前,包括此工具在内的所有软件对pdf转doc的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。
我的pdf格式已经转换成word,也打开了,但是无法编辑 ...

你的所谓的转成了word应该是整张的文字图片插入在word里面吧~~其本质还是图片,所以你没有办法编辑~~你需要用ocr软件识别才能够处理~~~
对于是图片做成的pdf(特别是扫描件做成的pdf)文件
推荐用下面软件转换
2.1 页数比较少的用 cajviewer 7.0 (带ocr组件完整版) ,支持直接打开pdf文件,识别文字。
2.2 页数比较多的可以用 readiris corporate 12软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
2.3 页数比较多的还可以用 abbyy finereader 9或者9以上版本(有简体中文版)进行识别转换。
这个软件的识别率很高,转换出来的版面基本保持原样。
上面几个软件的识别率都还可以,不建议用什么office组件识别,太麻烦识别率也不高。
用pdf转为word后为什么还不能直接进行修改

正如楼上所说,用图片制作成的pdf,转换后还是图片。
这样,就只能将pdf用photoshop打开,一张一张地另存为tiff格式图片,然后再用office自带的文字识别工具office document imaging(需要在安装时选自定义安装,勾选“office工具”),或者其他的文字识别工具加以识别后再转到word里。就可以编辑了。
07可以打开03的文件,03要打开07文件,可以下载相应的插件――“office 2007文件格式兼容包”,安装后也可以打开。