2022-12-28 09:41:10
pdf里文本都是图片形式的,请问怎么把它弄到word里 -...

有两种情况:
1.根本不存在文本,这个内容就是一个图片(在pdf里以xobject形式存在),谁也没办法拿到文字信息.
2.是文本,可以用foxitreader等工具把文本选择,拷贝,粘贴出来.要修改就用foxit pdf editor就可以修改
另:如果pdf稳当禁止这样操作的话,只能把pdf转化成word来处理了.一样针对第二种情况
为什么 pdf 的字看起来很清楚,比word的清楚 - 百度...

pdf全称portable document format,译为可移植文档格式,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,pdf文件不管是在windows,unix还是在苹果公司的mac os操作系统中都是通用的。这一特点使它成为在internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用pdf格式文件。pdf格式文件目前已成为数字化信息事实上的一个工业标准。
adobe公司设计pdf文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。为了达到此目的, pdf具有许多其他电子文档格式无法相比的优点。pdf文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。
pdf文件使用了工业标准的压缩算法,通常比postscript文件小,易于传输与储存。它还是页独立的,一个pdf文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个pdf文件还包含文件中所使用的pdf格式版本,以及文件中一些重要结构的定位信息。正是由于 pdf文件的种种优点,它逐渐成为出版业中的新宠。
对普通读者而言,用pdf制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由于pdf文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普及。adobe公司以pdf文件技术为核心,提供了一整套电子和网络出版解决方案,其中包括用于生成和阅读pdf文件的商业软件acrobat和用于编辑制作pdf文件的illustrator等。 adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。
祝您成功,谢谢!
pdf里面的图片如何才能转换成word格式的纯文本?哪能...

图片一般不能转换成纯文本,但图片里的文字可以通过ocr转换成纯文本,正确率在50-95%。推荐文豪7600里的屏幕识别1.0插件,即安装文豪7600后,把屏幕识别1.0文件夹单独拷出来,再把文豪7600卸载掉。
如何是pdf的书(扫描的)建议用abbyy finereader 9.0 edition,但准确性还不是很高,需要手动修改。
国产有一个赛酷ocr,收费的,不是很贵。但效果没有宣传的那么好。但软件不大,也可以的。