Word 转 PDF 工具
上传 Word 文档,一键转换为 PDF 格式
拖放 Word 文件到此处,或点击选择文件
支持 .docx 和 .doc 格式
什么是 Word 转 PDF?
Word 转 PDF 是一款在线文档格式转换工具,能够将 Microsoft Word 的 .docx 和 .doc 文件快速转换为 PDF(便携式文档格式)。PDF 是全球通用的文档交换标准,无论在 Windows、macOS、Linux 还是手机端,都能保持完全一致的排版效果,不会因为软件版本或操作系统不同而出现错位、字体替换等问题。
与本地安装 Office 或使用桌面软件相比,在线转换无需下载安装任何程序,打开浏览器就能用。转换引擎部署在服务端,支持中文字体嵌入、图片高清保留、表格精确还原,转换后的 PDF 可直接用于打印、邮件发送、合同签署、论文提交等正式场景。上传的文件在转换完成后会从服务器自动删除,整个过程不留痕迹。
日常工作中经常遇到需要把 Word 转 PDF 的情况:HR 发 offer 需要 PDF 格式、老师要求交 PDF 版论文、客户只接受 PDF 报价单、政府网站只认 PDF 上传……这个工具就是为这些高频场景设计的,三步搞定,不用装软件。
使用方法
使用方法
- 点击上传区域或将 Word 文件拖入,支持 .docx 和 .doc 格式
- 点击「转换为 PDF」,服务器将在数秒内完成处理
- 处理完成后点击「下载 PDF」将文件保存到本地
- 需继续转换其他文件?点击「转换其他文件」重新开始
文档检查
- 转换质量取决于源文档中的字体、排版、嵌入对象和页面设置。
- 发送前请打开生成的 PDF 检查,尤其是合同、发票、简历或包含表格的文档。
使用场景
技术原理
现代 Office 格式是标准化为 ECMA-376(2006)和 ISO/IEC 29500(2008)的 OOXML 容器:.docx、.xlsx 或 .pptx 文件是一个 ZIP 压缩包,内部包含遵循 Open Packaging Convention(OPC)的目录树,文档正文在 word/document.xml 中,样式在 word/styles.xml 中,主题标记在 word/theme/theme1.xml 中,嵌入媒体在 word/media/ 下,关系描述在 word/_rels/document.xml.rels 中。每个段落(w:p)、文本运行(w:r)、表格(w:tbl)和绘图(w:drawing)都携带 WordprocessingML 属性,映射到固定布局的 PDF 页面树(Adobe PDF 1.7 / ISO 32000-1:2008,或 PDF 2.0 / ISO 32000-2:2020)。旧版 .doc、.xls 和 .ppt 使用复合文件二进制格式(CFB / MS-CFB,即 Microsoft OLE 结构化存储),其记录流需要专用解析器如 Apache POI HSSF、antiword 或 libwpd。 高保真的 OOXML 转 PDF 需要等同于 Word、Pages 或 LibreOffice 内部排版引擎的能力,因为存在大量边界情况要处理:包含页面中间改变纸张大小的分节符、锚定到段落的浮动文本框、由 drawingML 重新生成的 SmartArt、OLE 嵌入的 Excel 区域、通过 OMML 或 MathML 渲染的公式,以及通过 HarfBuzz 处理的阿拉伯文、印度文和泰文等复杂文字排版。因此生产级转换器在服务端运行,使用三种引擎之一:LibreOffice headless 模式(`soffice --headless --convert-to pdf input.docx`,免费、格式覆盖广,但对 Word 特有功能偶尔出现布局偏移);Windows 上的 Microsoft Office COM 自动化模式(通过 Word.Application.ExportAsFixedFormat,对 Word 编写的 .docx 保真度最高,但仅限 Windows 且受许可证约束);或商业 SDK 如 Aspose.Words、Spire.Doc 和 Syncfusion,它们自带排版引擎。Python 封装库 docx2pdf 在 Windows 上委托给 Word,在 macOS 上委托给 AppleScript 驱动的 Word,保真度权衡相同。 字体处理是最常见的保真度问题。输出 PDF 必须嵌入文档所用字体的子集(Type 0 CID 字体内嵌 TrueType 程序,参见 PDF 规范 9.6.5 节)或在渲染时替换为后备字体。使用 Calibri、SimSun 或 MS YaHei 编写的文档如果在未安装这些字体的 Linux 服务器上渲染,会回退到 Liberation Sans 或 DejaVu,导致换行位置和溢出边界被破坏。PDF/A-1(ISO 19005-1)和 PDF/A-2 归档合规要求完整嵌入字体、/A-1 不允许透明度以及使用 ICC 标记的色彩空间。修订痕迹通常被 Word 导出器展平为已接受状态;批注可能被丢弃、保留为 PDF 注释或打印为尾注,取决于导出选项。图像流会被重新压缩:光栅图像根据是否透明使用 DCT(JPEG)或 Flate 滤波器,矢量 drawingML 元素转换为 PDF 内容流操作符(m、l、c、re、S、f),使它们在输出中保持可缩放。 上传的文件由 ToolAct 的服务端转换引擎处理,PDF 返回后立即从服务器删除。本工具不接受 .odt 作为输入。
- OOXML 容器(ECMA-376 / ISO/IEC 29500):.docx/.xlsx/.pptx 是一个 ZIP,内部包含遵循 Open Packaging Convention 的 document.xml、styles.xml、_rels/、media/、theme/
- 旧版 CFB 格式(MS-CFB):.doc/.xls/.ppt 是 OLE 结构化存储二进制流,由 Apache POI HSSF 或 antiword 等库解析,不适用标准 XML 工具
- 转换引擎:LibreOffice headless(`soffice --headless --convert-to pdf`,免费,保真度约 85-95%)、Microsoft Word COM Interop(仅限 Windows,保真度最高)、Aspose.Words / Spire.Doc / Syncfusion(自带排版引擎的商业 SDK)
- 文件由 ToolAct 的服务端转换引擎处理,PDF 返回后立即从服务器删除;本工具不接受 .odt 作为输入
- PDF 目标规范:ISO 32000-1:2008(PDF 1.7)或 ISO 32000-2:2020(PDF 2.0);页面内容流使用 m/l/c/re/S/f 操作符绘制矢量路径,使用 Do 操作符嵌入 XObject 图像
- 字体保真度:PDF Type 0 CID 键控字体嵌入 TrueType 子集(规范 9.6.5 节)可保留 CJK 字形定位;缺失字体会回退到 Liberation/DejaVu 并破坏换行;PDF/A 归档(ISO 19005)要求完整嵌入
- 图像和内容处理:光栅图像通过 DCT(JPEG)或 Flate 滤波器重新压缩,矢量 DrawingML 转码为 PDF 操作符,修订痕迹展平为已接受状态,批注被丢弃或作为 /Text 注释保留
示例
求职投递
把排好版的 Word 简历转成 PDF,HR 看到的就是你想要的样子合同与协议
Word 合同模板转成 PDF 再发出去,对方就不会不小心改动条款学术论文
毕业论文从 Word 转 PDF,图表、公式、页码都能完整保留常见问题
我的 Word 文档会保留在本地设备吗?
不会。.doc 或 .docx 文件会上传到我们的转换服务器,渲染成 PDF 后返回供你下载。请将上传内容视同已离开本地设备,避免上传未脱敏的合同、医疗记录或其他高度机密文件。
支持哪些 Word 格式?
上传器支持 .docx(Word 2007+)和 .doc(Word 97-2003)。Pages、Google Docs、.odt 等其他格式需先导出或另存为 .docx 或 .doc 后再上传。
字体和排版会被保留吗?
常见字体可以保留。服务器安装了标准的拉丁文和中日韩字体;使用冷门品牌字体或装饰字体的文档会回退到视觉上相似的替代字体,可能导致换行和分页轻微偏移。
修订记录、批注和脚注如何处理?
脚注、尾注、页眉、页脚、页码和目录字段都会作为静态内容渲染到 PDF 中。修订记录会按文件保存时的审阅状态呈现——如果想要干净的最终 PDF,请先在 Word 中接受或拒绝修订。行内批注通常会被丢弃。
嵌入的图片、图表和公式会被保留吗?
嵌入的图片和图表会被栅格化到 PDF 中。Office 公式对象会作为静态文本渲染。指向本地文件路径的链接图片在服务器上无法解析;上传前请直接嵌入图片以确保可见。
可以转换密码保护的文档吗?
不可以。密码保护或权限管理的文件无法被转换器打开。请先在 Word 中移除密码再上传,如有需要可在转换后重新加密源文件。
为什么 PDF 比原始 .docx 大很多?
DOCX 是压缩的 XML 容器;而 PDF 存储的是渲染后的页面,并嵌入实际使用的字体子集。包含大量照片、嵌入字体或矢量图表的文档体积往往会膨胀数倍。如果在意体积,请先在 Word 中压缩图片再上传。