安装和使用 Pandoc 非常简单,它本质上是一个强大的命令行文档转换工具,可以轻松地在各种文档格式间进行转换。

📥 如何安装 Pandoc

你可以根据自己的操作系统选择安装方式:

操作系统 推荐安装方法(在终端中执行) 备选方案
Windows 使用 wingetwinget install --source winget --exact --id JohnMacFarlane.Pandoc 使用 Chocolatey:choco install pandoc,或直接下载安装包
macOS 使用 Homebrewbrew install pandoc 使用 MacPorts:sudo port install pandoc,或下载安装包
Linux Debian/Ubuntu: sudo apt-get install pandoc
Fedora/RHEL: sudo dnf install pandoc
Arch Linux: sudo pacman -S pandoc
如需最新版,可从官网下载二进制包手动安装 。

安装完成后,在终端输入 pandoc --version,如果看到版本信息,就说明安装成功了。

一个小提示:如果你使用 RStudio IDE 进行写作,它已内置了 Pandoc,通常无需再单独安装。

🚀 基本使用方法

Pandoc 的使用遵循一个非常直观的模式,核心就是在终端(或命令提示符)中执行命令:

基础转换命令

最基础的命令格式是:

1
pandoc [输入文件] -o [输出文件]

Pandoc 会根据文件后缀名(如 .md, .docx, .html自动识别输入和输出的格式,非常方便。

1
2
3
4
5
# 将 Markdown 文件转换为 Word 文档
pandoc myfile.md -o myfile.docx

# 将 Word 文档转换为 HTML 网页
pandoc report.docx -o report.html

常用进阶选项

  • 生成独立文档 (-s):对于 HTML、LaTeX 等格式,加上 -s--standalone 会生成一个包含页眉、页脚的完整文件,而不是一个片段。
    1
    pandoc myfile.md -s -o myfile.html
  • 直接生成 PDF:Pandoc 默认通过 LaTeX 引擎创建 PDF,因此你需要预先安装 LaTeX 环境(如 MiKTeX 或 TinyTeX)。
    1
    pandoc myfile.md -o myfile.pdf --pdf-engine=xelatex
    --pdf-engine=xelatex 参数用于处理中文等Unicode字符,能获得更好的排版效果。
  • 处理网络文件:你可以直接输入一个网页URL,Pandoc 会抓取内容并转换。
    1
    pandoc https://www.example.com -f html -t markdown -o output.md

进阶使用:作为Python库

如果你是Python开发者,也可以将其作为库来调用:

1
2
3
4
import pypandoc
# 将一段文本从 Markdown 转换为 reStructuredText
output = pypandoc.convert_text('# 这是一个标题', 'rst', format='md')
print(output)

这种方式能更灵活地将 Pandoc 集成到你的自动化脚本中。