Pandoc是一款通用文档转换器,一个特地转换文本格式的命令行工具,支持的格式十分之多,常用的有 txt、docx、html、pdf、md、pptx,能够在许多标志和文字处置格式之间停止转换!
Pandoc是一个Haskell库,用于将一种标志格式转换为另一种格式,也是一个运用该库的命令行工具。
Pandoc能够在许多标志和文字处置格式之间停止转换,包括但不限于各品种型的Markdown、HTML、LaTeX和Word docx。有关输入和输出格式的完好列表,请参阅下面的-from和-to选项。Pandoc还能够生成PDF输出:请参见下面的创立PDF。
Pandoc的加强版Markdown包括表格、定义列表、元数据块、脚注、援用、数学等语法。请看下面的Pandoc的Markdown。
Pandoc有一个模块化的设计:它由一组读取器和一组写入器组成,前者解析给定格式的文本,并生成文档的本机表示(笼统语法树或AST),后者将本机表示转换为目的格式。因而,添加一个输入或输出格式只需求添加一个阅读器或写入器即可。用户还能够运转自定义的pandoc过滤器来修正中间AST。
由于pandoc对文档的中间表示方式不如它所转换的许多格式之间的表现力强,因而不应该希冀每一种格式和每一种其他格式之间都能完成圆满的转换。Pandoc试图保存文档的构造元素,但不保存格式细节,如边距大小。而且有些文档元素,如复杂的表格,可能不合适pandoc的简单文档模型。固然从pandoc的Markdown到一切格式的转换都力图圆满,但从比pandoc的Markdown更有表现力的格式转换可能会有损失。
参数阐明
Pandoc 程序的命令运用方式为:
pandoc <files> <options>
其中?<files>?为输入的内容,其输入即能够来自文件,也能够来自规范输入以至网页链接。而?<options>?为参数选项。主要的参数选项有:
-f <format>、-r <format>:指定输入文件格式,默许为 Markdown;
-t <format>、-w <format>:指定输出文件格式,默许为 HTML;
-o <file>:指定输出文件,该项缺省时,将输出到规范输出;
--highlight-style <style>:设置代码高亮主题,默许为?pygments;
-s:生成有头尾的独立文件(HTML,LaTeX,TEI 或 RTF);
-S:聪明形式,依据文件判别其格式;
--self-contained:生成自包含的文件,仅在输出 HTML 文档时有效;
--verbose:开启 Verbose 形式,用于 Debug;
--list-input-formats:列出支持的输入格式;
--list-output-formats:列出支持的输出格式;
--list-extensions:列出支持的 Markdown 扩展计划;
--list-highlight-languages:列出支持代码高亮的编程言语;
--list-highlight-styles:列出支持的代码高亮主题;
-v、--version:显现程序的版本号;
-h、--help:显现程序的协助信息。
固然 Pandoc 提供了用于指定输入输出格式的参数,但是很多时分该参数不用运用。Pandoc 曾经足够聪明到能够依据文件名判别输入输出格式,所以除非文件名可能形成歧义,否则这两个参数都能够省略。