有几种类型的纯文本结构化/格式语法,例如:


MarkDown
MediaWiki
XWiki
HTML

是否有通用工具(比reg-ex更容易/更合适)来帮助定义和执行转换规则?

评论

(比reg-ex容易)

#1 楼

Pandoc(许可证:GPL)可以导入:


markdown
reStructuredText
textile
HTML
DocBook
LaTeX
MediaWiki标记
OPML
Haddock标记

并转换为这些格式和其他各种格式。 (可以使用Lua添加自定义格式。)

这是一个独立的命令行程序,带有Haskell库。

您可以在线测试它:http:// johnmacfarlane.net/pandoc/try/

#2 楼

使用txt2tags(https://txt2tags.org/),您可以导出为至少20种不同的格式,包括rtf(富文本格式),乳胶,html,Wikipedia,克里奥尔语,dokuwiki,重组文本,markdown,spip和AsciiDoc。 ..

有一个txt2tags的html导入器(https://wiki.txt2tags.org/index.php/Main/Html2wiki),因此您可以使用它进行几乎所有操作。

(edit)
要更完整地回答问题,是的,我使用txt2tags已有几年了(至少7或8)。

我能想到的唯一缺点是不是比markdown更为人所知,但是它更老(自2001年起),而且我认为更好(可定制性,可扩展性,逻辑性强,语法上没有零碎)。

它有一个python上面提到的所有导出的2种实现,以及仅用于html导出的php实现。

您可以使用新的语法定义模块或regex创建特殊的导出规则。首先,这很容易,例如,这是html模块中粗体的导出规则:

'fontBoldOpen'         : '<B>'            ,
'fontBoldClose'        : '</B>'           ,


使用正则表达式,您可以在文档中完成此操作或作为配置文件。

例如,要在HTML输出中使用Strong而不是b,则可以创建以下规则:

%!postproc: '<b>' '<strong>'
%!postproc: '</b>' '</strong>'


评论


欢迎使用软件建议!我们倾向于在回答中积累个人经验,因此您使用此工具吗?你有什么经验?它有一些缺点或棘手的部分值得一提吗?它在什么操作系统上运行?有关如何使这个答案更好的信息,请参见以下meta:meta.softwarerecs.stackexchange.com/questions/356/…

–安吉洛·福克斯(Angelo Fuchs)
14年4月16日在9:39