我正在寻找一个比较两个PDF文件的应用程序。

应用程序必须:


能够突出显示两个文档之间的差异。
是mac -compatible,因为我将在Mac上免费使用它
,我不想花任何钱

我将主要用于比较许可协议的新版本(因为我太懒了,每次进行较小的更改都无法阅读40页以上的文档)

该应用程序不必来自App Store,也不需要是正式的,我需要它很好地完成预期的工作(比较PDF)。

我不会经常使用此应用程序,并且会接受以下任何一种格式:


Mac应用程序商店应用程序
Java应用程序
Web应用程序
AppleScript文件(我将需要查看源代码)
自动化器工作流程
基本上可以在Mac OS X Yosemite(非Beta版)上运行并有效执行预期任务的任何内容

评论

您是否考虑过将PDF转换为纯文本并使用diff?

Diff是标准的UNIX命令行工具(请参阅en.wikipedia.org/wiki/Diff_utility),由于Mac OS基于Unix,因此我很确定它已经安装在您的计算机上。有关GUI替代方案,请参阅apple.stackexchange.com/questions/3653/…

...或在此处查看git-tower.com/blog/diff-tools-mac

我尝试了许多这样的选项,包括我非常喜欢的Apple的filemerge,但是它要求pdf文件为ASCII格式...您知道任何好的PDF到ASCII转换器吗?

#1 楼

您可以使用DiffNow:


它是免费的
web-app diff工具
通过粘贴文本起作用;上传文件;使用URL

唯一的限制是文件必须<2048kb。

网站上的示例(第一个pdf与第二个pdf):



评论


因此,它支持非ASCII PDF文件吗?

–DeveloperACE
2015年2月7日在23:46

是的-您可以使用普通的pdf文件

–ᔕᖺᘎᕊ
2015年2月7日在23:48



大!非常感谢!

–DeveloperACE
2015年2月8日,0:12

它只是Web应用程序还是可下载的应用程序?

–DeveloperACE
2015年2月8日,0:12

仅限Web应用程序afaik

–ᔕᖺᘎᕊ
2015年2月8日,0:26

#2 楼

如今,DiffPDF仅是Windows的付费软件,但以前是免费的,也可用于OSX。您仍然可以下载这样的先前版本。

它可以进行视觉和文本比较。 >


评论


也托管在Mac版DiffPDF上-免费下载和软件评论-CNET Download.com

–帕特
16年4月19日在19:11

谢谢你!它可以正常工作,但似乎只能逐页比较,因此,如果您在文档的早期添加页面,则比较是无用的。

–内格尔
16年5月11日在9:32

#3 楼


compare(来自ImageMagick的命令)

如果要比较a.pdf的第4页和b.pdf的第6页的视觉外观,可以使用ImageMagick的命令行工具compare。以下是尝试执行的命令的变体:

compare              a.pdf[3] b.pdf[5]              delta1.pdf
compare -density 300 a.pdf[3] b.pdf[5]              delta2.pdf
compare              a.pdf[3] b.pdf[5] -compose src delta3.pdf
compare              a.pdf[3] b.pdf[5] -fuzz 5%     delta4.pdf


(ImageMagick的帧/页面计数是从零开始的;因此“ [3]”表示“第4页”。)这将创建“增量”文档,其中页面之间不同的每个像素都用红色绘制:


第一个变体将a.pdf的浅色版本用作页面的背景图像。
第二个变体使用的分辨率为300 PPI(而不是默认的72 PPI)。
第三个变体仅创建白色和红色的变化量(保留浅色背景)。只会将色差大于5%的像素标记为红色。

应注意,只有在比较文件的各个页面大小完全相同时,比较才起作用。 br />

diffpdf(GUI应用程序)

DiffPDF是一个GUI应用程序,可以处理2或3个PDF输入并显示不同之处:


有一种比较模式仅文本内容,突出显示单词和字符差异。
还有另一种模式可以比较视觉差异并突出显示它们。

主页现在仅提供付费的Windows版本,但较早的版本是免费的。您可以获取源代码,例如来自Debian,其中包含OS X的编译说明。

#4 楼

比较PDF文件时,您可以选择:


比较内容(即实际文本)
比较页面整体(视觉比较)。

虽然您可能正在寻找第一种比较类型,但我想提供一种逐页比较两个PDF文件的方法。

由于我经常有此要求过去,由于找不到执行比较所需的软件,我编写了自己的软件并在GitHub上提供了该软件。它称为pyPdfCompare,可免费使用。

它在OS X和Windows上均可正常运行,但确实需要安装Python 3,Ghostscript和ImageMagick。此外,您需要为其使用的库执行一个pip install。为了完整起见。

#5 楼

对于您的用例,比较文本并丢弃所有格式和非文本元素会很好。您可以在每个文件上运行pdftotext实用程序,然后在结果上运行文本比较工具。在OS X上,您可以从Brew或MacPorts等各种免费软件发行渠道安装pdftotext,它是poppler软件包的一部分。

Cas Cremers的pdfdiff.py脚本可自动运行pdftotext(需要安装)

结果类似于cited引用的DiffNow,我认为它们在内部使用pdftotext并将输出插入文本diff webapp。