我找到了一个网站,该网站提供了一个巨大的可过滤表格,其中包含有关一个国家/地区的城市的最新数据。该站点使用无限滚动方法来加载表的行。

通过使用Chrome的开发人员工具浏览该网站,我发现它向一些内部URL发出AJAX请求以获取数据。该URL包含许多与过滤器相对应的查询参数。

我试图直接在浏览器中访问该URL,并且我以一种不错的JSON格式获取所有数据。我什至可以使用过滤器来获取所需的具体数据。该URL实际上是可访问的,因此我不需要做任何麻烦的事情,我只是在调用网络中存在的URL。

所以我的问题是:为了自己的目的使用该URL检索数据对我来说是合法还是非法?

注意:我不想创建同一种城市列表,但我想使用该数据来创建一些在线游戏,从而有可能赚到一些钱... br />
这只是一个示例场景,我并不是在寻找获取有关城市数据的地方。如果需要,可以考虑一个网站,其中提供有关某个季节内足球运动员表现的最新数据。

关于具体国家,我再也没有考虑过一项特定的立法,如果您知道一个明显(il)合法的国家,那将是有用的信息。

评论

您打算如何处理这些数据?听起来并不像获取数据是非法的,但是将其复制或显示给用户可能会侵犯版权

您正在使用API​​的网站可能会使用技术而非法律手段来阻止您使用此API。通常最好获得使用API​​的权限,以确保它不会被阻塞并给用户带来不便。

这很简单!询问许可咨询公司或版权律师!不是网站管理员!

@bybe,很抱歉,我找不到Stack Exchange的许可咨询网站,我只向Stack Exchange用户或上帝询问问题,上帝从来没有回应。

您将需要阅读我的回答并仔细考虑。

#1 楼

让我清楚一点。我非常了解一件事,那就是版权法。我不是律师,但是30年来,版权知识一直是我咨询公司的一项持续要求。作为一项额外的奖励,我主要向电信公司咨询,并经常处理订户数据和数据分析以及所述数据的出售和重用。我至少有资格在这个论坛上回答这个问题。

我将尽我所能来最好地解释这个问题:第二,定义引用的案例例外情况和其他相关的版权注意事项;第三,要清楚答案。

让我澄清一下版权。电话簿的例子是用词不当。接到电话后,您已作为私人公民与私人公司签订了私人合同协议,因此,无论是否公开,所得信息均为私人专有数据,因此电话簿的内容为专有信息(请注意这个词)仅是因为通常只能通过公司数据源(订户数据)以外的任何其他方式来获得它。如果数据可以通过普通方式获得,例如到处走走并写下门牌号码和街道名称,则该数据是公开可用的数据,并且易于使用。这并不是说不能通过普通方式获得电话号码。可以。

进一步说明。引用:http://www.lib.umich.edu/copyright/facts-and-data


在任何情况下,对于
的原始作品,都没有版权保护。著作权扩展到
操作,概念,原理或发现的任何想法,过程,过程,系统,方法,无论在
中以何种形式描述,解释,说明或体现
工作。


本段具有误导性。本段所述的例外情况受专利法和其他法律保护。版权仅扩展到作品的创作。

The:


“眉毛汗水”学说



...指任何活动,例如搬家挨户和手动收集数据。这是普通手段的定义。可以敲门并索要相同的电话数据。只有通过普通方式收集的事实是,数据或专有数据的一部分是公开的。

使用电话数据的普通方法是:一,通过合法途径获取原始数据手段;第二,运用合理使用原则。这将需要直接从公司获得电话簿的副本,该副本可能是免费的或收费的,并且以不同的方式组织事实以创建新作品。您在芝加哥时是否尝试过获取西雅图电话簿?您会发现电话公司可能会向您收取惊人的费用。但是,如果您是西雅图的电话订户,并且要求提供西雅图电话簿,则费用将少得多,甚至免费。我不得不做多次。有些人的工作就是亲自从电信公司获取电话簿,并根据需要付费。

在上述链接(此答案中)的Feist Publications诉农村电话一案中引用的裁定取决于两个事实:一个是,农村合作社运营商作为本地垄断者的数据需要通过运营协议公开获得;第二,该作品的展示受版权保护,而不是由于事实1而包含在其中的事实。因此,只有在狭窄的参数范围内,这种情况才能被视为先例,必须将其丢弃。通常,协议不要求将私人公司订户数据公开。您必须记住,农村合作社是作为公益事业的公共信托/实体,并由公众和/或合作社成员拥有,因此在法律上允许其被批准运营或存在。每种情况都不同。引用上述案例(在链接的页面上)作为没有解释例外的理由的论点具有误导性。

在贝尔电话公司成立之初,该公司被要求作为垄断,以公开电话数据,除非受用户限制。当Bell公司拆分为Bells,Bell Atlantic,Bell South等婴儿公司时,仍然需要这些公司作为垄断来公开电话数据。但是,随着放松管制,实际上还有VoIP,蜂窝电话和其他选择,垄断是罕见的。仅在垄断情况下,才能提出以上引用的论点。

继续引用上面的链接(在此答案中):


只是因为数据不受保护按版权表示,并不意味着在您
希望使用其他人的数据集时没有其他法律上的考虑。


请记住这一点。

无论数据来源如何,任何给定的数据集及其表示形式都是其本身的工作。不论事实如何,对事实的公开表述都是其本身的工作。

鉴于即使数据是公开的,您也不是通过普通手段获取数据的,无论数据的原始来源,不能按您所描述的那样免费使用,并且您可能会受到刑事指控,并应承担潜在的侵犯版权的民事责任,以及对犯罪和非法使用计算机和其他非常规授权的通信设备的刑事责任RICO法规。

使用合法吗?没有!绝对不!它不是通过普通方式获得的,也不可能是网站运营商公开专有数据的意图。如果没有AUP(可接受的使用政策)将无济于事。在这种情况下,根据法律对“合理的人”,“合理的标准”和“合理的假设”做出了保护网站所有者的假设。聪明的人会利用网站的“设计/创建漏洞”来获取数据以供其他用途,这是不合理的。同样,如果该站点从其活动中获利,则进一步的保护也将发挥作用。

评论


伟大的对立面。值得重申的是,如果您对自己所从事的工作的合法性有疑问,通常值得咨询律师。

–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
2014年12月11日19:19



NFL声明其专有拥有球队/球员统计数据,因此对数据进行许可使用。如果我在电视上看到它,则是通过许可协议,如果在新闻报纸上看到它,则是通过许可协议,杂志,也是一样。您将获得数据的大多数来源都是经许可的。但是,如果通过普通方式(例如问朋友)获得,那是合法的。但是,如果您在无法从该信息中获利的网站上发布统计信息,尽管NFL非常谨慎地考虑许可问题,却不会开枪打死您。他们可以写一封信,但总的来说,他们不会打扰。

– closetnoc
2014年12月11日,19:34

英国的法律并不相同,因为即使每个数据项都没有版权,“公共数据”集合也可以受版权保护。

–伊恩·林格罗斯(Ian Ringrose)
2014年12月12日12:30在

@closetnoc,仅使用隐藏的API来获取信息是否非法?如果您要按预期使用网站并手动写下信息,然后再使用,那是否合法?后续行动:如果是这样,并且您使该过程自动化,那么它仍然合法吗?

–詹森
2014年12月12日19:05

@closetnoc我很好奇:如果假设该网站的robots.txt没有限制URL,并且在各种搜索引擎上都有来自该URL的查询,这会影响您的分析吗?有了JSON,我发现它比吹捧的“人类可读” XML更具可读性(但他们说!:D)[例如SOAP],您是否同意那时可以说是“通过'普通手段'获得的”?在安装了其中一个易于查看JSON的扩展程序的浏览器上,单击链接并查看数据将很简单。而且我想象自动JSON-REST-query-field-search添加不会落后...

– shelleybutterfly
2014年12月12日20:20



#2 楼

这里的其他答案中似乎不太清楚的一件事...

首先,最重要的是,是否“合法”取决于国家/地区。例如,如果我们谈论的是美国,那么使用数据本身并不是非法的。但是,我建议您使用美国人口普查的真实数据。他们通过所谓的TIGER产品提供大量数据。此数据集与GIS专业人士用来填充Bing地图,Google地图等的数据集相同。 API合法可用。您说它是JSON形式,这表明它已从其原始格式“被按摩”为这种格式-并且该自定义格式可能属于知识产权。我认为,除非您具有使用许可,否则使用将是非法的。像这里的其他人一样,我不是律师,但是公司甚至不需要指责您,就称您为黑客。专有数据是专有数据,即使它是无意间分发的。您应该与该公司联系,并让他们知道所有这些数据都已暴露给外界,并寻求使用许可。如果不这样做,并且以堆栈交换上的这个问题为证据,则很容易对您提起诉讼。您基本上已经说过:“这看起来不合法,但无论如何我都喜欢,我想从中赚钱。”再说一次,我不是律师,但这似乎不是开始审判的好方法。

不过,如果您对城市名称和其他地理数据感兴趣,那么几乎所有国家/地区都可以免费获取。最后我知道,美国发布的数据最多,但是几乎每个国家都有数据。我犹豫只说一句话,因为我是一名程序员,很难证明“为所有人”的说法……如果您选择一个任意的国家,那么那里存在数据的机会总比没有好。如果您有特定的国家/地区,请前往GIS Stack Exchange。您要查找的主要对象是“ shapefile”,因此请问一个问题,例如“在哪里可以获取__________的shapefile?”还有OpenStreetMap,这是一个开源地图。我不确定获取他们的shapefile数据有多么容易,但是如果可以从他们那里获取数据(而且我不知道为什么无法这样做,那么您可以基于本地运行离线地图存储的信息),那么您便拥有了所需的所有数据,并且合法无虞。您必须花费时间将海量数据分解为所需的数据,但是shapefile总是定义得很好并且易于解析。

评论


您带来了一些优点!合法机构从美国政府获得的任何数据均为公有领域,因为它已经由公众通过税收支付并拥有。如果以特殊格式(例如,印刷(GPO政府印刷办公室),磁带或CD或其他介质等)提供格式,则政府喜欢对此数据收费。他们这样做是为了收回人工/材料成本,尽管我有时会争论费用与成本之间的关系。美国政府从事赢利游戏已有几十年了。您为什么认为他们真的想要所有额外的人口普查数据?他们卖掉它。

– closetnoc
2014年12月11日在22:15

#3 楼

尽管closetnoc讨论了数据本身的问题,但还有一个更大的法律问题:您无权访问提供数据的API。

大多数计算机犯罪法律的基线都涉及“未经授权”的概念。访问计算机系统”。在访问控制方面,您不应将法律上的授权与授权概念混淆。系统的所有者不必保护自己的系统就可以非法访问它,就像您进入带有未锁门的房屋时仍在侵入一样。

在这种情况下,显然是缺乏安全性并不意味着可以使用它。迄今为止,互联网的概念在判例法中尚无先例,但是您可以想象使用HTTP 80协议来暗示公开授权来查看网站。相反,除非操作员以这种方式发布服务,并将其授权给第三方使用,否则通常不认为后台RPC协议(即使它们可能在HTTP请求上运行)也是公开可用的。

使用API​​检索数据将是非法的。从API进行数据转储以构建自己的数据集的行为也是非法的。此后是否使用数据是否非法是一个巨大的灰色区域,但是closetnoc涵盖了大多数问题。

当然,如果在无法识别的事实之后修改数据转储,它将是紧随其后的无法证明您犯了罪。但是,如果您要处理这么多麻烦,为什么不从合法来源获取数据呢?

评论


有趣的是,我同意你的观点,但是当你争论“ AJAX RFC协议是一个不用于公共访问的内部系统”时,这对我来说没有任何意义。我不确定与它有什么协议。许多组织都提供诸如此类的公开数据服务,以供公众使用。例如,提供GIS数据的地方政府。对我而言,有意义的事实是OP发现数据服务的方式,而且很明显,它不打算供公众使用。我在这里基地吗?

–伪编码器
2014年12月12日在15:28

我确实涵盖了这样一种事实,即在任何标准下这种访问都是非法的,但是,我很高兴您再次提到它。这是重要的一点。任何AUP都应声明默认情况下不授予访问授权(当然,它不必是那个苛刻的人)。这个想法是先建立一个否定的默认值,然后以相当狭窄的webbie方式定义可接受的用法。

– closetnoc
2014年12月12日15:46

@pseudocoder不,您是正确的。我的意思是,已经建立了合理的期望,即默认情况下对HTTP服务的访问是公共的,而对于RFC服务和类似协议而言则相反。此类服务通常会发布以供公众使用,并以此宣布。正如我说的那样,我不知道判例法,也不知道各种网络犯罪法在实践中如何处理这件事,但这是一个重要的区别。 [...]

– Liilienthal
2014年12月12日下午16:15

如果您对公共访问没有这种期望,那么您将违反对StackExchange的访问,因为其所有者未明确授予您查看页面的权限。一个有理智的人(在法律讨论中很流行的概念)会希望网站服务对所有人都可用,而敏感部分则隐藏在访问控制层后面。相同的人不会期望“隐藏的”后台服务(普通人不理解)同样有资格对所有人免费。我已经编辑了答案,希望可以更好地解释这种二分法。

– Liilienthal
2014-12-12 16:18



“ RFC”是指“ RPC”吗?

–ruakh
2014年12月13日下午4:21

#4 楼

这可能取决于数据的性质。纯数据(如电话簿)不能享有版权。因此,通过API列出的城市应该是公平的游戏,可以复制并显示给用户。但是,如果该API包含城市描述,则这些描述将受版权法保护,并且您在不侵犯版权的情况下将无法使用它们。

如果您可以合法地复制数据,我建议将其复制到您自己的站点,以防止API使用率过早关闭。

评论


感谢您的回复。只是不清楚什么可以是纯数据。例如:城市中的居民数量或城市中去年的新车辆登记数量...或其他情况:克里斯蒂亚诺·罗纳尔多(Cristiano Ronaldo)本赛季得分的进球数或明年U2的音乐会清单。 ..这些都是纯数据吗?

– MikO
2014年12月11日下午16:27

我不是律师。知识产权律师将更适合于建议您如何将法律应用于您的特定数据。您提供的示例对我来说就像是数据。只有它们的演示或排列可以享有版权(通过我的答案中的链接)

–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
2014-12-11 16:38



我认为判例法支持电话簿中的姓名和电话号码不受版权保护的事实。参见Feist v。Rural:“电话簿的白页不符合宪法所规定的具有版权保护条件的最低原创性,并且资源的努力和支出不受版权保护。”

–斯蒂芬·奥斯特米勒(Stephen Ostermiller)
2014-12-11 17:32



#5 楼

(IANAL和法律和规范在全球范围内相差很大,但是由于知识产权条约的缘故,某些事情趋于保持一致。如果您的专业之外还存在专业问题,请咨询专业人士。)

通常,从法律上讲,除非将API主动记录为具有指定服务条款的公共API,否则不应将其视为“打算供公共消费”。公众可以访问该API的事实并没有使其公开。

如果数据本身的状态不是完全公开的,并且在少数情况下显然是公开的,那么提供API的实体的意图就很重要。如果网站运营商打算将API用于动态网页或移动应用程序(仅举两个常见示例),则任何其他用法都是“未授权”的,除非在某处得到了特别授权。如果目标消费者是特定网页中的一小段动态代码,则为了以一种特定的(希望的)令人愉悦且有用的方式将人类可理解的像素放置在显示器上,则任何其他使用均未经授权。

通过打开的窗户进入建筑物而不打开或破坏任何东西的技术能力不会保护您免受犯罪侵害而被捕...

此外,玩游戏几乎从来都不是明智的与知识产权律师进行的“技术能力”与“原始意图”游戏。如果没有别的,请记住,经常丢失这些案件的律师不会继续为他们收取报酬。

#6 楼

您所说的可能很好。您正在超链接到信息,然后对其进行转换。


在Perfect 10,Inc.诉Amazon.com,Inc. [19]中,第九巡回法院再次
考虑是否图片搜索引擎对缩略图的使用是合理的。尽管事实比Arriba软案要近一些,但法院仍然认为被告侵权人的使用是公平的,因为它“具有很大的变革性”。法院解释说:

我们得出结论,尤其是考虑到其公共利益,谷歌搜索引擎的显着变革性超过了谷歌对缩略图的取代和商业用途。这种情况。 …我们也谨记最高法院的指示,即“新作品更具变革性,其他因素(如商业主义)的意义就越小,而这些因素可能不利于
合理使用。”

此外,法院在美国的第一个上诉裁决中专门针对链接的版权状况进行了处理:当Google对用户计算机屏幕上出现的在线链接图像进行构图时,则不会……为了版权法的目的,显示完整尺寸的侵权照片图像的副本。由于
Google的计算机不存储照片图像,因此,出于版权法的目的,Google
没有图像的副本。换句话说,Google没有任何“固定了...
作品的…可以从中感知,复制或以其他方式传达作品的”物质对象”,因此无法传达副本。 Google不会提供图片的副本,而是提供HTML指令
,该指令将用户的浏览器定向到存储完整尺寸图片的网站发布者的计算机。提供这些HTML
说明并不等同于显示副本。首先,HTML
指令是文本行,而不是照片图像。其次,HTML
指令本身不会导致侵权图像出现在用户的计算机屏幕上。 HTML仅将
图像的地址提供给用户的浏览器。然后,浏览器与存储侵权图片的计算机进行交互。正是这种交互作用导致侵权图像出现在用户的计算机屏幕上。
Google可以帮助用户访问侵权图像。但是,
这样的帮助仅引起了分担责任问题,并不构成对版权所有者的展示权的直接侵犯。 …虽然内联链接和框架可能导致某些计算机用户
认为他们正在查看单个Google网页,但与《商标法》不同,
版权法并不保护版权
持有人

Arriba Soft and Perfect 10之后的美国法律状况

Arriba Soft
案代表着深层联系和实际联系
复制缩小尺寸的副本(或准备缩小尺寸的衍生作品)都可以作为合理使用的理由,因为
被告对作品的使用没有实际或潜在地转移用途
从头开始的市场交易;并且还为
公众提供了以前无法使用的,非常有用的功能,而该功能
是版权法所要促进的(在Web上查找所需的信息)。 “完美十人”案涉及类似的考虑因素,但
涉及更多的利益平衡。该行为被原谅
,因为对于公众而言,原本无法获得的有用功能
的价值超过了Google可能
取代使用对Perfect 10的影响。

此外,在《完美十大》中,法院提出了影响深远的先例
,以支持链接和框架,法院在版权方面给出了完整的通行证
。结论是:“内联链接和框架可能会导致某些计算机用户认为他们正在浏览单个Google
网页,[但是]《版权法》 ...并不保护版权
防止引起消费者困惑的行为。”


强调我的权利。 linky

您只是在使用超链接,没有在制作副本,没有在显示副本,没有在损害商业利益,并且正在对其进行高度转换。我要说的是,您必须具备所有要素。但是,IANAL。

评论


OP的问题与超链接无关。您引用的情况也不适用。实际上,这种情况不应该提起。索赔人提出的侵犯版权的指控是没有道理的,因为合理使用原则将直接适用。关键字是可转换的。这是定义合理使用以及搜索引擎引用或引用他人作品的权利的另一关键要素。 OP正在谈论整个销售的提取和他人作品的使用,这是对版权的侵犯,其中包括联邦政府的RICO的重大侵犯。

– closetnoc
2014年12月12日20:41在

/ *我不是律师/我绝对〜倾向于〜在这一方面……*特别是通过RESTish JSON查询API的http / https链接,该链接已经用于获取开放网站的数据根据现行法律在美国的公众[具备足够的资格? xD]“应”不违反法律,原因如下:1.无需DMCA规避-由于没有适当的规避措施,因此无需“规避”。仅仅声称有人为了防止他人复制而对某物进行保护是不够的,这些措施是law.cornell.edu/uscode/text/17/1201

– shelleybutterfly
2014年12月12日21:04

/ * I!= AL /和2.这里的主要焦点之一:*链接与hading不同。如问问中所述,如果玩家的浏览器已下载,则对于在线游戏来说可能没问题;或(也许)是否已根据玩家的行为抢占了一切。 [IMO,在某处将该站点归功于它是正确的。]但是,问题在于:我们得到了技术。但是,许多法官/陪审团都是文盲,有些人似乎故意误解了。最好的情况是,您必须浪费资源进行战斗。因此,如果您可以做这样的游戏,请省去麻烦。做其他事情。海事组织。 gl。

– shelleybutterfly
2014年12月12日21:05

@closetnoc:您可能想重读OP。他正在谈论访问包含一些文本的网页。那是一个超链接。 Wikipedia上的超链接:“内联链接显示远程内容而无需嵌入内容。可以在有或没有用户选择链接的情况下访问远程内容。内联链接可以显示内容的修改版本;例如,代替图像的缩略图,低分辨率预览,裁剪部分或放大部分可能会显示。”这就是OP所说的,不是吗?

– Shane
2014-12-12 21:26



@closetnoc:他计划将用于呈现信息的文本转换为游戏。那是变革性的。除非他自己保存数据,否则他也不是在谈论提取任何内容,而只是查看它并对其进行转换。我不知道您为什么认为反对有组织的球拍活动的法律在这里有任何意义。 OP正在询问是否违反版权法来访问超链接,或将该超链接提供的数据转换为新的内容。

– Shane
2014年12月12日21:27在

#7 楼

只要您不必输入密码即可获取密码,但它是合法的,但是,一些不太成熟的公司可能会声称遭到黑客入侵并请您与律师联系。您必须准备好捍卫自己。您会发现他们没有罪恶感,因为他们正在向公众发布数据,但捍卫自己的代价可能会更高。检察官和警察服从公司。这通常发生在安全通知中,有人会通知公司安全漏洞,然后公司会向他们指控黑客入侵。该公司还可以自由更改API,恕不另行通知,可能会破坏您的应用。

http://www.extremetech.com/computing/146323-canadian-college-expels-student-for-white -hat-security-probing


如果您以前曾听说过,请阻止我:一位技术狂热者在检查安全漏洞时有点过分热心,发现了一个重大漏洞,提出了信息,然后造成法律和人身威胁。


http://www.bostonglobe.com/metro/2014/03/29/the-inside-story-mit-and- aaron-swartz / YvJZ5P6VHaPJusReuaN7SI / story.html


入侵者潜伏在MIT校园的某个地方,下载了成千上万的学术期刊文章。


评论


确实。尽管定罪最终被推翻,但奥恩海默(Auernheimer)在屏幕上刮擦AT&T的时间已超过三年。

–没人
2014年12月11日,21:26

-1。这是不正确和危险的建议。大多数计算机犯罪法律的基准都涉及“未经授权访问计算机系统”的概念。仅仅由于系统(显然)不受保护,并不表示您有权使用它。您也不应将法律意义上的授权与访问控制上下文中的授权混淆。

– Liilienthal
2014年12月12日上午10:43

@Lilienthal OP问题中网站的可用性表明每个人都被授权。实际上,甚至可以说用户代理从服务器运行了javascript,因此反向授权网站在用户的计算机上运行代码并执行其他查询

–哈根·冯·埃岑
2014年12月12日23:18

@HagenvonEitzen最肯定不是。该网站是面向公众的,并使用后端服务来显示数据。将其与咖啡店进行比较:您可以点一杯意式浓缩咖啡,但不能跳到柜台后面按照自己的方式冲泡咖啡,而必须经过咖啡师。

– Liilienthal
2014年12月12日23:49

@Chloe保留所有权利,应该简单地拒绝该答案,因为它实际上是不正确的,并且可能有助于导致某人犯下非法行为。您会考虑编辑答案吗?

– closetnoc
2014年12月13日下午5:31