我已经绘制了所有Stack Exchange网站的地图,除了三个最大的网站:



(一个高解析度png文件)(编辑:有一个PDF文件,但由于某种原因,它至少消耗了我的计算机上超过1 GB的内存)


该图基于rep> = 200的用户
节点的大小与此类用户的数量有关。
如果有更多的普通用户会随机选择一个站点,则两个站点之间会有一个优势,请参见观察/预期比率。 Stats.SE。
颜色表示不同的图社区(节点在一个组内的连接比与其他组的连接要多得多)。类似的情节(或调整这一点)。另外,您可能需要查看Math.SE的图形映射。

为什么不包括服务器故障,超级用户以及最重要的是堆栈溢出?

堆栈溢出在某种程度上是与其他网站不同的故事。关于服务器故障和超级用户-不幸的是,Stack Exchange API(或至少-我的Python包装器se-api-py)在获取超过100k项时存在一些问题。

任何欢迎提出问题和评论。

评论

我爱你继续做这些! :D我认为它们很棒,而且让我用不同的方式来看这些地点。

我还没有深入研究您的实现,但是前几天我在谈论类似的想法。我的想法是获取所有问题和答案的文本,标签以及与共享用户的文本,以确定是否存在相关站点的任何集群。您对此有何想法?您认为我可以利用您的工作来做到这一点吗?

@ThomasOwens在我的案例中,我计算了一个用户(由account_id标识)拥有更多站点帐户的情况,例如['gaming','rpg','boardgames]](每个rep> = 200只是为了过滤掉人们根本不活跃的状态,否则结果是一团糟)。查看相似的文本可能会比较棘手(但是很好,例如建议迁移),位于不同站点的标签可能具有不同的含义,等等。无论如何,挖掘SE数据有很多可能性。我的代码在GitHub上,欢迎您使用它。在使用我的API时-上传之前,我需要清理它。

我喜欢您按信誉过滤的方法。我在多个站点上都有一个帐户,但这主要是因为我可以阅读,评论和投票。我积极参与的网站比我拥有的帐户少得多。如果我设法到达任何地方,我会通知您。有空的时候我会检查您的代码。

@ThomasOwens如果您对我的代码有任何疑问或疑问,请询问。 :)将阈值设置为200时,它是任意的,也许有更好的方法(例如,查看最近几个月的代表)或仅发布一些问题。

为什么ProgSE与健身和武术分组而不是编码分组?我以为程序员会整天编写代码,并且不运动;-)

@Manishearth我猜链接如下:编程-怪异-角色扮演-武术。但是健身...-不知道。或是与“提高生产力”与“了解生产力”一样(例如著名的终极生产力博客):P。

@Manishearth:鲜为人知的秘密:程序员喜欢互相询问有关健身的问题。我们是否真正遵循并执行任何操作是一个不同的故事...

@PiotrMigdal我们可以得到更大的图像吗?

@smcg我添加了pdf-raw.github.com/stared/tag-graph-map-of-stackexchange/master / ...

我一直想点击所有这些彩色的圆圈:)有一个叫做“ Visual History”的Chrome应用程序很有趣。非常有趣的图。

@Josh是的,我想进行更多的互动,例如d3js.org。 flyingdata.com/2012/08/02/…:)

@PiotrMigdal在您的第一条评论中,您说您是通过account_id识别用户。 AFAIK在各个站点之间唯一可比较的字段是EmailHash。

@MarkHurd谢谢,我会检查一下。但是您是否知道为什么acount_id(AFAIK,跨站点的帐户标识符)不起作用?

@PiotrMigdal是的,看来account_id是仅用于API的东西,并且在api.stackexchange.com/docs/…和api.stackexchange.com/docs/…进行了一些测试,它确实为我返回了相同的account_id(但是不是id)。

#1 楼

这张图值得一看,但是我认为最好的是颜色组。对于我最熟悉的站点,该组织很有意义:


诠释学与其他宗教站点非常吻合。 (从那时起,哲学也考虑到了上帝的概念出现的频率。)
旅行和语言学非常适合非英语网站。
历史和怀疑论者与作家一样, English-SciFi-Movies群集,尽管我不确定该颜色的两半之间的亲和力。
Unix站点与更多的“黑客”类型站点相关联。
硬科学,数学和Acedemia位于同一集群中。 (加上图书馆。)
有大量的“利基技术”网站。音乐结束于此很有趣。
“动手”站点(DIY,园艺,烹饪等)很好地聚集。

然后是绿色站点。它们是“极客文化”网站吗?那是我最好的猜测。

评论


不错的观察!

– Piotr Migdal
2012年12月7日19:34

我想知道为什么扑克网站与语言网站同在。

–唐·柯比(Don Kirkby)
2012年12月8日在4:42

@DonKirkby它与中文,俄语和国际象棋有很强的联系(后来不是语言,但也与语言紧密相连)。因此,鉴于数据,这种关联不足为奇。为什么首先呢?我只能推测...(最好是问扑克界的人)。

– Piotr Migdal
2012年12月8日13:47



@Don Kirkby:我注意到国际象棋,这是有道理的,因为它与俄语有关。 (讲俄语的人在游戏的最高级别上占据了一代或更多的时间。)但是我没有注意到扑克,因为它很小而且藏在一边。有趣。

–乔恩·埃里克森
2012年12月8日20:27

@乔恩·埃里克森(JonEricson)...作为好奇的观察,育儿是一项动手的爱好。

– Piotr Migdal
13年4月24日在11:31

#2 楼

看起来,ExpressionEngine.SE上的人们并没有付出太多。

评论


他们有200多个信誉用户?这是一个非常新的网站。

–乔恩·埃里克森
2012年12月7日在18:17

这是最新的公开测试版网站。没有那么多用户,没有那么多代表。

– Manishearth
2012年12月7日在18:19

@JonEricson:59岁。仍然比SmugMug的19。

–Ullallulloo
2012-12-7 18:20



@JonEricson(和Manishearth),请记住,节点大小基于用户数量。如果有的话,其他类似大小的堆栈看起来比较大的堆栈更具连通性。我认为那些家伙真的只是没什么大不了的。

– blahdiblah
2012-12-7 18:42



有趣的是你应该这么说。 ExpressionEngine提案有很多追随者,但他们还没有参与现有站点。我不知道为什么,但是与其他一些与编程相关的建议不同,它们不只是从SO中分离出来,而是来自外部。

–亚当·李尔♦
2012年12月7日19:29

@AnnaLear这很奇怪。提案似乎是由EllisLabs推动的,特别是考虑到启动时间很短的情况。但是,我能找到的唯一参考文献导致第一次尝试失败了。

– Tim Post
2012年12月8日在2:26

@TimPost该提案得到了热烈的宣传,例如:meta.stackexchange.com/questions/152995/…

– yannis
2012年12月8日在3:38



@TimPost我不认为EllisLabs晋升了,但确实得到了一些无关的宣传。这些细节现在让我无所适从,但当时真是太酷了,因为在我们的网络外部发展社区是我们目前面临的更大挑战之一。

–亚当·李尔♦
2012年12月8日下午4:01