2013
10.25

本文作者:一起剥坚果

提问:

如果Twitter的时间线(包含你粉过的好友的动态)能够超出屏幕范围向上下两个方向延伸,那么它会变得有多长?

—— 匿名人士

wpid-timeline_intro-2013-10-25-20-45.png

回答:

这是一个很有意思但不那么好回答的问题,因为回答中牵涉了德国坦克、人类灭绝以及互联网上最受争议的概率问题。

不过首先我们先来谈谈Twitter。

好多新鲜事

你的这个问题取决于你把哪些人加为粉丝,因为有一些人他们发出的新鲜事比其他人多出许多。

@JephJacquesQuestionable Content的作者,他每天要发许多新鲜事,在你的时间线中他可能贡献了3.6万条,并且这一数字还在不断上涨。然而从另一个方面来说,如果你粉的人不怎么冒泡,那么很有可能一个屏幕就能全部容纳下。

根据Diego Basch的一项分析,去年每个Twitter账户平均发了307条新鲜事,粉了51个人。[1]但这种平均数据是很有误导性的;[2]因为绝大部分Twitter账号不是从未发过一条新鲜事,就是只有一个粉丝。

为了了解普通人的时间线是什么样子的,我让一些朋友把他们的Twitter首页截图,还让他们数一下在那一时刻新鲜事冒出来的速度。他们所得到的结果相差巨大——有人一分钟就看到20条新鲜事,而有人一个月才看到20条。

在根据每天不同的时段对数据进行修正[3],并以Twitter的成长速度为依据向前推算[4]之后,得出的结果是一些时间线有数百条新鲜事,而另一些则有数百万条。

在我的显示屏上,每条新鲜事大约有2.4厘米高。[5]这意味着Jeph Jacques的新鲜事有900米高——比世界上最高的大楼还高——而且还在不断增长。

不过Jeph和@YOUGALUDAN_oo比起来算不上什么,这人每分钟都要发很多新鲜事——通常是一些代码,不过偶尔也会发一些正常的话语。

@YOUGANKUDAN_oo累计已经发出了3700万条新鲜事,其高度足以达到近地轨道。

结合Diego在2012年7月做出的估计,以及如今每天新鲜事冒出来的速度,我发现截止2013年10月Twitter上一共出现了3450亿条新鲜事。这意味着如果你粉了每个Twitter用户,那么你的时间线会有800万千米高。为了让你有直观的认识,我把这么长的时间线和地球并排放在一起:

wpid-timeline_earth-2013-10-25-20-45.png

当然了,这些只是你屏幕“下方”的新鲜事,那么所有的新鲜事有多高呢?

wpid-timeline_future-2013-10-25-20-45.png

终有一天,你最后粉的那个人会发出最后一条新鲜事,但那是何时?

未来

事实上我们的时间线不会有摩天大楼这么高,甚至不会接近这个高度,因为Twitter限制了你通过滚动屏幕所能看到的过去的新鲜事数量。但我们能否预测最终我们的时间线会有多高吗?

按照人类的寿命来算的话,看上去你粉的绝大多数账号都将在一个世纪内停止发送新鲜事。不过像@big_ben_clock这样的账号倒是可以持续发送数千年。
但Twitter能撑到这么久么?

要给出确定的答案当然是不现实的,但统计学中有一个挺奇怪的工具或许能给我们一些帮助。[6]

也有可能毫无帮助,这取决于你指的是什么。

德国坦克问题

假设你被传送到一个平行宇宙中,你随机打开IMDb网站的一个页面,发现页面上显示的是《小脚板走天涯27》。[7]

根据这个标题,那么在这个宇宙中有过多少部《小脚板走天涯》系列电影?显然至少有27部,或许有更多。

盟军在第二次世界大战中就面临着另一版本的这个问题。[8]德国坦克的部件上有序列号,它们中有很多是按顺序标上去的(1, 2 … N)。假设他们随机俘获了一辆坦克,然后发现这是第27号坦克,那么盟军可以确定德国人至少有27辆坦克。而且这一事实也告诉他们德国不太可能有成千上万辆坦克——因为如果真的有的话,盟军不太可能只俘获一辆编号只有两位的坦克。

当然了,敌人可以通过给坦克随机标上很大的数字来破解这个方法。事实上美国人在1981年就这么干过——美国海军将他们的精英反恐小队命名为“第六海豹突击队”用以迷惑苏联间谍,让他们认为肯定至少还有另外五只相似的小队。[9]

假设编号是连续的,那么利用贝叶斯理论你就能很可靠地从一些坦克样本推算出所有的坦克数量。[10]

但如果你只有两三个样本的话,情况就变得有些复杂了。[11]如果你只有一个样本——正如我们的《小脚丫走天涯》问题那样——最好的策略或许是把你看到的那个数字乘以二。这意味着一共有54部《小脚丫走天涯》系列电影。

这个策略的重点在于你有很大可能看到的是位于中间的电影,只有很小的概率你看到的是第一部或者最后一部电影。

开始有些诡异了

如果我们把德国坦克问题的思路用在人类身上,我们将得出人类会在2243年灭绝的结论。

过程如下:

人类总有一天会灭绝。假设灭绝真的发生之后,外星人设法让所有存在过的人类都活了过来,然后把这些人类按照出生顺序排好队,并从1到N开始编号。然后外星人把这些人分成三组——前5%,中间90%和后5%。

wpid-02131354_23451-2013-10-25-20-45.gif

现在设想外星人问每一个人(这个人不知道在他之后有多少人出生)相同的问题:“你认为你在哪个组里?”

他们中的绝大部分可能不会说英语,而那些会说英语的又迫不及待地想问他们自己的问题。假设出于一些原因每个人都回答说:“我在中间90%”,那么显然90%的人是正确的,这与N有多大无关。

因而这个理论表示我们都应该认为自己是中间90%。而到目前为止一共出现过1000亿多人类,那么我们推断出有95%的可能性N不会超过2.2万亿。而如果不是这样的话,那么我们得假设自己是在5%那组中——而如果每个人都这么认为的话,那么绝大部分人将会是错误的。

简而言之:在所有从过去到将来活过的人之中,我们都应当假设自己是在中间的某一位置;事实上,大多数人都落在这一区间里。

如果地球总人口能平衡在90亿人,那么这意味着人类将极有可能在约800年内灭亡,最长也只能撑到1.6万年。

这就是末日论

是,这很愚蠢

几乎所有听说这一论断的人都会立即发现一些漏洞。

可是问题在于,每个人认为的错误理由都不尽相同。而他们研究的越多,他们心中的错误理由就越有可能发生变化。

这个理论在1983年被提出来,之后成了成千上万论文抨击的靶子,而还有另外成千上万的论文反对那些反对这一论断的论文。[14]对于答案人们并没有一个统一的共识,就像跑步机上的飞机这个问题一样,只不过要更加糟一点。

这和Twitter有什么联系?

我们不妨假设末日论是正确的,然后将这一结果用在Twitter上。既然现在已经有3450亿条新鲜事,那么最好的估计是Twitter整个生命期一共将拥有6900亿条新鲜事。

以目前每天4亿条新鲜事的速度来算,这意味着5年后所有的新鲜事都将发完。而且有95%的可能性Twitter将在未来45年内消失。

这听起来很靠谱,现在的技术变革速度太快了,我们没有道理去指望一个互联网服务能保持流行超过10到20年。

但等等……末日论是正确的吗?

wpid-02131702_59101-2013-10-25-20-45.gif

如果我们发现2018年Twitter的活动量变小了,那是不是意味着末日论有可能是正确的?如果是这样的话,是不是意味着人类只剩两个世纪可活?

不太可能,不过这取决于你问的是哪个统计学家。

好的一面是,自2007年后《小脚丫走天涯》系列就不更新了,因而至少不太要担心人类灭绝那个可怕场景了。

wpid-timeline_lbt-2013-10-25-20-45.png

  • 注2:如果像拉里·埃里森(去年挣了9600万美元)这样的土豪搬到一个人口3000人的普通小镇里去的话,这个小镇的人均收入将在一夜之内翻一番。
  • 注3:乘以0.5到1之间的随机一个数。
  • 注4:往一张表格里填数字,直到列不够用为止。
  • 注5:我在我屏幕上量的,你可以用你自己的屏幕量一下。
  • 注6:用它来预言Twitter的忌日!
  • 注7:罗马数字表示的是数字27.
  • 注9:Pfarrer, Chuck. “Team Jedi.” In SEAL target Geronimo: the inside story of the mission to kill Osama Bin Laden. New York: St. Martin’s Press, 2011. Loc 594/3898.
  • 注10:除了维基百科上的条目外,在Statistics BlogEvent Horizon上都有不错的讨论。
  • 注11:人们可能认为俘获从编号为1到编号为无穷大的坦克的概率是相同的,但从数学角度上来讲事实上并非如此,因为它违背了柯尔莫果洛夫第二公理


暂无回复

添加回复
回到顶部

无觅相关文章插件,快速提升流量