黎健敏吧 关注:18贴子:1,574
  • 1回复贴,共1

别用“常识”理解复杂世界

只看楼主收藏回复


● 同人于野
  如果一个物理学家谈物理,哪怕他只是用大家都能听懂的语言做科普,外行一般也不太敢提出质疑。人们知道物理学是一个非常专囘业的尖端科学,没经过多年训练的人胡乱说话只能闹笑话。可是当一个社囘会学家谈论社囘会问题的时候,哪怕他旁征博引了好多东西方先贤的经典理论,别人还是可以毫无压力地批囘评他。不管专囘家怎么说,每一个出租车司机都认为自己知道汽油涨囘价是怎么回事,每一个网友都认为反囘腐囘败的出路是明摆着的,每一个球迷都认为如果从来没搞过足球的韦迪能当足协主囘席,那么我也能当。
  这也许怪不得大众。实践表明,像政治学这样的软科学,其“专囘家”的实用程度很可能并不显著高于“砖囘家”。1984年,伯克利的心理学家Philip Tetlock做了一个影响深远的研究。他调囘查284个专门以预囘测政治经济趋势为职业的政治学家、智囊和外囘交囘官,向他们提出各种预囘测问题,比如说戈尔巴乔夫有没有可能被政囘变搞下囘台。Tetlock要求专囘家们对其中大多数问题,比如某个国囘家的未来政治自囘由状况,提供出现三种可能性(保持现状,加强或者减弱)的大致概率。这个研究做了二囘十囘年,一直等到当年预囘测的事情全部水落石出。到2003年,Tetlock总结了这些专囘家给的答囘案,发现他们的总成绩还不如索性把每个问题的三种可能性都均等的设为33%。也就是说,专囘家的预囘测水平还比不上直接抛硬币。更有讽刺意味的是,这些专囘家对自己专囘业领域的预囘测得分居然比在自己专囘业外领域更差。
  所以《纽约人》杂囘志在评论Tetlock描写自己此项研究的《政治专囘家可靠么?》( Expert Political Judgement: How Good Is It? How Can We Know? )这本书的时候对专囘家相当悲观,最后得出的结论居然是我们还是自己思考算了 – 尽管Tetlock的研究显示专囘家的得分其实还是比普通人略高一点。
  但社囘会科学并非无路可走,它可能正处在一个大发展的前夜。哥伦比亚大学Duncan Watts的新书《什么都是显然的–如果你知道答囘案的话》(Everything Is Obvious* Once You Know the Answer)提出,社囘会科学的发展方向应该是像硬科学一样,依靠实验和数据。传统专囘家的预囘测之所以不行,是因为他们依赖的很多直观“常识”,其实是一厢情愿的想当然。事实上,哪怕一个最简陋的统计模型,也能比专囘家预囘测得更好。Watts 这个说法当然并不新,已经有越来越多的人呼囘吁把数理方法作为社囘会科学研究的主要方法,而且这个方法也的确正在成为主流,现在大概已经很少有人在论文里拿一百年前的所谓经典说事了。此书的最大新意在于,因为Watts同时在Yahoo!研究院研究社交网络,他在书中描述了几个其本人参与的有趣研究。
  谈起社交网络,中国读者会立即想到格拉德维尔(Malcolm Gladwell)的《引爆流行》(The Tipping Point)。这本书提出,一件东西要想在人群中流行开来,需要某些特别有影响力的关键人物在其中推波助澜。这些关键人物是社交网络中的节点,是普罗大众中的意见领囘袖,正是因为他们的存在我们才可能实现把地球上囘任意两个人用不多于六个人相互联囘系起来,也就是所谓“六度分隔”。根据这个理论,扩大知名度的最好办法是找名人做广告。名人在微博上说一句话,应该比普通人的“口碑”重要得多。有传闻说现在中国有百万粉丝的名人发一条营销微博可以获得一千元,其实这个数字还算是少的。美国女星Kim Kardashian一条t囘weet的价囘格是一万美元。
  “关键人物”理论完美符合人们的思维常识。我们总是强调伟人对历囘史的推动,强调“一小撮”坏分囘子对社囘会秩序的破囘坏,强调明星对时尚潮流的引领。问题是,这个理论没有获得大规模统计实验的支持。



1楼2011-11-03 20:26回复

      在现实生活中统计影响力非常困难,因为我们很难测量一个人是被谁影响的。现在微博客t囘w1tter的出现给这种测量提供了可能。t囘w1tter的一个特别有利于研究的特点是,如果用户分享一个网址,这个网址的URL会被缩短,自动形成一个唯一的代码。通过跟踪这些短代码,Watts与合作者就可以分析信息如何囘在t囘w1tter上扩散传播。具体说来,就是如果有人发布了这么一条代码,而他的一个“粉丝”如果转发这条代码的话,那么这次转发就可以被视为一次可观测的影响。广告商的愿望,是希望信息能够这样被一层接一层的转发传播开来,形成所谓“t囘w1tter瀑布”。然而通过分析2009年两个月之内160万用户的七千四百万条信息链,研究人员发现98%的信息根本就没有被推广传播。在这千万条信息中只有几十条被转发超过千次,而转发次数达到万次以上的只有一两条!我们平时看到的那些被反复转发的消息其实是特例中的特例。由此可见想要通过微博成名,就好像买彩囘票中头奖一样困难。
      那么名人的影响力到底怎么样呢?Watts等人使用了一个巧妙办法。他们使用统计模型根据第一个月的数据把那些粉丝众多,并且成功引发了t囘w1tter瀑布的“关键人物”挑出来,然后看他们在第二个月中的表现。结果相当出人意料:这些人在第二个月再次引发瀑布的可能性相当的随机。平均而言,“名人”的确比一般人更容易导致一条消息被广泛传播,但这个能力的实际效果起伏极大,一点都不可靠。也许最好的营销方式不是拿大价钱请少数名人,而是批量雇囘佣有一般影响力的人。
      如果一个东西突然流行开来,我们的常识思维总是以为这个东西一定有特别出类拔萃之处,或者就是其幕后一定有推手。但t囘w1tter上的研究表明所谓幕后推手其实并没有那么厉害。那么为什么某些书能够畅销,某些电影能够卖座,某些音乐能够上榜呢?完全是因为它们出类拔萃么?Watts参与的另一项研究表明,成功很可能主要是因为……运气。
      这是一个相当有名的实验。实验者创办了一个叫做Music Lab的网站,在几周之内招募到一万四千名受试者来给48首歌曲评分,如果他们愿意,也可以下载其中的歌曲。有些受试者的评分是完全独囘立的,他们只能看到歌曲的名字。而其余受试者则被分为八个组,他们可以看到每首歌被自己所在组的其他受试者下载的次数 – 他们可能会设想被下载次数越多的歌曲越好听,这样一来他们打分就会受到社囘会影响的左右。
      实验表明那些好歌,也就是在独囘立组获得高分的歌曲,在社囘会影响组也是好歌,而且其流行程度比在独囘立组更高;而坏歌在社囘会影响组的表现也更差。所以当听众能够被彼此的选择影响的时候,流行的东西就会变得更加流行,出现胜者通吃的局面。然而这个实验最重要的结果是,具体哪首歌能够登上排行榜的最前列,则是非常偶然的事件。有些歌曲可能会因为实验初期纯粹偶然地获得更多下载次数,后来的受试者受这个影响就会以为这首歌好听,以至于给予它更多的关注,形成正反馈。最初的运气很大程度上决定了最后谁能脱颖而出。独囘立组仅获第26名的一首歌,在一个社囘会影响组居然排第一,而在另一个社囘会影响组则排第14名。尽管特别不好的歌肯定不能流行,但好歌想要流行还是需要很大的运气成分。总体来说,独囘立组排名前五的歌曲只有50%的可能性在社囘会影响组也进前五。
      对能够互相影响的一群人,不能以常理度之。撒切尔夫人曾经说,“根本就没有社囘会这种东西。只有作为个人的男人和女人,以及他们的家庭。”可是你不能用研究一个人的办法来研究一群人。就算你能理解这群人中的每个人,你也未必能理解把这群人放在一起会发生什么。他们之间的社交网络结构,会导致一些非常偶然的事情发生,这些事情无法用任何常识去预囘测。一般人的历囘史观总是有意无意的把一个集囘团,比如说清廷,想象成一个有思想有行动的个人,好像辛囘亥革囘命就是清廷,孙中山和袁世凯三个人之间的事一样。这样的理论无法解释为什么孙黄数次起囘义数次失败,最后居然在一个完全想不到的时机成功了。
    


    2楼2011-11-03 20:26
    回复