宇宙摄像机 建在智利帕琼山上的大口径全天巡视望远镜(LSST)是一个价值4.5亿美元的庞大工程,它将真正把天文学和信息学揉合在一起。它的目标是探测暗能量和暗物质、对太阳系和银河系进行前所未有的详尽普查并且寻找天空中任何会变化或者移动的目标。
[图片说明]:建在智利帕琼山上的大口径全天巡视望远镜。版权:Michael Mullen Design/LSST Corporation。装备有一面8.4米的主镜和一架世界上最大的32亿像素的照相机,LSST只要几个晚上就能获得和SDSS在8年的时间里所得到的一样多的数据。据估计LSST总共会观测到200亿个左右的目标,这将是第一次有一个巡天能观测到比地球上的人口还要多的天体。如此庞大而惊人的数字使得LSST也成为第一个把信息学融入其设计的天文项目,其中涉及到数据挖掘、机器学习、可视化研究以及除了天文学家之外的计算机科学家和统计学家。LSST会一丝不苟地对整个可见天空进行成像,最终会生成一部10年长的宇宙电影。这将导致研究天体快速变化现象——黑洞形成、超新星爆发——的时间域天文学和对地球构成潜在威胁的小行星以及位于海王星轨道之外的柯伊伯带天体的搜寻向前迈进一大步。
这一方法的核心是被称为信息学的大批量数据处理技术。它已经改变了生物学和医学,使得科学家可以对数千种生物的脱氧核糖核酸(DNA)进行测序并寻找出与健康和疾病有关的基因线索。天文学家相信信息学也能为他们做同样的事情。基本的想法是用计算机来从过于复杂而人脑无法理解的原始数据中提取出有意义的信息。软件可以在几秒钟的时间里处理数万亿字节的数据,找出其中的规律和异常,对关键信息进行可视化,甚至在这个过程中“自我学习”。
从这个意义上讲,信息学其实就是让天文学家能更快、更准确地去完成他们一直在从事的工作。例如,对于这天文学中的两大关键技术——分类和整合信息——而言,数据挖掘是有益的。这个天体是一颗恒星还是一个星系?如果它是一个星系,那它是旋涡星系还是椭圆星系?如果是椭圆星系,它是圆的还是扁的?就在不久之前,这些问题还是处理照相底片的人必须要回答的。当你手中只有数百个太阳系外行星或者数千颗超新星的时候,分类不是什么大不了的事情。但当你面对数十亿个天体的时候,它就会变得极其复杂而繁重。