复旦大学大数据学院,大数据的研究及其应用

·当斯隆数字巡天(SDSS)在2000年开始收集天文数据时,它在头几周收集的数据比以前天文学历史上收集的数据要多 。大数据可以对科研有以下帮助:·大型强子对撞机实验代表约1.5亿个传感器每秒提供4000万次数据 。
大数据在科研上的应用有哪些?

复旦大学大数据学院,大数据的研究及其应用


大数据可以对科研有以下帮助:·大型强子对撞机实验代表约 1.5 亿个传感器每秒提供 4000 万次数据 。每秒有近 6 亿次碰撞 。经过筛选并避免记录超过 99.99995% 的这些数据流后,每秒有 100 个目标的冲突 。因此,仅使用小于 0.001% 的传感器数据流,来自所有四个 LHC 实验的数据流在复制之前的年度速率为 25 PB(截至 2012 年) 。
复制后这将变成近 200 PB 。如果所有传感器数据都记录在 LHC 中,那么数据流将非常难以处理 。在复制之前,数据流量每年将超过 1.5 亿 PB,或者将近 500 EBabytestes 。以数字来看,这相当于每天500 个字节(5×1020)字节,几乎是世界上所有其他来源的 200 倍 。·Square Kilometer Array 是由数千个天线构成的射电望远镜 。
预计到2024年将投入使用 。总的来说,这些天线预计将收集 14 EB 字节,并且每天存储 1 PB 字节,这被认为是有史以来最雄心勃勃的科学计划之一 。·当斯隆数字巡天(SDSS)在 2000 年开始收集天文数据时,它在头几周收集的数据比以前天文学历史上收集的数据要多 。SDSS 以每晚 200GB 的速度继续运行,累积了超过 140TB 的信息 。
【复旦大学大数据学院,大数据的研究及其应用】当 SDSS 的继任者,大型综合测量望远镜在 2020 年上线时,其设计人员预计它将每五天获取一次该数据量 。·解码人类基因组原本需要 10 年 的时间来处理,现在可以在不到一天的时间内完成 。在过去的十年中,DNA 测序仪已经将测序成本减少了10,000,这比按照摩尔定律预测的成本降低便宜了 100 倍。

    推荐阅读