互联网档案馆的基础设施

互联网档案馆存档了逾万亿个网页,99PB 唯一数据,如果加上备份和冗余则超过 212PB。它是如何做得的?互联网档案馆的核心是被称为 PetaBox 的定制服务器,现成的服务器通常价格昂贵且耗电巨大,PetaBox 设计具有高密度、低成本和低功耗的特点,使用磁盘矩阵(Just a Bunch of Disks)而非昂贵的 RAID 控制器,用软件而非硬件处理数据冗余。第一代 PetaBox 于 2004 年 6 月投入使用,每个机架存储 100 TB 数据,功耗 6 千瓦。第四代 PetaBox 于 2010 年推出,每个机架包含 240 块 2TB 硬盘,使用英特尔至强处理器。最新一代的 PetaBox 每个机架能储存 1.4 PB 数据。它的机房利用周围环境空气进行冷却,没有使用传统的空调,服务器设计能运行在较高的温度上,磁盘产生的余热会被收集和循环利用,冬季能为大楼供暖。

上一篇:

下一篇:

已有 0 条评论