Meta开始推出世界上最快的超级计算机
摘要 社交媒体巨头Meta 刚刚完成了其 AI Research SuperCluster 超级计算机的第一阶段。该公司表示,当它在 2022 年年中全面部署时,它将成为世界上同类产品中最快的。RSC 专为训练机器学习系统而设计,将帮助研究人员开发更好的 AI 模型,这些模型可以从数万亿个示例中学习,跨数百种不同语言工作,无缝分析文本、图像和视频,并开发新的增强
社交媒体巨头Meta 刚刚完成了其 AI Research SuperCluster 超级计算机的第一阶段。该公司表示,当它在 2022 年年中全面部署时,它将成为世界上同类产品中最快的。
RSC 专为训练机器学习系统而设计,将帮助研究人员开发更好的 AI 模型,这些模型可以从数万亿个示例中学习,跨数百种不同语言工作,无缝分析文本、图像和视频,并开发新的增强现实工具。
RSC 目前使用760 个 NVIDIA DGX A100 系统作为其计算节点。它们在NVIDIA Quantum 200Gb/s InfiniBand 网络上连接了总共6,080 个 NVIDIA A100 GPU ,以提供 1,895 petaflops 的 TF32 性能。
第二阶段将于今年晚些时候完成,RSC 将扩展到 16,000 个 GPU,Meta 认为这将提供 5 exaflops 的混合精度 AI 性能。
Pure Storage 的 FlashArray 和 FlashBlade 为 RSC 提供了可扩展的存储解决方案,以帮助它分析结构化和非结构化数据,从而加快响??应速度。
RSC 的存储层具有 175 PB 的 Pure Storage FlashArray、46 PB 的 Penguin Computing Altus 系统中的缓存存储和 10 PB 的 Pure Storage FlashBlade。
根据 Meta 的说法,这将足够快以三倍的速度训练大规模自然语言处理模型,以便 AI 模型可以确定所说或发布的内容是否构成仇恨言论或在输入或说出时包含有害内容。
为了保护用户数据,Meta 表示 RSC 与更大的 Internet 隔离,没有直接的入站或出站连接,流量只能从 Meta 的生产数据中心流出。
在性能方面,当 RSC 第二阶段完成并实现全部 5 exaflops 性能时,将比上半年上线的能源研究科学计算中心 Perlmutter 的4 exaflops 性能更快。 2021 年。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。