甲骨文重磅出击!16 ZettaFLOPS超算开启AI新纪元

内容分享3周前发布
0 0 0

一场算力革命正在拉斯维加斯上演,甲骨文以震撼全球的16 ZettaFLOPS超算集群,为AI发展按下快进键。

文|老杨侦查记

甲骨文重磅出击!16 ZettaFLOPS超算开启AI新纪元

美国拉斯维加斯,2025年10月14日——在Oracle AI World大会上,甲骨文公司正式发布了OCI Zettascale10云端AI超级计算机,峰值性能高达16 ZettaFLOPS,相当于每秒进行1.6万亿亿次计算操作。

这一突破性性能通过连接数十万颗NVIDIA GPU实现,标志着甲骨文从传统软件制造商向AI基础设施提供商的华丽转身。

该架构正是甲骨文与OpenAI在德州阿比林市合作建设的 “星际之门” 旗舰超算集群的核心基础,为大规模AI训练提供前所未有的算力支持。

甲骨文重磅出击!16 ZettaFLOPS超算开启AI新纪元

算力飞跃:从吉瓦到泽塔

OCI Zettascale10并非横空出世,而是甲骨文在超算领域持续投入的成果。

这是对2024年9月发布的首代Zettascale云计算集群的重大升级。

这些集群部署在吉瓦级大型数据中心园区内,通过在半径两公里范围内实现超高密度优化,为大规模AI训练工作负载提供最佳的GPU间延迟。

甲骨文云基础设施执行副总裁Mahesh Thiagarajan自豪地表明:“通过OCI Zettascale10,我们将突破性的Oracle Acceleron RoCE网络架构与新一代NVIDIA AI基础设施深度融合,以提供规模空前的多吉瓦级AI算力。”

这种架构使客户能够以更低的单位性能功耗构建、训练并部署其最大规模的AI模型,同时获得高可靠性。

甲骨文重磅出击!16 ZettaFLOPS超算开启AI新纪元

网络革命:Acceleron的创新之道

Oracle Acceleron RoCE网络架构是此次发布的点睛之笔。

这项关键创新利用现代GPU网卡内置的交换能力,使每张网卡可同时连接多个处于独立隔离网络平面的交换机。

当某一平面出现故障时,流量会自动切换至其他平面,显著提升网络整体规模与可靠性,避免因中断导致重大损失。

这种设计高瞻远瞩,直指大规模AI训练的核心痛点。

通过将GPU网卡作为微型交换机连接多个物理与逻辑隔离平面,客户能够以更低总成本快速部署大型AI集群。

同时在扩大规模的同时减少网络层级、降低功耗与成本。

甲骨文重磅出击!16 ZettaFLOPS超算开启AI新纪元

开放AI的野望:“星际之门”落地

OpenAI基础设施与工业计算副总裁Peter Hoeschele明确表明:“OCI Zettascale10网络与集群架构将率先部署于我们与甲骨文合作的旗舰项目——德州阿比林’星际之门’基地。”

这一高度可扩展的定制化RoCE设计在吉瓦级别实现了全局网络性能最大化,同时将大部分电力聚焦于计算任务。

Hoeschele补充道:“我们期待继续携手扩展阿比林基地及更广泛的’星际之门’项目。”

强强联手的格局已经清晰可见。

甲骨文计划向客户提供多吉瓦规模的OCI Zettascale10部署方案。

初期集群将最高支持80万颗NVIDIA GPU,凭借Oracle Acceleron超低延迟RoCEv2网络实现高GPU间带宽,从而提供可预测的性能与卓越的成本效益。

数据库革新:AI时代的数据基石

在AI基础设施之外,甲骨文同时发布了全新的AI数据库。

这款产品是甲骨文从传统软件制造商向AI基础设施提供商转型的关键一步。

Oracle Database@AWS服务已于7月正式推出,让客户可在AWS中基于OCI的专用基础设施运行Oracle Exadata Database Service和Oracle Autonomous Database。

客户可以轻松将Oracle Database工作负载迁移到在AWS中基于OCI运行的Oracle Database@AWS,同时利用Oracle Real Application Clusters (RAC)和具有嵌入式AI Vector功能的新版Oracle Database 23ai。

甲骨文公司Oracle Cloud Infrastructure高级副总裁Karan Batta强调:“Oracle Database@AWS让客户能够在AWS中基于OCI运行Oracle Database工作负载,充分利用Oracle Database 23ai的优势,通过AI和原生向量嵌入简化应用开发并运行关键任务工作负载。”

生态布局:分布式云的广阔天地

甲骨文的野心不止于单一集群,而是构建覆盖全球的云生态系统。

甲骨文云基础设施执行副总裁Mahesh Thiagarajan指出:“客户还可在甲骨文分布式云中自由运作,并享受严格的数据与AI主权管控。”

这种分布式云战略使客户能够根据本地法规和要求,在合适的地点处理数据。

同时保持一致的运营模式和安全控制。

Oracle Database@AWS目前已在AWS美国东部(北弗吉尼亚州)区域和美国西部(俄勒冈州)区域可用,并计划将服务扩展至全球另外20个AWS区域。

包括加拿大(中部)、法兰克福、海得拉巴、爱尔兰、伦敦、墨尔本、米兰、孟买、大阪、巴黎、圣保罗、首尔、新加坡等地。

甲骨文重磅出击!16 ZettaFLOPS超算开启AI新纪元

客户见证:企业级的高度认可

众多企业客户对甲骨文的AI基础设施给予了高度评价。

Fidelity Investments的Fidelity架构和工程主管Joe Frazier表明:“当您满足了云技术灵敏性和性能的需求时,您就能够更快地创新、更高效地进行扩展并提供安全、响应迅速的体验,从而改善数百万客户的财务状况。”

Nationwide首席技术官Jim Fowler认为:“Oracle Database@AWS符合我们的云技术战略,让我们能够简化运营并加速创新,同时保持客户期望的可靠性和性能。这是我们长期技术路线图的重大组成部分。”

SAS首席信息官Jay Upchurch则指出:“在SAS,我们优先思考为客户赋能,让客户能够选择符合其业务目标的云技术,并收获体验和结果,以此实现AI愿景。”

技术细节:性能与可靠的平衡艺术

OCI Zettascale10在技术设计上精益求精。

Oracle Acceleron RoCE网络架构的核心价值包括:

扩展性强、层级精简的弹性架构。

更高可靠性——通过禁止跨平面数据共享,将流量从不稳定或拥堵平面移出,保障AI任务稳定性,避免因检查点重启造成损失。

稳定性能——相比传统三层网络设计减少一个层级,为客户提供更均匀的GPU间延迟,提升大规模AI训练与推理的可预测性。

高效光模块——支持线性可插拔光模块与线性接收光模块,在保持400G/800G吞吐量的同时降低网络与冷却成本。

运维灵活性——通过平面级维护与独立网络操作系统更新,协助客户减少停机时间并加速功能部署。

产业影响:AI算力的民主化进程

NVIDIA超大规模业务副总裁Ian Buck强调:“甲骨文与NVIDIA正通过OCI分布式云和我们的全栈AI基础设施,共同提供空前规模的AI算力。搭载NVIDIA全栈AI基础设施的OCI Zettascale10,为推进尖端AI研究提供了必需的计算架构,助力全球各组织从实验阶段迈向工业化AI时代。”

这一合作将使更多企业能够接触和使用到世界顶级的AI算力。

打破以往只有科技巨头才能负担得起的超算门槛。

甲骨文通过此次发布,正在推动AI算力的 “民主化” 进程。

让更多规模的机构都能开展大规模AI模型训练和研究。

战略转型:从软件巨头到AI基础设施领导者

甲骨文正在经历从传统软件制造商向AI基础设施提供商的深刻转型。

这一转型战略在Oracle AI World大会上得到了充分展示。

大会于10月13日至16日在拉斯维加斯举行,吸引了全球开发者、企业客户及技术专家参与。

旨在推动其云与AI生态系统的进一步发展。

甲骨文董事长兼首席技术官Larry Ellison于10月14日下午发表题为“Oracle愿景与战略”的演讲,介绍Oracle在数据库、基础设施和应用方面的最新AI创新。

未来展望:AI算力的无限可能

OCI Zettascale10现已接受预订,预计明年下半年正式投入使用。

这一超算集群的到来将彻底改变AI训练的速度和规模界限。

OpenAI与甲骨文的合作模式也为其他AI公司提供了范例。

如何通过与云服务提供商深度合作,获得定制化的超算支持。

甲骨文还计划于10月16日举行财务分析师会议,进一步阐述其AI战略和业务前景。

这将为投资者和市场提供更多关于甲骨文AI业务模式和发展轨迹的信息。

甲骨文重磅出击!16 ZettaFLOPS超算开启AI新纪元

结语

甲骨文此次发布的超算集群,不仅是一次技术能力的展示,更是对AI基础设施产业的重新定义。

在算力需求日新月异的今天,甲骨文以16 ZettaFLOPS的性能,为AI发展提供了新的加速度。

正如Oracle云基础设施执行副总裁Mahesh Thiagarajan所言:“客户能够以更低的单位性能功耗构建、训练并部署其最大规模的AI模型,同时获得高可靠性。”

这场始于拉斯维加斯的算力革命,即将席卷全球AI产业每一个角落。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...