有着“OpenAI劲敌”之称的人工智能初创公司Anthropic即将成为首批使用谷歌新一代TPU芯片的公司之一,在最近达成云计算服务协议后,此举进一步加深双方的合作关系。两家公司当地时间周三表示,Anthropic将部署谷歌Cloud TPU v5e芯片,为其名为Claude的大语言模型(LLM)提供硬件支持。

  ChatGPT最强竞品Claude,以及类似ChatGPT的生成式AI应用程序通常使用大量数据来训练人工智能界面,让它们回答问题并生成基于人类逻辑的对话文本,而生成式AI成功运行的背后离不开最核心基础设施——AI芯片的支撑,目前这一领域几乎被英伟达GPU所垄断。美国银行和花旗统计数据显示,英伟达在AI芯片领域份额达到惊人的90%。

  谷歌TPU——为AI而生

  但是,谷歌正在将“谷歌TPU”这一用于谷歌内部服务器的AI专用芯片推向全球各大科技公司。目前,谷歌正在大规模使用TPU芯片来支持旗下应用产品,比如聊天机器人巴德以及谷歌云平台。当前,谷歌高达90%以上的人工智能训练工作都在使用这些芯片,TPU芯片体系支撑了包括搜索引擎在内的谷歌主要业务。

  谷歌云平台首席执行官Thomas Kurian表示,最新款的TPU芯片正在成为谷歌云的最大卖点之一。除了Anthropic,其他在人工智能领域备受瞩目的初创公司,如Hugging Face和AssemblyAI也在大规模使用谷歌TPU芯片。

  从技术层面上来看,与英伟达A100/H100等通用型GPU 相比,谷歌TPU设计初衷正是专注于深度学习领域,尤其是全面加速神经网络训练和推理效率。英伟达的A100和H100,它们属于广义上的通用型GPU,而不仅仅局限于深度学习和人工智能领域。这些GPU具有通用计算能力,适用于多种计算工作负载,包括但不限于:高性能计算(HPC)、深度学习以及大规模数据分析。

  与英伟达通用型GPU相比,谷歌TPU用低精度计算,在几乎不影响深度学习处理效果的前提下大幅降低了功耗、加快运算速度,尤其对于中型LLM设计者来说完全够用,因此他们可能不需要依赖高性能的英伟达A100/H100。同时,TPU 使用了脉动阵列等设计来优化矩阵乘法与卷积运算。谷歌TPU追求专注于AI训练和推理,因此精简化部分设计架构,这也是TPU功耗、内存带宽和FLOPS都明显低于英伟达H100的部分原因。

  谷歌新一代TPU芯片——Cloud TPU v5e专为提供大中型训练与推理所需的成本效益和性能而设计。TPU v5e Pods能够平衡性能、灵活性和效率,允许多达256个芯片互连,聚合带宽超过400 Tb/s和100 petaOps的INT8性能,使对应的平台能够灵活支持一系列推理和训练要求。

  与Cloud TPU v4相比,TPU v5e可为大语言模型和生成式AI模型提供每美元花费中高达2倍的训练性能和2.5倍的推理性能。Cloud TPU v5e的成本不到TPU v4的一半,但可以让更多企业训练和部署更大、更复杂的AI模型。总体来看,与TPU v4相比,TPU v5e每美元的性能提高了2.7倍。

  科技巨头们开启“AI代理人竞争”:微软扶持OpenAI 谷歌与亚马逊选中Anthropic

  随着构建更大规模人工智能模型的竞争趋势升温,谷歌等科技巨头正在与该领域前沿的初创公司建立密切的合作关系。据知情人士透露,Anthropic最近同意在未来四年向谷歌旗下的谷歌云服务上花费逾30亿美元。

  谷歌方面,除了提供新一代TPU,该科技巨头此前已承诺向这家初创公司投资20亿美元,据知情人士透露,在最新一轮融资中,Alphabet旗下谷歌向Anthropic投资约5亿美元,并承诺未来再投资约15亿美元,这笔投资是在今年早些时候谷歌向Anthropic投入5.5亿美元的基础上所进行。

  Anthropic自2021年成立以来一直使用谷歌云服务。两家公司表示,作为新协议的一部分,Anthropic将更多地使用基于谷歌云平台的基础设施和安全功能。

  “我们对TPU的效率感到非常兴奋。”Anthropic首席执行官Dario Amodei表示。“这些已经开始显示出我们能够获得的收益。”

  谷歌云服务领域的竞争对手——亚马逊,同样是Anthropic的支持者。亚马逊曾在一份文件中表示,它已经以可转换票据的形式向Anthropic投资了12.5亿美元,并有能力以第二笔票据的形式再投资27.5亿美元,这一选择权将于明年第一季度到期。亚马逊还与Anthropic达成协议,后者将使用AWS的云服务和自研芯片。谷歌和亚马逊与Anthropic协议的债务结构则未被媒体知悉。

  亚马逊还表示,Anthropic“在AWS上运行其大部分工作负载”。Anthropic首席执行官Amodei则强调,Anthropic正在取“多云”的方式,这意味着它不会与任何一家云服务供应商进行独家性质的合作。

  谷歌云平台首席执行官Thomas Kurian表示,他并不为Anthropic与AWS的合作感到困扰。他表示:“大公司总是希望选择多云体系——这有助于他们使用每种云服务的最佳功能。”“我们已经习惯了与其他云提供商竞争和合作。”

  提到 OpenAI 的竞争对手,Anthropic 往往被认为是最具潜力的对手。Anthropic由曾负责OpenAI风靡全球的ChatGPT研发工程的研究副总裁Dario Amodei所创立,Amodei带着OpenAI另外5名负责GPT模型研发的员工一起出走,5名员工中的Tom Brown曾领导GPT-3模型的整个开发过程。

  OpenAI和Anthropic都在用他们独家研发的前沿生成式人工智能技术构建聊天机器人。相比于ChatGPT,Anthropic所研发的聊天机器人Claude特别强调功能全面且回答更具责任性的生成式人工智能,以及大幅度减少AI技术中的偏见和歧视问题。

  在一些AI业内人士看来,这一切看似是 OpenAI 与 Anthropic 的竞争,实则 OpenAI 背后的最大股东微软与Anthropic 重要支持力量谷歌和亚马逊之间的“云计算战争“以及聚焦未来技术的”生成式AI大战”。这三大科技巨头试图借助这些在AI领域有重大影响力的初创公司来进一步扩大云服务市场规模,以及期望自身第一时间能够捕捉最前沿的AI技术。