如ChatGPT和Gemini等人工智能模型的迅速崛起引发了人们对其真实训练成本的根本问题的思考。近期的技术进步伴随着巨大的开支和令人担忧的生态足迹。引导这一思考需要对财务问题进行细致分析,其中的估算以百万计,甚至达到数十亿美元。面对日益严峻的环境挑战,优化这些资源的必要性变得迫在眉睫,这涉及到创新技术和可持续实践。
人工智能模型的训练:指数成本
与人工智能模型训练相关的费用,如ChatGPT和Gemini,正在迅速增加。这些模型的第一代要求的投资仅为几百万美元。如今,这些金额已经爆炸性增长,达到数亿甚至数十亿美元,尤其是在即将推出的模型上。
根据Cohere的首席执行官Dario Amodei的估算,目前的训练成本达到1亿美元。一些正在开发的模型可能花费高达10亿美元。Amodei预测,未来的支出可能达到惊人的水平,介于100亿到1000亿美元之间。
一项由Epoch AI进行的研究指出,人工智能模型的训练成本以惊人的速度上升。从2016年以来,这些成本每年增加2.4倍。这种价格通胀可能会将资源有限的公司挤出市场。
人工智能模型的特定训练成本
GPT-4模型的训练成本,由OpenAI于2023年推出,评估为超过1亿美元。同时,Gemini 1模型的训练需要谷歌近1.91亿美元的投资。这些数字包括GPU的采购,单价在3万美元到4万美元之间,以及云基础设施的费用。
财务影响和人工智能泡沫
Sequoia Capital的分析师David Cahn警告说存在金融泡沫的风险。为了平衡该行业的投资,大公司必须每年产生大约6000亿美元的收入。假设它们通过人工智能各自实现100亿美元的收入,那么仍然存在5000亿美元的缺口需要填补。
巨额的成本给企业带来了更大的压力,它们必须探索优化技术以减少模型的训练时间。谷歌Deepmind开发的JEST方法可以将所需计算减少多达十倍。
环境影响和能源消耗
关于人工智能模型训练的环境影响的担忧日益加剧。能源消耗依赖于巨大的需求,需要创新的冷却解决方案以防止服务器过热。位于法国的超级计算机Jean Zay采用了一种水冷却系统,将加热的水回收用于周围的住房。
此外,水足迹的影响是一个常常被低估的挑战。一项美国研究显示,向GPT-3提出20到50个问题所消耗的水量相当于一瓶500毫升的水用于冷却服务器。这种消耗到2027年可能达到40到65亿立方米的淡水,构成了与丹麦相当的庞大抽取。
促进可持续性的倡议
面对这一问题,一些公司,如微软,正在采取新的能源战略。到2024年,这家科技巨头签署了一项协议,计划在2028年前重新激活Three Mile Island核电站为其数据中心提供电力。这一决定引发了争议,因为这正值微软努力减少其二氧化碳排放之际。
规范人工智能以实现可持续未来
行业参与者努力建立可持续的人工智能模型训练实践。像Atos创新的水冷却方法有助于在保持能源效率的同时减少水的消耗。这项技术可能显著减少能源费用,达到20%到30%的幅度。
美国总统乔·拜登最近签署的一项法令旨在便利研究人员获得资源,以避免人工智能发展的集中在少数企业手中。对人工智能模型的碳足迹和水足迹进行更大的透明揭示,可能有助于促进更负责任的做法。
能源消耗、生态足迹以及超出成本的问题仍然在技术创新与可持续发展之间的平衡追求中占据重要地位,使行业成为必要辩论的中心。
常见问题解答
训练一个像ChatGPT一样的人工智能模型的成本是多少?
训练像ChatGPT这样的模型的成本估计超过1亿美元,原因是对硬件和云基础设施的需求。
为什么近几年人工智能模型的训练成本大幅上涨?
成本上涨是由于计算能力的要求增加,特别是昂贵的GPU的使用以及基础设施成本的通货膨胀。
与训练Gemini等模型相关的环境影响是什么?
训练Gemini等模型对环境造成显著影响,能耗高,水足迹令人担忧,未来几年可能达到数十亿立方米的淡水消耗。
企业如何尝试降低人工智能的训练成本?
企业探索优化技术,例如谷歌的JEST方法,可能将所需计算减少到十倍,以及更高效的冷却方法。
训练人工智能模型包含哪些成本?
训练成本包括购买如GPU等硬件、云基础设施费用及其他运营支出,例如能源和服务器冷却。
人工智能投资是否存在金融泡沫?
一些分析师,如David Cahn,警告可能存在金融空洞,指出大公司必须创造可观的收入以平衡其投资。
人工智能模型的训练成本是否透明?
通常,企业并不公开其训练成本,这使得很难获得真实支出的全面图像。
目前训练成本最高的人工智能模型有哪些?
近年来的模型,如GPT-4和Gemini 1是训练成本最高的,前者的估计超过1亿美元,后者接近1.91亿美元。
可以衡量人工智能训练的碳影响吗?
可以,研究表明,训练像GPT-3这样的模型释放出了相当于502吨的二氧化碳,凸显了考虑人工智能模型碳足迹的重要性。
正在采取哪些倡议来使人工智能训练更具可持续性?
一些倡议包括对更高效冷却方法的研究以及努力多样化在训练模型过程中使用的能源来源。