理解人工智能经常被忽视的环境影响

AI特色新闻2年前 (2023)发布 yundic

562 0 0

随着围绕人工智能系统风险的讨论愈演愈烈，我们不能忽视技术给世界已经征税的能源和水供应带来的压力。

复杂的机器学习（ML）项目依赖于一系列技术，包括训练硬件（GPU）以及用于托管和部署AI模型的硬件。

虽然高效的人工智能培训技术和架构有望降低能耗，但人工智能热潮才刚刚开始，大型科技公司正在加大对资源密集型数据中心和云技术的投资。

随着气候危机的加深，在技术进步和能源效率之间取得平衡比以往任何时候都更加重要。

人工智能的能源挑战

人工智能的能耗随着神经网络等复杂、计算昂贵的架构的出现而上升。

例如，据传闻，GPT—4基于8个模型，每个模型有2200亿个参数，总共约有1.76万亿个参数。Inflection目前正在构建一个由22，000个高端Nvidia芯片组成的集群，成本约为550，000，000美元，每张卡的粗略零售价为25，000美元。这只是为了薯片。

每个先进的人工智能模型都需要大量的资源来训练，但直到最近，精确理解人工智能开发的真正成本一直是一个挑战。

一个2019年的研究马萨诸塞大学阿默斯特分校的研究人员调查了与深度神经网络（DNN）方法相关的资源消耗。

通常，这些DNN需要数据科学家手动设计或使用神经体系结构搜索(NAS)来为每个独特的情况从头开始寻找和训练专门的神经网络。

这种方法不仅是资源密集型的，而且还会产生巨大的碳足迹。这项研究发现，训练一个基于变压器的大型神经网络，使用NAS–机器翻译中常用的工具–会产生大约62.6万磅的二氧化碳。

这大约相当于5辆汽车的寿命排放量。

二氧化碳对人工智能模型的影响。资料来源：MIT Technology Review。

西班牙科鲁尼亚大学的计算机科学家卡洛斯·戈麦斯—罗德里格斯（Carlos Gómez—Rodríguez）评论这项研究：“虽然我们中的许多人可能在一个抽象、模糊的层面上想到了这个问题，但这些数字确实显示了问题的严重性，”他补充说，“我和其他研究人员都不认为环境影响是如此重大。

训练模型的能量成本只是基线——使模型运行所需的最小工作量。

正如马萨诸塞大学博士生艾玛·斯特鲁贝尔所说：“培训一个模特是你能做的最低限度的工作。”

麻省理工学院的“一次为所有”方法

麻省理工学院的研究人员后来提出了解决这个问题的办法： “一次过”(OFA)方法。

研究人员描述问题对于传统的神经网络培训：“无论是使用基于人的方法还是NAS，为每种场景设计专门的DNN都是工程师昂贵的，计算成本也很高。由于这种方法需要重复网络设计流程，并针对每种情况从头开始重新训练设计的网络，因此它们的总成本随着部署场景数量的增加而线性增长，这将导致过高的能源消耗和二氧化碳排放。

使用麻省理工学院的OFA范式，研究人员训练一个单一的通用神经网络，从中可以创建各种专门的子网络。 OFA流程不需要对新子网进行额外的培训，从而减少了模型培训所需的高能耗GPU小时数，并降低了二氧化碳排放量。

除了其环境效益外，OFA方法还提供了实质性的性能改进。在内部测试中，使用OFA方法创建的模型在边缘设备（紧凑型物联网设备）上的性能比使用NAS创建的模型快2.6倍。

麻省理工学院的OFA方法在2019年的第四届低功耗计算机视觉挑战赛上获得了认可，这是由IEEE主办的年度活动，旨在促进提高计算机视觉（CV）系统能效的研究。

麻省理工学院的团队获得了最高荣誉，活动组织者称赞道：“这些团队的解决方案超过了文献中的最佳解决方案。

这个2023年低功耗计算机视觉挑战赛目前正在收到提交到8月4日。