阿里巴巴发布开源LLM以对抗Meta的Lama 2

AI行业新闻9个月前发布 yundic
269 0 0

阿里巴巴在其云计算平台上发布了两个开源大型语言模型,预计将与Meta的Llama 2模型的最小版本竞争。

这家中国科技公司今年早些时候发布了通益乔文机型,并表示新发布的Qwen-7B和Qwen-7B-Chat是LLM的精简版本。模型名称中的“7B”指的是他们正在接受70亿个参数的培训,这与Meta的骆驼2的最小版本的培训数量相同。

对于希望在应用程序中使用人工智能模型的公司来说,拥有预先训练的模型是一大笔时间和计算费用的节省。

阿里巴巴对Meta发布的Llama 2采取了类似的做法,将其较小的模型开源,并由第三方开发者免费实现。该公司希望这将导致更多的人采用它的模型,并在现实世界中进行测试。

和Meta一样,阿里巴巴也称这些模型为”开源”,尽管这并不完全正确。它有类似于Llama 2的使用要求,每月拥有1亿用户的公司需要阿里巴巴的许可证。

虽然大多数用户可以免费使用这些模型,但阿里巴巴将通过向其云计算平台的用户收取运行这些模型的费用而获得经济收益。它还没有任何计划发布其更大的免费或开源模型。阿里巴巴还在其服务器上提供了Llama 2,所以看看这些竞争模型的采用情况会很有趣。

发布消息的两周前,阿里巴巴宣布升级其云计算平台。

它升级了, AnalyticDB数据仓库服务的向量引擎 该公司表示,这将使生成人工智能应用程序的创建速度更快。它声称,预配置的AI应用程序可以在短短30分钟内构建。

阿里巴巴的举动表明了中美人工智能竞赛的加剧。其他中国科技巨头华为和腾讯也一直在开发自己的模式,预计很快就会在这些领域发布公告。

尽管对人工智能应用的需求是无穷无尽的,但美国芯片出口限制和全球高端GPU短缺正在某种程度上减缓中国人工智能发展的步伐。

下周生效的中国人工智能法规也将放慢富有创造力的人工智能开发人员的步伐,因为他们正在艰难地通过从当局获得人工智能许可证的官僚程序。

像阿里巴巴这样的中国科技公司将希望他们能够克服其中一些挑战,并在本土市场之外实现更大的应用。这可能比OpenAI和Google等付费模式的开发者在中国找到吸引力要容易得多。

© 版权声明

相关文章

暂无评论

暂无评论...