Meta推出了一个新的人工智能工具CodeCompose,旨在反映GitHub的Copilot的功能。
该工具是在一个强调Meta正在进行的人工智能战略的活动上透露的,该活动还讨论了用于训练人工智能模型的定制芯片。
CodeCompose目前还不能公开访问,但Meta透露,其内部开发团队已经使用了该工具。
Meta还 发表了一篇论文 CodeCompose描述:“CodeCompose基于InCoder LLM,它将生成能力与双向结合。我们已经扩展了CodeCompose,为Meta的数万名开发人员提供服务,涵盖10多种编程语言和多个编码表面。”
值得注意的是,CodeCompose是在Meta自己的代码数据库上进行训练、测试和验证的。
这包括用Meta的编程语言Hack开发的框架和库,确保AI工具将这些组件集成到其编码建议中。
正如Meta软件工程师Michael Bolin所描述的,”模型的基础依赖于Meta的公共研究。我们专门对它进行了改进,以满足我们独特的内部需求和编码数据库。
CodeCompose拥有67亿个参数,其中一半由Copilot提供,Copilot是GitHub与OpenAI合作提供的类似工具。然而,更多的参数并不总是保证提高性能。根据Meta的说法,它的基础训练数据被精心清理,大大降低了模型提示错误代码的可能性。
既然CodeCompose接受的是内部代码方面的培训,它会避开目前针对OpenAI潜在的非法使用用户代码的诉讼吗?
到目前为止,Meta在CodeCompose是摄取了许可代码还是版权代码的问题上的立场仍然含糊其辞。
然而,他们承认,“InCoder的培训涉及从GitHub和GitLab等平台以及StackOverflow收集具有特定许可证的公共代码。
Meta继续通过提供开源模型来对抗其他人工智能公司,使个人和企业能够免费构建他们的模型。事实证明,人工智能货币化已经足够棘手了——每一个开源模型的发布都会削减潜在的利润。