Meta 推出其最大的开源 AI 模型：Llama 3.1 405B

AI技术2年前 (2024)更新回忆回不去

62 0 0

Meta在周二进一步巩固了其开放源代码的立场，发布了Meta Llama 3.1系列大型语言模型。

Llama 3.1包含了Meta迄今为止最大的生成型AI模型405B，并更新了70B和8B版本。

Llama 3.1扩展了模型的上下文窗口至128K，这增加了可以通过AI系统传递的信息量。它还支持八种语言。

Meta还更改了其许可证，允许开发者使用Llama模型的输出以改进其他模型。

逆流而上

大型模型的引入与AI市场上近期趋向小型语言模型的趋势相悖。

“有趣的是，它确实与我们看到的语言模型趋势背道而驰，”TechTarget的企业战略组分析师Mark Beccue表示。Beccue说，Meta选择这样做的一个可能原因是，Llama 3.1 405B是首个可定制的开放源代码LLM。

“现在，对于许多倾向于开放源代码的公司来说——而且有很多这样公司——有了一个可以选择的非常大的模型，他们可以按照自己的需求进行操作，”他说。

然而，创建像405B这样的大型模型成本非常高。

Meta表示，为了训练Llama 3.1 405B，它使用了超过16,000个Nvidia的H100 GPU。这些AI芯片的价格在$25,000到$40,000之间，具体取决于配置，这意味着Meta花费了高达6.4亿美元来训练这个新模型。

因此，Llama 3.1 405B可能对一些企业来说过于昂贵，Futurum Group的分析师Paul Nashawaty表示。

“4050亿参数的模型需要巨大的计算资源，包括高性能的GPU和大量的存储，”他在给媒体的声明中说。“这意味着在硬件上的前期成本以及电力和冷却的持续开支都非常高。”

因此，对于小型企业来说，主要云平台上已经存在的生成型AI工具可能会更便宜，他继续说道。

对企业的价值

然而，William McKeon-White，Forrester Research的分析师表示，大型开放源代码模型为企业解锁了价值。

“组织们发现生成型AI仍然有点困难，”他说。“拥有一个开放源代码模型或者一种不按交易付费的模型，对那些希望以非常量身定制的方式使用这些模型的组织来说，可以发挥很大的作用。”

此外，这些模型提供了更复杂的推理。组织们设想使用这些模型的许多应用，如欺诈检测和医疗诊断，将需要复杂的推理，他补充道。

“拥有一个开放源代码模型或者一种不按交易付费的模型，对那些希望以非常量身定制的方式使用这些模型的组织来说，可以发挥很大的作用。”——William McKeon-White，Forrester Research分析师

然而，尽管Meta首席执行官马克·扎克伯格（Mark Zuckerberg）在周二发布的博客中详细说明了公司对开放源代码的承诺，但围绕Meta所谓的开放源代码的争议依然存在。有些人认为，Llama模型并不是完全开放源代码，因为Meta没有发布其训练数据。

“它在一定程度上是开放源代码的，你可以进行定制训练，你可以定制模型。但你仍然不知道数据来源是什么，”Beccue说。“对我来说，这导致了我们在这些模型中固有的问题，即你无法追溯准确性。”

此外，Beccue补充说，目前尚不清楚Llama 3.1是否比Llama 3更准确。

不管怎样，Meta与Google和OpenAI的不同之处在于，它愿意让其最大的模型可定制，以便其他人可以在其基础上进行构建，Gartner的分析师Arun Chandrasekaran表示。

“这些模型对企业仍然非常宝贵。而且你仍然可以访问模型权重，我认为这对企业客户来说非常重要，”Chandrasekaran说。

扩展安全性

除了Llama 3.1 405B的大参数规模外，Meta还透露它正在扩展其AI安全能力。社交媒体巨头推出了两个新的安全工具。

Llama Guard 3是一个输入和输出审查模型，帮助开发者检测违规内容。

Prompt Guard是另一个工具，帮助开发者应对提示注入和越狱输入。

提示注入使用来自不可信来源的数据使模型以意外的方式运行。越狱指令则覆盖模型的安全和保密功能。

Meta还透露，它进行了人工和AI辅助的红队测试，以了解其模型在不同对手和不同情况下的表现。

“他们开始对安全性稍微重视一些，并开始在这方面投入一些精力，”Chandrasekaran说。

货币化及其他新闻

Chandrasekaran表示，对于Meta和其他继续创新的供应商来说，一个重要的挑战是如何从其产品中赚钱。

“我们继续看到这个领域的创新。但与此同时，我相信越来越多的公司正处于一个时刻，他们开始认识到，他们在构建所有这些非常强大的产品，但都在为货币化而苦苦挣扎，”他说。

Llama 3.1现在在AWS上可用。

Scale AI还透露，它已与Meta合作，帮助企业定制、评估和发布Llama 3.1。

AI硬件和软件供应商Nvidia还透露，企业可以使用Nvidia AI Foundry来定制来自Nvidia和第三方的开放模型，包括Llama 3.1。

Meta还透露，其AI助手Meta AI现在支持七种新语言，并在全球更多国家提供服务。

Meta AI用户现在可以在WhatsApp和meta.ai上使用Llama 3.1 405B。

根据Meta的说法，这款助手现在更具创意，新增了“想象我”的提示，让用户创建图像。

Esther Ajao是TechTarget的编辑新闻作家和播客主持人，主要报道人工智能软件和系统。

# AI技术 # AI technologies # NLP # 人工智能技术 # 开源人工智能工具 # 机器学习 # 深度学习

文章版权归作者所有，未经允许请勿转载。如有侵犯您的版权，请及时联系我们→侵删通道。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

Meta 推出其最大的开源 AI 模型：Llama 3.1 405B

逆流而上

对企业的价值

扩展安全性

货币化及其他新闻

相关文章

什么是贝叶斯定理？它如何应用于机器学习？

如何确保机器学习模型的可解释性

暂无评论

次世代合租平台

最新文章

Meta 推出其最大的开源 AI 模型：Llama 3.1 405B

逆流而上

对企业的价值

扩展安全性

货币化及其他新闻

相关文章

什么是贝叶斯定理？它如何应用于机器学习？

如何确保机器学习模型的可解释性

暂无评论

广告位

次世代合租平台

最新文章