You dont have javascript enabled! Please enable it!

Meta 推出其最大的开源 AI 模型:Llama 3.1 405B

Meta在周二进一步巩固了其开放源代码的立场,发布了Meta Llama 3.1系列大型语言模型。

Llama 3.1包含了Meta迄今为止最大的生成型AI模型405B,并更新了70B和8B版本。

Llama 3.1扩展了模型的上下文窗口至128K,这增加了可以通过AI系统传递的信息量。它还支持八种语言。

Meta还更改了其许可证,允许开发者使用Llama模型的输出以改进其他模型。

逆流而上

大型模型的引入与AI市场上近期趋向小型语言模型的趋势相悖。

“有趣的是,它确实与我们看到的语言模型趋势背道而驰,”TechTarget的企业战略组分析师Mark Beccue表示。Beccue说,Meta选择这样做的一个可能原因是,Llama 3.1 405B是首个可定制的开放源代码LLM。

“现在,对于许多倾向于开放源代码的公司来说——而且有很多这样公司——有了一个可以选择的非常大的模型,他们可以按照自己的需求进行操作,”他说。

然而,创建像405B这样的大型模型成本非常高。

Meta表示,为了训练Llama 3.1 405B,它使用了超过16,000个的H100 GPU。这些AI芯片的价格在$25,000到$40,000之间,具体取决于配置,这意味着Meta花费了高达6.4亿美元来训练这个新模型。

因此,Llama 3.1 405B可能对一些企业来说过于昂贵,Futurum Group的分析师Paul Nashawaty表示。

“4050亿参数的模型需要巨大的计算资源,包括高性能的GPU和大量的存储,”他在给媒体的声明中说。“这意味着在硬件上的前期成本以及电力和冷却的持续开支都非常高。”

因此,对于小型企业来说,主要云平台上已经存在的生成型AI工具可能会更便宜,他继续说道。

对企业的价值

然而,William McKeon-White,Forrester Research的分析师表示,大型开放源代码模型为企业解锁了价值。

“组织们发现生成型AI仍然有点困难,”他说。“拥有一个开放源代码模型或者一种不按交易付费的模型,对那些希望以非常量身定制的方式使用这些模型的组织来说,可以发挥很大的作用。”

此外,这些模型提供了更复杂的推理。组织们设想使用这些模型的许多应用,如欺诈检测和医疗诊断,将需要复杂的推理,他补充道。

“拥有一个开放源代码模型或者一种不按交易付费的模型,对那些希望以非常量身定制的方式使用这些模型的组织来说,可以发挥很大的作用。”——William McKeon-White,Forrester Research分析师

然而,尽管Meta首席执行官马克·扎克伯格(Mark Zuckerberg)在周二发布的博客中详细说明了公司对开放源代码的承诺,但围绕Meta所谓的开放源代码的争议依然存在。有些人认为,Llama模型并不是完全开放源代码,因为Meta没有发布其训练数据。

“它在一定程度上是开放源代码的,你可以进行定制训练,你可以定制模型。但你仍然不知道数据来源是什么,”Beccue说。“对我来说,这导致了我们在这些模型中固有的问题,即你无法追溯准确性。”

此外,Beccue补充说,目前尚不清楚Llama 3.1是否比Llama 3更准确。

不管怎样,Meta与Google和OpenAI的不同之处在于,它愿意让其最大的模型可定制,以便其他人可以在其基础上进行构建,Gartner的分析师Arun Chandrasekaran表示。

“这些模型对企业仍然非常宝贵。而且你仍然可以访问模型权重,我认为这对企业客户来说非常重要,”Chandrasekaran说。

扩展安全性

除了Llama 3.1 405B的大参数规模外,Meta还透露它正在扩展其AI安全能力。社交媒体巨头推出了两个新的安全工具。

Llama Guard 3是一个输入和输出审查模型,帮助开发者检测违规内容。

Prompt Guard是另一个工具,帮助开发者应对提示注入和越狱输入。

提示注入使用来自不可信来源的数据使模型以意外的方式运行。越狱指令则覆盖模型的安全和保密功能。

Meta还透露,它进行了人工和AI辅助的红队测试,以了解其模型在不同对手和不同情况下的表现。

“他们开始对安全性稍微重视一些,并开始在这方面投入一些精力,”Chandrasekaran说。

货币化及其他新闻

Chandrasekaran表示,对于Meta和其他继续创新的供应商来说,一个重要的挑战是如何从其产品中赚钱。

“我们继续看到这个领域的创新。但与此同时,我相信越来越多的公司正处于一个时刻,他们开始认识到,他们在构建所有这些非常强大的产品,但都在为货币化而苦苦挣扎,”他说。

Llama 3.1现在在AWS上可用。

Scale AI还透露,它已与Meta合作,帮助企业定制、评估和发布Llama 3.1。

AI硬件和软件供应商Nvidia还透露,企业可以使用Nvidia AI Foundry来定制来自Nvidia和第三方的开放模型,包括Llama 3.1。

Meta还透露,其AI助手Meta AI现在支持七种新语言,并在全球更多国家提供服务。

Meta AI用户现在可以在WhatsApp和meta.ai上使用Llama 3.1 405B。

根据Meta的说法,这款助手现在更具创意,新增了“想象我”的提示,让用户创建图像。

Esther Ajao是TechTarget的编辑新闻作家和播客主持人,主要报道人工智能软件和系统。

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...