You dont have javascript enabled! Please enable it!

IBM推出新一代Granite语言模型

AI技术42分钟前更新 💋陈先生
0 0 0

IBM于周一发布了其新的Granite语言模型系列,采用完全开放的Apache 2.0许可证。

Granite 3.0模型包括通用语言AI模型,如Granite-3.0-8B-Instruct、Granite-3.0-2B-Instruct、Granite-3.0B-Base和Granite-3.0-2B-Base;安全防护模型,如Granite-Guardian-3.0-8B和Granite-Guardian-3.0-2B;以及混合专家模型,包括Guardian-3.0-3B-A800M-Instruct、Granite-3.0-1B-A400M-Instruct、Granite-3.03B-A800M-Base和Granite-3.0-1B-A400M Base。

根据IBM的说法,这些语言模型在12种不同语言和116种编程语言的超过12万亿个数据标记上进行了训练。8B和2B模型将在年底之前支持扩展的128K上下文长度,并能够理解多模态文档。

开放源代码的Granite Guardian 3.0模型使开发者能够通过检查AI模型对社会偏见、仇恨、暴力和黑客等风险的响应来使用安全防护措施。根据IBM的说法,这些模型还使用 H100 GPU进行了训练。

Granite 3.0模型将支持客户服务、IT自动化和网络安全等应用。

开放源代码的方法

新的Granite系列推出之际,越来越多的供应商正朝着小型语言模型和开放源代码的方向发展。

“在过去的25年里,开放源代码的黄金标准是Apache许可证,”IBM高级副总裁兼首席商业官Rob Thomas在关于新模型的媒体简报会上表示。“我们选择这个许可证是有很好的理由的。”

Constellation Research分析师Andy Thurai表示,IBM正在押注AI的未来是开放的。

“他们提供更小、更高效、透明的模型,这些模型经过道德训练并负责任地创建,以成为差异化因素,”Thurai说。

虽然IBM并不打算通过许可模型来赚钱,但它希望组织使用其Watsonx平台来运行模型或微调或构建新的衍生模型,Thurai补充道。

与之前的版本相比,Granite 3.0模型似乎更高效、更准确,Moor Insights战略分析师Patrick Moorhead表示。

“这对我来说是合理的,因为这些模型并不是在‘世界数据'上训练的,”Moorhead说。世界数据包括互联网、娱乐和消费者视频。相反,IBM使用了企业数据,如文档和电子表格中的数据。

一些弱点

尽管有这些优势,Thurai表示,IBM在这个快速发展的生成AI市场中的弱点是没有“先发优势”。

“IBM需要付出很多努力来说服客户转向他们的平台,”他说。

此外,虽然IBM已经展示了Granite模型可以用于不同的企业用例,但客户还需要看到这些模型在自然语言处理方面的表现,Gartner分析师Arun Chandrasekaran表示。

“在将大型语言模型应用于自然语言处理相关用例时,他们的起步确实有些弱势,”Chandrasekaran说。这些用例包括摘要、内容生成和问答。

他表示,IBM目前的核心关注点是代码和与代码相关的用例。

他们提供更小、更高效、透明的模型,这些模型经过道德训练并负责任地创建,以成为差异化因素。Andy ThuraiConstellation Research分析师

供应商必须展示模型在消费者用例中的表现,例如创建食谱、制定假期计划或获取新闻,Moorhead表示。

“客户需要相信IBM能够继续投资和创新,”Moorhead说。

客户还需要知道何时使用Granite模型与第三方模型,因为两者都可以在其平台上使用,Chandrasekaran说。

“IBM需要提供更多的清晰度,甚至可以称之为选择工具,以便客户能够根据提供的评估工具选择合适的模型并很好地实施,”他说。

IBM还推出了其下一代Watsonx代码助手,该助手由Granite代码模型驱动。它在多种编程语言中提供通用的编码支持,包括Java和Python。

该供应商还介绍了其AI驱动的交付平台IBM Consulting Advantage的扩展。该平台包含AI代理、应用程序和框架,以支持IBM顾问与客户的合作。

作为扩展的一部分,Granite 3.0语言模型将成为Consulting Advantage中的默认模型。

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...