IBM推出新一代Granite语言模型

AI技术2年前 (2024)更新 💋陈先生

IBM于周一发布了其新的Granite语言模型系列，采用完全开放的Apache 2.0许可证。

Granite 3.0模型包括通用语言AI模型，如Granite-3.0-8B-Instruct、Granite-3.0-2B-Instruct、Granite-3.0B-Base和Granite-3.0-2B-Base；安全防护模型，如Granite-Guardian-3.0-8B和Granite-Guardian-3.0-2B；以及混合专家模型，包括Guardian-3.0-3B-A800M-Instruct、Granite-3.0-1B-A400M-Instruct、Granite-3.03B-A800M-Base和Granite-3.0-1B-A400M Base。

根据IBM的说法，这些语言模型在12种不同语言和116种编程语言的超过12万亿个数据标记上进行了训练。8B和2B模型将在年底之前支持扩展的128K上下文长度，并能够理解多模态文档。

开放源代码的Granite Guardian 3.0模型使开发者能够通过检查AI模型对社会偏见、仇恨、暴力和黑客等风险的响应来使用安全防护措施。根据IBM的说法，这些模型还使用Nvidia H100 GPU进行了训练。

Granite 3.0模型将支持客户服务、IT自动化和网络安全等应用。

开放源代码的方法

新的Granite系列推出之际，越来越多的供应商正朝着小型语言模型和开放源代码的方向发展。

“在过去的25年里，开放源代码的黄金标准是Apache许可证，”IBM高级副总裁兼首席商业官Rob Thomas在关于新模型的媒体简报会上表示。“我们选择这个许可证是有很好的理由的。”

Constellation Research分析师Andy Thurai表示，IBM正在押注AI的未来是开放的。

“他们提供更小、更高效、透明的模型，这些模型经过道德训练并负责任地创建，以成为差异化因素，”Thurai说。

虽然IBM并不打算通过许可模型来赚钱，但它希望组织使用其Watsonx平台来运行模型或微调或构建新的衍生模型，Thurai补充道。

与之前的版本相比，Granite 3.0模型似乎更高效、更准确，Moor Insights战略分析师Patrick Moorhead表示。

“这对我来说是合理的，因为这些模型并不是在‘世界数据'上训练的，”Moorhead说。世界数据包括互联网、娱乐和消费者视频。相反，IBM使用了企业数据，如文档和电子表格中的数据。

一些弱点

尽管有这些优势，Thurai表示，IBM在这个快速发展的生成AI市场中的弱点是没有“先发优势”。

“IBM需要付出很多努力来说服客户转向他们的平台，”他说。

此外，虽然IBM已经展示了Granite模型可以用于不同的企业用例，但客户还需要看到这些模型在自然语言处理方面的表现，Gartner分析师Arun Chandrasekaran表示。

“在将大型语言模型应用于自然语言处理相关用例时，他们的起步确实有些弱势，”Chandrasekaran说。这些用例包括摘要、内容生成和问答。

他表示，IBM目前的核心关注点是代码和与代码相关的用例。

他们提供更小、更高效、透明的模型，这些模型经过道德训练并负责任地创建，以成为差异化因素。Andy ThuraiConstellation Research分析师

供应商必须展示模型在消费者用例中的表现，例如创建食谱、制定假期计划或获取新闻，Moorhead表示。

“客户需要相信IBM能够继续投资和创新，”Moorhead说。

客户还需要知道何时使用Granite模型与第三方模型，因为两者都可以在其平台上使用，Chandrasekaran说。

“IBM需要提供更多的清晰度，甚至可以称之为选择工具，以便客户能够根据提供的评估工具选择合适的模型并很好地实施，”他说。

IBM还推出了其下一代Watsonx代码助手，该助手由Granite代码模型驱动。它在多种编程语言中提供通用的编码支持，包括Java和Python。

该供应商还介绍了其AI驱动的交付平台IBM Consulting Advantage的扩展。该平台包含AI代理、应用程序和框架，以支持IBM顾问与客户的合作。

作为扩展的一部分，Granite 3.0语言模型将成为Consulting Advantage中的默认模型。

# AI技术

文章版权归作者所有，未经允许请勿转载。如有侵犯您的版权，请及时联系我们→侵删通道。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

IBM推出新一代Granite语言模型

开放源代码的方法

一些弱点

Amplitude 在分析套件中添加了 A/B 测试工具

Reltio 更新提供新的人工智能驱动的匹配功能

暂无评论

次世代合租平台

最新文章

IBM推出新一代Granite语言模型

开放源代码的方法

一些弱点

Amplitude 在分析套件中添加了 A/B 测试工具

Reltio 更新提供新的人工智能驱动的匹配功能

暂无评论

广告位

次世代合租平台

最新文章