谷歌发布Gemini大语言模型新功能，引领生成式AI技术新前沿

AI技术1年前 (2024)更新庆龙江

谷歌在生成式AI技术战中开辟新战场，发布多模态Gemini大语言模型的新功能

谷歌于周四在生成式AI技术战中开辟了新战场，为其多模态Gemini大语言模型发布了基础支撑和上下文缓存功能，以更好地确保结果的准确性并减少计算资源的使用。

这家科技巨头还发布了其扩散成像模型Imagen 3的最新版本，供Vertex AI平台的用户进行早期预览，该版本具有更快的处理速度、更好的提示理解能力和数字水印功能，并发布了具有100万标记上下文窗口的Gemini 1.5 Flash模型，供广大用户使用。

这些举措发生在技术飞速发展的背景下，谷歌及其竞争对手微软及其合作伙伴OpenAI、Meta、AWS以及较小的独立AI供应商正竞相在蓬勃发展的生成式AI市场中占据主导地位。

LLM输出证据

基础支撑，即为LLM（大型语言模型）输出提供引用或链接到基础来源，已成为生成式AI领域的一个热门话题，因为供应商和用户正在寻找减少或消除LLM容易产生的幻觉（即不准确）的方法。

Constellation Research的分析师Andy Thurai表示，在基础支撑方面，谷歌已经领先于其主要的生成式AI竞争对手。

“在基础支撑、上下文缓存和规模方面，他们宣布了一些其他人没有考虑到的事情，”Thurai说，“他们在敦促其他人迎头赶上。”

谷歌的基础支撑方法始于谷歌搜索。通过基础支撑功能，谷歌提供了一个基于百分比的准确性评分。

“这假设你的谷歌搜索结果是准确的，谷歌表示它们确实是准确的，”Thurai说，“但如果搜索结果不好，那么你的模型输出也会不好。”

Thurai表示，他对第三方基础支撑寄予厚望，预计今年晚些时候将在Vertex AI上与穆迪（Moody's）的财务数据、路透社（Thomson Reuters）的新闻数据和ZoomInfo的公司数据一起推出。目前处于实验性预览阶段的高保真模式基础支撑，由Gemini 1.5 Flash的一个版本提供支持，将允许用户选择自己的数据确认来源。

一些观察人士认为，基础支撑可能会成为减少和消除LLM不准确性的行业标准方法。

“如果我们不进行基础支撑并试图解决幻觉问题，那么AI将不会成功，”数据趋势咨询公司SanjMo的创始人和负责人Sanjeev Mohan表示。

生成式AI竞争

自2022年11月OpenAI推出ChatGPT以来，生成式AI竞赛已成为一场月度飞跃的较量，供应商们竞相在LLM的功能、规模、功率和其他属性上超越对方。

AWS计划于7月10日在纽约市举行一场活动，预计将推出生成式AI发布版，以试图追赶谷歌和OpenAI。OpenAI上个月凭借GPT-4o大放异彩，上周收购了流数据库供应商Rockset，预计很快将再次有大动作。

与此同时，较小的AI供应商正在吹嘘非计算密集型、高度可定制的小型语言模型的优点。

在6月26日的媒体和分析师简报会上，谷歌云首席执行官Thomas Kurian吹嘘Gemini 1.5 Flash模型——针对寻求速度、可负担性和大上下文窗口的中端市场企业——优于OpenAI的GPT-3.5。

谷歌的Gemini 1.5 Pro模型拥有业界公认的最大的上下文窗口，用于将提示信息输入LLM：200万个标记。

“普遍可用的Gemini 1.5 Flash是市场上性价比最高的最快模型，”Kurian表示。

LLM内存

谷歌推广的降低大规模LLM处理成本的一个要素是上下文缓存。

在Vertex AI的API中，无论是1.5 Pro还是Flash模型，上下文缓存都是一种LLM内存形式，它使用户能够在上下文窗口中存储冗长的上下文信息，而无需为每个提示重新输入。

谷歌表示，缓存通过减少标记使用来降低成本，并通过高效地重用先前存储的上下文（如长文档或视频片段）来提高速度。其他供应商的一些模型也提供了各种形式的缓存，以处理上下文窗口大小的限制。

但Mohan表示，谷歌在其生成式AI产品与企业客户的竞争中的优势在于其对大量数据的控制。

“他们拥有庞大的用户基础，并拥有大量数据来训练和测试他们的模型，”他说，“例如，他们有四款每天拥有10亿用户的产品：广告、Gmail、YouTube和谷歌搜索。”

除了自己的Gemini、Imagen和Gemma模型外，谷歌还明确采用了多模型策略，在Vertex AI的Model Garden中拥有150多个第三方LLM和基础模型。AWS也采取了类似的路线，推出了Amazon Bedrock生成式AI平台。

周四，谷歌将独立生成式AI供应商Anthropic于6月20日发布的新Claude 3.5 Sonnet模型添加到了Vertex AI中。此外，谷歌还表示，今年夏天晚些时候将在Model Garden中添加受欢迎的Mistral Small、Mistral Large和Codestral LLM。

“客户想要的是选择性。他们希望某些模型是专家，并经过特定事物的训练，”Mohan说。

在媒体和分析师简报会上，谷歌试图表明，其一些客户已经超越了生成式AI应用的实验阶段，开始将它们投入生产。

穆迪的首席产品官Nick Reed表示，这家金融服务巨头一直在使用谷歌的基础支撑技术来提高信用评级的准确性，并利用Gemini模型的大上下文窗口从大数据集和文档中提取知识。

# AI技术 # AI technologies # NLP # 人工智能技术 # 开源人工智能工具 # 机器学习 # 深度学习

文章版权归作者所有，未经允许请勿转载。如有侵犯您的版权，请及时联系我们→侵删通道。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

谷歌发布Gemini大语言模型新功能，引领生成式AI技术新前沿

LLM输出证据

生成式AI竞争

LLM内存

相关文章

AWS 的 Amazon Q 增加了 Connect 联络中心集成

MicroStrategy推出新生成式AI功能，助力客户在工作流程中嵌入AI洞察

暂无评论

次世代合租平台

最新文章

谷歌发布Gemini大语言模型新功能，引领生成式AI技术新前沿

LLM输出证据

生成式AI竞争

LLM内存

相关文章

AWS 的 Amazon Q 增加了 Connect 联络中心集成

MicroStrategy推出新生成式AI功能，助力客户在工作流程中嵌入AI洞察

暂无评论

广告位

次世代合租平台

最新文章