You dont have javascript enabled! Please enable it!

谷歌云推出 Spanner 数据库新功能以支持 AI 开发

AI技术3个月前更新 gy.J
18 0 0

谷歌云于周四推出了一系列针对其 Spanner 数据库的新功能,旨在支持 AI 应用的开发和部署。

在东京的用户大会上,谷歌云首次介绍了这些新功能,目前处于预览阶段,包括 Spanner 图形处理、向量搜索和全文搜索。

谷歌云于 2017 年首次推出 Cloud Spanner,作为一种多模态数据库,主要支持结构化数据。为了开发 AI 模型和应用程序,包括生成式 AI,非结构化数据同样至关重要。

向量搜索、全文搜索和图形处理都有助于应用开发者发现和操作非结构化数据。因此,这些新功能一旦正式推出,将使 Spanner 成为除了其其他多模态能力之外的 AI 数据库,这是一项重大举措,BARC U.S. 分析师 Kevin Petrie 表示。

企业不再仅仅将数据与大型语言模型结合以进行生成式 AI 探索和分析,而是开发自己的生成式 AI 应用程序,这些应用程序能够协同工作。这需要谷歌云正在向 Spanner 添加的功能。

“谷歌的公告标志着市场中的一个关键趋势,”Petrie 说。“AI 是一个多方面、多模型的工作。公司不是孤立地实施生成式 AI 语言模型或其他类型的模型。他们正在构建多个模型互相补充的应用程序。在这种情况下,你需要一个 AI 数据库。”

除了 Spanner 的新功能,谷歌云还为 Bigtable 数据库推出了新功能,以帮助开发者,并为其 Cloud SQL 的 SQL Server 数据库提供了新的定价选项。

开发 AI 数据库

生成式 AI 有潜力改变商业模式。当与组织的专有数据结合时,像谷歌的 Gemini 和 的 GPT 模型等大型语言模型使用户能够使用真正的自然语言对数据进行建模、查询和分析。

通过使自然语言能够与数据一起工作,生成式 AI 使之前没有编码技能或数据素养培训的非技术人员能够使用复杂的分析和数据管理平台。此外,真正的自然语言还使开发人员和工程师等数据专家能够更高效地工作,减少编码要求和其他占用大量时间的手动任务。

因此,许多供应商将开发生成式 AI 工具(如文本到代码转换器和 AI 驱动的助手)作为优先事项。

然而,一些企业希望更多。他们希望开发自己的生成式 AI 应用程序,这些工具能够理解他们的业务,并能够协同工作以推动决策。

为此,他们不仅需要访问自己的数据,还必须能够轻松高效地找到合适的数据来训练个体模型。这是数据库能够支持 AI 开发的地方。

图形处理、向量搜索和文本搜索等技术可以使数据发现对 AI 模型和应用程序变得可能,包括结构化数据(如财务记录)和非结构化数据(如文本、图像和音频文件)。

因此,向量搜索在过去一年成为许多数据库的核心组件。AWS、Databricks 和 Oracle 是众多添加了向量搜索能力的供应商之一,以提供训练生成式 AI 模型和应用程序所需的相关数据。

现在,谷歌云不仅在努力将向量搜索添加到 Spanner 数据库中,还与其他技术协同工作,以提高数据检索的效率。

“操作数据对于弥合基础模型与真正实现 AI 在企业中承诺的差距至关重要,”谷歌云数据库总经理兼副总裁 Andi Gutmans 在 7 月 26 日的媒体简报中表示。“我们的重点是提升我们的数据库,确保它们能够为企业应用提供最佳、最相关的数据。”

图形技术与传统的关系数据库技术不同,它能够使数据点同时连接到无限数量的相关数据点,而不是一次连接一个数据点。因此,它加快了可以一起使用的数据的发现速度,从而为应用程序提供支持。

Spanner Graph 是一种图形处理功能,旨在使开发人员能够使用图形查询语言——图形数据库的行业标准——与 SQL 一起发现和查询连接数据。

向量搜索同样使相似度搜索能够发现多个数据点或数据集,而不仅仅是一次发现一个,这些数据可以用于训练模型和应用程序。全文搜索使用户能够同时搜索大量文档以找到相关数据。

“结合全文搜索和向量相似性搜索功能是非常合理的,”Petrie 说。

一个现实世界的潜在例子是企业在同一数据库中使用图形处理、向量搜索和全文搜索(也称为语义搜索)来开发 AI 应用程序,例如客户服务。他继续说,该应用程序可以通过关键字匹配找到适合客户的产品指南,使用自然语言总结指南,然后与客户进行生成式 AI 对话。此外,通过,该应用程序可能根据对话和客户的购买历史推荐其他产品。

Petrie 还提到,Vespa 是另一种支持多种搜索类型以促进 AI 开发的数据库。

与 Petrie 一样,Constellation Research 分析师 Doug Henschen 认为,Spanner Graph、向量搜索和全文搜索的增加很重要,因为它们增加了数据库现有的多模态能力。

除了这些功能外,新推出的 Spanner 定价选项也非常重要,它增加了透明度,更好地使客户能够控制其云支出。

Spanner Editions 提供标准、企业版和企业版 Plus 级别的分层定价。新搜索功能对企业版和企业版 Plus 用户开放,但供应商没有公布每个版本的费用。

“Henschen 说:“Spanner Graph 显然是头条新闻,因为它填补了谷歌在其产品组合中的一个空白。”但 Spanner Graph 功能的名称未能完全体现 Spanner 正在成为一个多功能、高规模数据库的完整故事,通过新的 Spanner Enterprise 和 Enterprise Plus 版本提供 SQL、图形、全文搜索和向量搜索功能。”

此外,通过在 Spanner 中将不同的搜索类型结合在一个服务中,谷歌云正在与 AWS 和 Oracle 等将每项服务分开提供的数据库供应商区分开来,Henschen 继续说。

“我认为这是一个有吸引力和令人信服的功能组合,”他说。“但仍然有空间留给最佳的 Google 合作伙伴,例如 Neo4J,它提供了一个专用的图形数据库,具备向量嵌入和搜索能力。”

除了 Spanner 中旨在促进 AI 开发的新搜索功能外,谷歌云还推出了以下新数据库功能:

  • Bigtable SQL 支持,使客户能够使用 100 多个 SQL 函数开发应用程序。
  • Bigtable 分布式计数器,简化嵌入式应用程序开发。
  • Cloud SQL 的 SQL Server 企业版 Plus 版本,旨在为 SQL Server 用户提供更多的成本确定性,就像 Spanner Editions 为 Spanner 用户做的那样。
  • 托管包括 Exadata 和自动化数据库服务在内的 Oracle 数据库服务,与谷歌云和 Oracle 近期建立的战略合作伙伴关系相结合。

Petrie 指出,谷歌云和 Oracle 之间的合作伙伴关系既有趣又奇怪,因为这两者是竞争对手。然而,由于 Oracle 可能大部分利润来自数据库服务而非云战略,他认为,Oracle 使客户能够在谷歌云的基础设施上部署数据库是合乎逻辑的。

下一步

根据 Petrie 的说法,通过添加多种搜索类型,使 Spanner 成为一个促进 AI 开发的数据库,谷歌云正在进行一项创新举措。

“谷歌拥有显著的优势,因为它拥有庞大的资源和丰富的文本搜索和分析经验,”他说。

然而,仍然有空间留给那些专门的数据库供应商,他们的平台能够使客户执行许多相同的任务,而不将他们绑定到如谷歌云平台这样的单一数据生态系统。

Henschen 还表示,尽管谷歌云为了使 Spanner 成为一个用于 AI 开发的数据库,包括添加新的定价选项,但它也有客户使用该数据库的其他原因。

一些客户使用提供全球可扩展性的数据库,其多区域和地理分区能力,但由于在各个区域使用的计算存储量,突然被分类为企业 Plus 客户。结果,这些用户没有享受到数据库的新定价层级。

“Henschen 说:”我希望看到另一个版本,使那些只对 Spanner 的多区域和地理分区能力感兴趣的客户,如果他们不想使用新的图形、文本搜索和向量搜索功能,不必选择最高价版本。“

Eric Avidon 是 TechTarget Editorial 的高级新闻撰稿人,拥有超过 25 年的经验,报道分析和数据管理。

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...