You dont have javascript enabled! Please enable it!
百度/360权5,日IP1w+ 查看详情
立即入驻

Aerospike 为数据库添加了新的矢量搜索功能

AI技术48分钟前更新 庆龙江
1 0 0

数据库专家Aerospike于周三推出了其最新版本的向量搜索套件,该版本包括一个灵活的存储功能,以减少复杂性,以及一个旨在提高查询速度和准确性的索引工具。

向量是由算法分配的数据的数值表示,是为非结构化数据(如文本和图像)提供结构的流行方式。通过为这些数据提供结构,数据变得可搜索,并可用于分析和应用。

Aerospike在四月筹集了1.14亿美元的资金。该数据库供应商计划利用这笔资金继续开发其向量搜索能力——这一能力首次在当时推出——以及图形技术,后者是发现所需数据以训练模型和应用的另一种常用手段。

根据ISG的Ventana Research分析师Matt Aslett的说法,这些新功能不仅在Aerospike向量搜索的初次推出基础上增加了功能,还帮助Aerospike在提供向量搜索和存储的其他数据库供应商中脱颖而出。

“在过去18个月里,许多数据平台软件提供商增加了对向量搜索的支持,”他说。“那些最早这样做的公司现在正在完善他们的方法。Aerospike向量搜索的最新版本增强了现有功能……通过索引和存储的改进来提升性能并提供额外的差异化。”

Aerospike的主要平台——Aerospike数据库和Aerospike云——旨在实现实时数据分析。竞争对手包括MongoDB和Couchbase等其他数据库专家。

新的向量搜索功能

在2022年11月推出的ChatGPT标志着生成性的重大进步,引发了企业对人工智能开发的兴趣激增。

生成性人工智能模型与企业的专有数据结合使用,可以开发出使员工能够使用自然语言与数据互动并自动化重复任务的应用。

然而,为了使这些应用有价值,它们需要大量相关的高质量数据。

用于训练人工智能应用的相关高质量数据越多,它就越有可能提供可以用于指导业务决策的准确、可信的输出。

鉴于对数据量的需求,非结构化数据比以往更为重要。结构化数据,如财务记录和销售点交易,构成所有数据的不到20%。为了获得足够的数据来正确训练人工智能工具并提供更全面的组织运营视图,非结构化数据是必需的。

因此,向量搜索在过去两年中发挥了关键作用,使企业能够在开发人工智能工具时访问其非结构化数据。根据供应商首席工程官Naren Narendran的说法,提供这种访问是Aerospike最初开发向量搜索能力的动力。

“图形和向量对我们的人工智能战略特别重要,”他说。“它们是人工智能应用未来的基础,也是我们进入这一领域的原因。”

然而,向量的索引方式对其有效性至关重要。如果索引做得不好,相关的向量化数据将难以发现。

Aerospike的新向量搜索功能包括其称之为分层可导航小世界(HNSW)索引的技术。

在过去18个月里,许多数据平台软件提供商增加了对向量搜索的支持。那些最早这样做的公司现在正在完善他们的方法。Aerospike向量搜索的最新版本增强了现有功能……Matt Aslett ISG的Ventana Research分析师

这种索引方法使数据可以在数据库中同时被摄取和索引,以便能够跨设备搜索。此外,尽管数据摄取和索引可能在用户实时查询数据时同时进行,但工作负载是分开的,以优化性能。

与此同时,性能速度对Aerospike至关重要,不仅因为其历史上专注于实时分析,还因为需要确保人工智能工具能够使用最新的数据,Aslett表示。

“能够独立扩展向量摄取和索引是Aerospike专注于实时应用需求的体现,”他说。“此外,它支持对高性能生成性人工智能和人工智能推理日益增长的需求,以促进提供上下文相关的推荐、预测和预测的智能操作应用。”

Informa TechTarget的企业战略组分析师Stephen Catanzano同样指出了HNSW的重要性。他指出,在系统异步构建索引的同时,能够实时摄取数据为实时的人工智能驱动决策提供了动力。

此外,Catanzano强调了新的存储选项对向量化数据的重要性,例如小索引的内存存储或大型索引的混合内存,这些选项此前仅在Aerospike的核心数据库中提供。

“此更新中最重要的功能是持久的自愈索引和灵活的存储配置,”他说。“这些功能共同使企业人工智能系统实现更好的可扩展性、减少操作开销和降低基础设施成本。”

除了新的索引和存储功能外,Aerospike的向量搜索更新还包括以下功能:

  • 改进供应商的多模型数据库引擎,以更好地支持文档、键值、图形数据库和向量搜索功能在单一系统中的整合。
  • 为向量化数据的常见使用场景提供预构建的Python客户端和示例应用,以加速开发和部署。
  • 与人工智能开发平台LangChain和Amazon Bedrock的集成,以更好地使用户构建创建人工智能应用(包括生成性人工智能)的生态系统。

综合来看,这些新功能构成了一个引人注目的更新,Catanzano表示。

“这些功能解决了关键行业挑战,如不中断的性能、可扩展性和成本降低,”他说。“此次发布是一项显著的进步,而不仅仅是渐进的改进。”虽然对人工智能开发的兴趣日益增加促使Aerospike在其数据库平台中增加向量搜索和图形技术,但根据Narendran的说法,开发新向量搜索能力的动力来自客户反馈和市场观察。

特别是同一系统中的多模型数据库能力满足了客户需求。

“[通过多模型能力,客户不必获取向量数据库,将数据提取出来并移动到向量数据库中,”Narendran说。

关于市场趋势,Narendran继续指出,对开发人工智能(包括生成性人工智能和传统人工智能)的兴趣日益增加是一个推动力。

Aerospike 为数据库添加了新的矢量搜索功能

下一步

在Aerospike规划其产品开发路线图时,改善其数据库平台的性能和规模是其计划的一部分,Narendran表示。

此外,供应商还在考虑开发超越向量搜索的工具,这些工具在人工智能开发过程中发挥作用,并提供使客户更容易使用向量搜索的服务。

“向量搜索只是一个组成部分,”Narendran说。“还有其他组成部分在其之前或之后,并且可以在向量搜索之上构建服务,适合那些在开发人工智能管道方面不太熟练的人。”

Catanzano建议,除了LangChain和Amazon Bedrock之外,与人工智能和开发框架的集成是Aerospike可以扩展其生态系统的一个途径。此外,改善检索增强生成(RAG)能力,发现向量化数据并为人工智能管道提供数据,将是有益的。

“还有机会通过更多的预构建模板、连接器和工作流工具来增强RAG能力,以帮助快速采用这种架构的公司,”Catanzano说。

与此同时,Aslett表示,随着对人工智能开发兴趣的增加,Aerospike继续改善其向量搜索和图形技术能力是明智的,因为企业构建的人工智能驱动应用变得更加先进。

“随着Aerospike[试图]进一步区分自己,我们预计将更加关注其图形和向量能力的结合,以服务于高性能人工智能增强操作应用的开发和部署,”他说。

Eric Avidon是TechTarget编辑部的高级新闻撰稿人,拥有超过25年的新闻工作经验。他专注于分析和数据管理。

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...