You dont have javascript enabled! Please enable it!

Monte Carlo 为数据可观测性平台添加了更多 GenAI

蒙特卡洛(Monte Carlo)在周四发布了一系列新工具,旨在帮助客户使用可信的数据为数据和产品提供支持,其中包括生成式人工智能驱动的数据可观察性功能,帮助用户开发和部署数据质量监控器。

除了生成式人工智能监控推荐功能外,蒙特卡洛最新的一系列新功能还包括一个数据操作仪表板,用于跟踪数据质量倡议,以及与常用的提取、转换和加载管道(如Azure数据工厂、Databricks工作流和Informatica)的集成。

这些新工具是在蒙特卡洛的影响数据可观察性峰会上发布的,这是一个虚拟用户会议。所有新功能现已普遍可用。

随着企业对人工智能的兴趣激增,高质量的数据对训练成功的人工智能模型和应用至关重要,数据可观察性变得越来越重要。因此,蒙特卡洛强调帮助客户使用可信的数据为其数据和人工智能产品提供支持是非常重要的,ISG Ventana Research的分析师马特·阿斯莱特(Matt Aslett)表示。

“维护质量和信任是一个长期存在的数据管理挑战,而近年来人工智能的兴起使这一挑战更加突出,”他说。“由于企业人工智能倡议的增加,数据可观察性的意义变得越来越重要,这些倡议将企业数据与人工智能和生成式人工智能模型结合起来,以自动化客户服务和商业决策。”

蒙特卡洛总部位于旧金山,是一家数据可观察性专家,其平台使用户能够在数据生命周期内监控数据,检查数据的新鲜度、模式和来源等特征,以确保数据质量。

最近,该供应商推出了根本原因分析功能,旨在帮助用户发现导致数据质量差的代码更改的潜在原因。

新功能

分析和人工智能工具需要高质量的数据。报告、仪表板、模型和应用程序的质量取决于提供这些信息的数据。如果没有准确且可信的数据,分析和人工智能工具将会不准确且不可信。

然而,确保数据质量对于数据专家团队来说几乎是不可能的。

在云数据仓库和湖泊出现之前,组织将数据存储在由IT团队管理的本地数据库中。决策者必须向IT部门提交请求,要求他们开发报告和仪表板,IT团队可以在将数据纳入分析产品之前仔细检查数据的质量。

然而,现在决策需要实时做出。由于云的存在,组织可以收集和存储的数据显示出指数级增长,远超过以前仅在本地存储时的量。

Monte Carlo 为数据可观测性平台添加了更多 GenAI蒙特卡洛最新的可观察性平台功能包括一个生成式人工智能驱动的工具,提供开发数据质量监控器的建议。

因此,数据的庞大体量——几乎一半的组织现在管理至少500PB的数据——使得数据团队即使尝试手动观察数据的质量也是徒劳的。

这就需要数据可观察性供应商,如蒙特卡洛、Acceldata、Metaplane和Soda Data等,他们提供自动监控数据的平台。

和许多同行一样,蒙特卡洛成立于上个十年末。自2019年成立以来,该供应商不断增加和改进其功能,以更好地帮助客户跟踪数据在管道中的流动,并为分析和人工智能工具提供支持。在过去两年中,这包括开发生成式人工智能驱动的功能,以简化数据可观察性,例如一个允许用户使用自然语言生成代码的工具,以及另一个使用生成式人工智能建议代码修复的工具。

现在,该供应商正在添加一个新的生成式人工智能功能。

生成式人工智能监控推荐功能使用大型语言模型(LLM)来检查组织的数据,并提供开发和部署数据质量监控器的建议。开发和部署可以由技术和非技术用户使用以前存在的生成式人工智能工具(如“与人工智能生成”)执行。

生成式人工智能监控推荐功能由蒙特卡洛的数据探测引擎提供支持。数据探测器与LLM集成,利用生成式人工智能发现列之间的关系和数据模式,这些模式几乎是人类无法发现的。

随后,生成式人工智能监控推荐功能建议数据质量规则和监控器,帮助用户建立和部署,从而增强他们对用于训练分析和人工智能工具的数据的信任。

与此同时,信任是所有数据管理和分析供应商的关键关注点,因为他们希望帮助客户开发分析和人工智能工具,阿斯莱特表示。如果用户不信任报告、仪表板、模型和应用程序所依赖的数据,他们就不会使用分析和人工智能工具来做出决策。

“随着企业寻求使用人工智能自动化决策过程的某些方面,确保他们对人工智能所依赖的数据充满信心至关重要,”阿斯莱特说。“这增加了对数据可观察性软件供应商的关注,以及他们在确保数据满足质量和可靠性要求方面所发挥的作用。”

与此同时,使用生成式人工智能工具来自动化和改善数据可观察性仍处于起步阶段。他继续说,因此蒙特卡洛增加生成式人工智能监控推荐功能不仅对用户重要,也可能帮助该供应商在同行中脱颖而出。

“在数据可观察性中使用生成式人工智能仍在发展中,尚未被数据可观察性软件供应商广泛采用,因此生成式人工智能监控推荐功能的推出为蒙特卡洛在降低广泛采用的障碍方面提供了潜在的竞争优势,”阿斯莱特说。

IDC的分析师斯图尔特·邦德(Stewart Bond)指出,生成式人工智能监控推荐功能符合“数据的人工智能”概念,这是数据驱动组织投资的主要领域之一。“数据的人工智能”意味着使用嵌入了人工智能的技术(如数据可观察性)以提高其准确性和效率。

此外,生成式人工智能监控推荐功能与企业对开发人工智能工具的兴趣激增所要求的数据质量的日益重视相一致,邦德继续说道。

“必须解决数据质量问题,以提高人工智能结果的准确性和相关性,”他说。

因此,生成式人工智能监控推荐功能是蒙特卡洛及时的补充,满足了用户的需求,邦德表示。

“将生成式人工智能功能添加到蒙特卡洛对用户来说是一个重要的特性,”他说。“手动过程已不再合理,数据中的关系在没有技术帮助的情况下无法识别。”

关于开发生成式人工智能监控推荐功能的动因,蒙特卡洛的联合创始人兼首席技术官利奥尔·加维什(Lior Gavish)指出,该供应商的产品开发旨在帮助用户提高生产力,并从数据中提取更多价值。

生成式人工智能监控推荐功能旨在同时解决这两个问题。

由于企业人工智能倡议的兴起,数据可观察性的意义变得越来越重要,这些倡议将企业数据与人工智能和生成式人工智能模型结合起来,以自动化客户服务和商业决策。马特·阿斯莱特 ISG Ventana Research分析师

“编写数据质量规则需要时间,而数据或环境越大或越复杂,这段时间就会显著增加,”加维什说。“通过生成式人工智能监控推荐功能,我们的客户根据数据中的关系模式获得可操作的建议,从而节省了手动编写数十甚至数百条规则的时间。”

此外,由于生成式人工智能能够监控数据的语义意义,它使得发现数据点和数据集之间的关系成为可能,这些关系可能在没有这种技术的情况下无法被发现,加维什继续说道。

“这能够捕捉到那些可能被忽视的问题,并在它们对业务造成严重影响之前发现它们,”他说。

尽管生成式人工智能监控推荐功能提供了新的生成式人工智能驱动的数据可观察性能力,但蒙特卡洛的数据操作仪表板旨在为组织提供一种轻松查看操作指标并跟踪数据质量倡议进展的方法。

通过为用户提供清晰的指标视图,显示数据质量,用户将更好地理解数据是否可以被信任,并用于指导分析和人工智能项目的决策,或者在可以投入使用之前是否需要改进。

数据操作仪表板中填充的数据可观察性指标包括监控警报的响应时间、事件解决时间、事件总数、事件严重性以及负责解决事件的相关方。

正如开发生成式人工智能监控推荐功能的动因是为了节省用户时间并从数据中获取更多价值一样,效率和价值也推动了数据操作仪表板的创建, 加维什表示。

“就像应用性能监控解决方案帮助团队不仅检测问题,还能找出根本原因并解决它们一样,蒙特卡洛致力于帮助团队减少在数据质量方面花费的时间和资源,”他说。

与此同时,考虑到数据操作仪表板提供的对数据可观察性的深入洞察,这对蒙特卡洛的客户来说是一个有益的新工具,阿斯莱特表示。

“数据操作可以使数据专业人员测量与数据使用相关的改进,并向更广泛的组织展示他们角色的价值,”他说。“蒙特卡洛已经为用户提供了与特定数据集健康相关的关键指标。数据操作仪表板提供了额外的操作上下文,以提供更全面的数据可靠性视图。”

除了数据操作仪表板和生成式人工智能监控推荐功能外,与Azure数据工厂、Databricks工作流和Informatica的集成旨在为用户提供在一个位置查看数据来源和数据管道性能的能力。

下一步

在蒙特卡洛规划未来的产品开发时,其中一个重点将是继续增加生成式人工智能驱动的数据可观察性工具,以检测、优先处理和解决数据问题,加维什表示。

其他计划包括将数据可观察性的覆盖面从少数开发团队扩展到数据工程师和分析师,并通过与AWS、Databricks、Google Cloud、Microsoft Azure和Snowflake等数据平台供应商的集成,将数据可观察性扩展到企业的整个数据资产。

最后——也许在帮助组织开发人工智能和工具方面最为关键——是改善对非结构化数据的数据可观察性。

非结构化数据,如文本、图像和音频文件,估计占所有数据的80%以上。将这些数据纳入训练人工智能模型和应用程序的管道,对于确保这些模型和应用程序提供最准确的结果至关重要。

因此,支持非结构化数据对数据可观察性供应商来说至关重要。

“2025年数据格局的复杂性部分在于非结构化数据的爆炸,”加维什说。“我们正在与客户合作,构建能力,以确保为他们的LLM和[检索增强生成]管道提供支持的非结构化数据是可靠和准确的。”

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...