天睿(Teradata)在周二发布了针对 ClearScape Analytics 的新功能,旨在帮助客户更好地实现其人工智能(AI)和机器学习投资的回报。
该供应商指出,AI 和机器学习操作往往效率低下,导致企业无法从数据中提取有价值的洞察,同时在昂贵的工具和流程上花费大量资金。
为了解决这一不平衡,天睿的最新平台更新包括一款新工具,旨在消除昂贵的数据移动,AutoML 工具使数据科学家能够自动化模型训练,并与开源分析供应商 Knime 集成,让用户更轻松地开发数据科学工作流。
根据 TreeHive Strategy 的创始人兼首席顾问 Donald Farmer 的说法,这些新功能共同实现了简化 AI 和机器学习的目的,使用户能够从 AI 和机器学习项目中获得更多价值。因此,这些功能对天睿的客户来说是重要的补充。
“这次发布是对一些反复出现的问题的良好尝试,例如复杂性、成本、可扩展性和生产力,”他说。“还有一些工具可以更容易地采用和操作,这也很好。”
TechTarget 企业战略组的分析师 Mike Leone 同样指出,新的 ClearScape Analytics 功能使天睿的更新能够帮助企业从其 AI 和机器学习投资中获得更好的成果。
“天睿的客户可以期待加速实现价值和提高投资回报率,”他说。“这些新功能和增强功能共同简化了 AI/ML 工作流,提高了整个 AI 生命周期的生产力,这可以帮助几乎所有企业在规模上操作 AI,同时吸引技术和非技术用户。”
天睿总部位于圣地亚哥,是一家长期从事分析和数据管理的供应商。ClearScape Analytics 于 2022 年 8 月首次推出,是该供应商的主要商业智能平台,而 VantageCloud 是其存储和准备数据的平台。
作为一家提供分析和数据管理套件的数据平台供应商,其竞争对手包括 Databricks 和 Snowflake。
最近,天睿与 AI 供应商 DataRobot 进行了集成,旨在使客户能够使用 DataRobot 的工具与 VantageCloud 一起开发 AI 模型和应用程序。在 2023 年 5 月,天睿还推出了与谷歌的 Vertex AI 平台的类似集成,旨在为用户提供构建 AI 模型和应用程序的工具。
新功能
随着过去两年生成式 AI 兴趣的激增,企业对传统 AI 和机器学习的兴趣也在上升。
生成式 AI 有潜力通过自动化以前必须手动完成的重复任务,使数据管理和分析更加高效,同时管理诸如数据集成和可观察性等过程,这些过程本来需要人类来管理。
此外,由于其自然语言处理能力,生成式 AI 消除了以前与数据管理和分析工具交互所需的许多编码,从而使这些工具对非技术用户更为可用。
由于这些好处,许多企业正在开发生成式 AI 工具。
与此同时,对传统 AI 和机器学习的投资也在增加,部分原因是生成式 AI 使传统 AI 和机器学习的开发变得更容易,通过生成代码和承担其他开发任务。此外,现在可用的计算能力更多,这是处理 AI 和机器学习工作负载的关键,企业现在拥有准确训练 AI 和机器学习模型所需的数据。
然而,据报道,超过四分之三的机器学习模型从未投入生产,导致时间和金钱的浪费,没有投资回报。
天睿试图通过其 ClearScape Analytics 更新来改变这一现状,减少与开发和部署 AI 和机器学习模型相关的复杂性,天睿的数据科学和分析产品管理高级总监 Michael Riordan 表示。
“今年,我们专注于帮助客户利用 ClearScape 功能来最大化他们的投资,减少复杂性并推动成果,”他说。
为此,ClearScape Analytics 更新包括 pyspark2teradataml,这是一种工具,消除了数据移动的需要,使用户能够将 PySpark 代码转换为天睿机器学习。
以前,许多客户必须将数据导出到 Apache Spark 平台,以编写构建模型所需的 Python 代码。通过消除这一要求并使用户能够在 ClearScape Analytics 中编写代码,天睿简化了模型开发,同时降低了创建模型的相关成本。
除了 PySpark 转换工具外,AutoML 旨在使数据科学家能够自动化模型训练过程。通过这样做,该工具将节省数据科学家大量耗时的任务,使他们更加高效,同时使一些技术水平较低的用户能够构建 AI 和机器学习模型。
同样,ClearScape Analytics 与 VantageCloud 和 Knime 的集成旨在使不仅仅是数据科学家和其他专家能够构建 AI 和机器学习工具。
Knime 的开源低代码/无代码数据科学平台适合数据科学家,但也可以被技术水平较低的工作人员使用,这应该使企业能够更快速地开发 AI 和机器学习工具,同时也限制成本。
最后,天睿的更新包括改善用户体验,以更好地实现自助服务访问,以及 Teradata 开源机器学习,以便在 VantageCloud 上使用开源机器学习工具。
虽然这些新功能共同旨在更好地使企业获得其在 AI 和机器学习投资中的收益,但根据 Leone 的说法,AutoML 可能是天睿更新的亮点。
Qlik 和 Alteryx 等供应商也是提供自动化机器学习功能的分析和数据管理供应商。然而,天睿进入 AutoML 仍然有助于供应商的客户,使更多员工(不仅仅是专家)能够构建和训练模型。
“即使 AutoML 功能在某些领域已经广泛可用,但这一功能仍然是最突出的,”Leone 说。“这一能力能够加快生产时间,并将 AI 能力扩展到非技术用户。随着企业强调运营效率并将模型投入生产,AutoML 的能力直接解决了这些领域的问题。”
Farmer 同样指出 AutoML 是一个关键的新功能,并指出 PySpark 转换工具也具有重要潜力。
通过降低复杂性,PySpark 转换工具满足了 Spark 和 Teradata 用户的需求,他说。
与此同时,通过降低构建 AI 和机器学习模型所需的技术要求,AutoML 对于天睿来说是一个转变,天睿传统上将其平台定位于专家,同时使更广泛的使用成为可能,他继续说。
“通过降低技术门槛,它可能会加速不同业务单元的 AI 采用和创新,特别是在数据科学资源有限的情况下,”Farmer 说。
下一步
随着天睿继续努力帮助企业在 AI 和机器学习项目中获得更好的回报,增加向量搜索和存储是该供应商的一个重点,Riordan 表示。
数据分析历史上主要集中在结构化数据上,例如财务记录和销售点交易。然而,现在,绝大多数数据是非结构化的,例如文本、音频文件和图像。
为了访问非结构化数据——这对于全面了解组织至关重要——并将其用于训练模型和应用程序,它需要某种形式的结构。向量是数据的数值表示,可以应用于非结构化数据,以便为其提供结构,从而可以进行搜索和发现。
一旦天睿增加了向量搜索和存储能力,它将更好地使客户能够将结构化数据与非结构化数据结合,以开发更准确的分析和 AI 工具。
“我们 AI 计划的一个关键基础是将高性能向量数据引入 Vantage,”Riordan 说。
实现这一目标的一种方法是通过与合作伙伴的集成,他继续说。
“从非结构化数据源集成向量数据……并将其与 Vantage 中已丰富的数据结合,将使分析工作流达到新的高度,”Riordan 说。
根据 Leone 的说法,增加能够支持 AI 开发的功能的集成是一个明智的关注领域。
“天睿应该在增强其 AI 生态系统方面投入大量精力,”他说。“Knime 的集成是朝着这一目标迈出的重要一步。”
此外,为了帮助新客户入门并加速现有客户的价值实现,增加预构建工具可能是天睿改善其产品的另一种方式,Leone 补充道。
同时,Farmer 还建议天睿可以做更多工作来扩展其 AI 开发生态系统。特别是,更加关注开源社区可能会带来好处。
与 Knime 的集成和开源机器学习的增加满足了天睿扩展其开源生态系统的需求,Farmer 表示。但是,竞争对手如数据平台供应商 Databricks 与开源社区的关系更为紧密,并且与开源平台的集成更为广泛,Farmer 说。
“尽管天睿改善了对开源工具和语言的支持,但像 Databricks 这样的公司在开源大数据生态系统中有更强的传统,”他说。“天睿可以做得更多。”
同样,Farmer 继续说,天睿可以做更多工作来为非企业用户增加定价选项。
天睿采用基于消费的定价模型,月订阅起价为 4,400 美元,年订阅起价为 52,600 美元。
“天睿传统上被视为一个高端、面向企业的解决方案,”Farmer 说。“虽然他们引入了更灵活的定价选项,但竞争对手仍被认为在小规模用例方面更具成本效益。”
Eric Avidon 是 TechTarget 编辑部的高级新闻记者,拥有超过 25 年的新闻经验。他专注于分析和数据管理领域。