SAS于周二完成了对Hazy的主要软件能力的收购,Hazy是一家合成数据生成供应商,其工具可以帮助开发AI模型和应用程序。
交易的财务条款未予披露。
Hazy总部位于伦敦,是一家成立于2017年的初创公司,其合成数据生成平台使用户能够人工制造模仿真实数据的数据。
合成数据的主要应用之一是训练AI模型和应用程序,而不会意外暴露组织真实数据中的敏感信息。这在医疗保健和金融服务等敏感数据普遍存在的行业中尤为有用。
合成数据的其他用途包括在数据过于稀疏或不完整以至于无法正确训练分析或AI工具时增加数据量,帮助减少数据集中的偏见,以及为场景测试提供信息。
与此同时,SAS是一家总部位于北卡罗来纳州凯瑞市的长期分析供应商。与许多同行一样,自OpenAI推出ChatGPT以来,生成性AI能力有了显著提升,SAS将生成性AI开发作为其平台的重要组成部分。它开发了一些自身的生成性AI工具,例如AI助手,同时还增加了使客户能够构建AI模型和应用程序的功能。
Donald Farmer,TreeHive Strategy的创始人兼首席顾问表示,SAS收购Hazy可能是针对其核心数据科学家受众的良好举措。这为产品组合增加了重要功能,并与最近对合成数据使用增加的趋势相一致。
“这次收购Hazy可能是SAS针对其核心数据科学家受众的良好举措,”他说。“这为产品组合增加了重要功能,并与最近对合成数据使用增加的趋势相一致。”
然而,Farmer补充说,收购合成数据生成能力以帮助AI开发不太可能帮助SAS吸引新客户。
“这是针对他们现有专业用户的一个功能,”他说。
增加合成数据
在过去两年中,企业对开发AI模型和应用程序的兴趣激增。
组织长期以来一直在寻求使员工更具数据驱动能力的方法,但由于使用分析和数据管理平台的复杂性而受到制约。通常需要编码技能来准备数据进行分析,而理解数据则需要数据素养技能。
自然语言处理被视为超越训练有素的专家,扩大分析工具使用范围的一种方式。然而,几年前开发的NLP工具供应商的范围有限,仍然需要一定程度的专业知识才能使用。
生成性AI改变了这一局面,使真正的自然语言处理成为可能。
当像ChatGPT和谷歌的Gemini这样的语言模型与组织的专有数据结合时,用户可以使用自然语言而不是代码查询和分析数据。此外,生成性AI可以被训练来承担某些重复性任务,从而使受过训练的专家受益。
现在,生成性AI正在变得更加自主。因此,越来越多的企业正在开发或计划开发生成性AI工具,以拓宽数据驱动的决策制定和自动化重复性流程。
作为回应,SAS、MicroStrategy、Qlik等供应商在其平台内创建了开发环境,旨在简化AI和机器学习工具的开发。
SAS起初对生成性AI的接受较慢,由于对大型语言模型准确性和安全性的担忧,在2023年初采取了谨慎的态度。然而,到2023年9月,该供应商加入了竞争,并公布了与LLM能力集成其工具的计划。
在4月,SAS推出了一款生成性AI驱动的助手、预构建的AI模型、通过SAS Data Maker的初步合成数据开发能力,以及一个完整的环境,让用户开发自己的AI模型和应用程序。
尽管在4月推出,SAS Data Maker仍处于私有预览阶段,SAS高级研发经理Brett Wujek表示。在私有预览期间,SAS收到了来自公共服务、制药和制造等行业客户的反馈。
“这些反馈促使我们扩大开发努力的范围,以填补一些重要的空白[通过收购],”Wujek说。
他继续说,这些空白包括基于特定数据表生成合成数据集、支持时间序列数据以及保护个人身份信息。
“虽然这些都在SAS Data Maker的路线图上,但收购Hazy的技术提供了预计两年的产品成熟加速,”Wujek说。
与此同时,SAS表示收购的其他好处包括:
- 由于合成数据的引入,AI系统能够被信任并遵守伦理标准,从而实现数据多样性。
- 合成数据取代敏感数据,增加数据安全性和隐私性,消除敏感数据泄露的风险。
- 通过使用合成数据集实现更为多样化的研究和测试。
- 通过减少数据收集支出实现成本节省。
- 考虑到合成数据生成的速度,开发速度更快。
尽管起步比一些同行慢,但考虑到收购Hazy的合成数据生成能力,SAS已经开发出与其他分析供应商竞争的生成性AI能力和AI开发环境,Farmer表示。
“SAS Viya平台相当全面,”他说。
Farmer继续说,SAS在将开源编程语言整合到分析工作流程中以及增加LLM能力方面做得很好。然而,正如收购Hazy的知识产权可能不会吸引新客户一样,Farmer表示,SAS迄今为止的AI相关努力并没有帮助该供应商在潜在新客户中脱颖而出。
“将生成性AI整合到现有分析工作流程中的关注点对他们现有的用户基础是有利的,”Farmer说。“问题是,他们没有获得很多新客户,而主要是向现有客户提供更多价值。”
下一步
随着SAS对Hazy技术的收购完成,该供应商的主要焦点之一将是将Hazy的能力整合到SAS Data Maker中,并在Microsoft Azure、AWS、Google Cloud和Snowflake等市场上普遍提供SAS Data Maker,Wujek表示。
“这次收购……反映了SAS对数据和AI未来的愿景,”他说。
与此同时,Farmer表示,SAS有一个独特的机会,可以开发针对某些行业客户的预训练AI模型,并指出该供应商已经提供了许多特定行业的应用程序。
SAS在其网站上列出了17个行业应用,包括农业、银行、教育、医疗保健甚至体育。Databricks、SAP和Snowflake等供应商也在其平台中提供特定行业的工具。
“在垂直专业化方面,SAS享有良好的声誉,”Farmer说。“如果他们能够开发针对特定行业的预训练AI模型,并提供相应的API,那将是非常好的。”