微软在周二推出了Fabric的新功能,以帮助客户开发AI驱动的应用程序。
微软Fabric首次于2023年5月发布,并在六个月后正式推出。它是一个基于AI的数据管理和分析套件,将之前分散的平台Azure Data Factory、Azure Synapse Analytics和Power BI整合到一个单一环境中。
该套件旨在支持七种数据管理和分析工作负载,包括实时BI、数据工程、数据仓库和数据科学。
为推动AI应用程序开发而设计的新功能包括Fabric数据库,提供用户直观且自主的数据存储,以便为应用程序提供相关数据——其中首个推出的数据库是Microsoft Fabric中的SQL数据库,以及Fabric中的AI函数,用于文本分析。
此外,微软还推出了OneLake Catalog,这是一个用于Fabric的数据目录,支持数据治理和探索,并为SQL Server和Redis数据库提供了新功能。
这家科技巨头在微软Ignite用户大会上揭示了所有新功能,其中大部分处于预览阶段。该大会在芝加哥和在线上举行。
根据Constellation Research的分析师Doug Henschen的说法,这些新的数据管理和分析能力与Ignite上推出的其他AI功能(如Azure AI Foundry)一起,有潜力使微软的AI能力更接近于竞争对手,如AWS和谷歌。
Henschen指出,微软在2023年是AI助手的早期开发者。然而,这家科技巨头花了很长时间才使这些助手普遍可用,随着过去一年AI的演变变得更加自主,微软则显得有些滞后。
他说:“这家公司花了很长时间才交付Copilots,并在推向自主应用方面显得有些措手不及。我们将看看在Ignite上推出的新功能能否迅速获得关注。目前,AWS、谷歌云和Salesforce等应用竞争对手在AI的未来发展中吸引了很多注意。”
尽管微软可能不再是提供AI能力和推动AI发展的最快公司,但这家科技巨头的新数据管理和分析功能对其客户来说依然重要。根据BARC美国的分析师Kevin Petrie的说法,这些功能共同推动微软Fabric作为AI开发基础设施的发展。
他说:“这是一套相当全面的增强功能。微软继续加强其数据架构,作为生成AI和传统AI的基础,从基础设施到数据和应用层面。”
微软在5月举办了面向开发者的Build用户大会。当时宣布的Fabric新功能包括对开源表格格式Apache Iceberg的支持、Power BI中的AI助手以及改进的实时分析能力。
新功能
自2022年11月OpenAI推出ChatGPT以来,企业对开发AI应用程序(包括生成AI)的兴趣激增。这一推出标志着大语言模型技术的重大进展。
生成AI的两个主要好处是其潜力使分析的广泛使用能够通过真实的自然语言处理来支持决策,以及能够承担以前由人类执行的重复任务。它本质上承诺使人们变得更聪明和更高效。
因此,许多企业开始开发AI驱动的应用程序或表达了对此的兴趣。
作为回应,许多数据管理和分析供应商开发了生成AI驱动的工具,并为客户创建了开发自己AI工具的环境。
微软是最早的公司之一,在2023年初与OpenAI建立了合作关系,并对这家AI供应商进行了100亿美元的投资。根据微软首席传播官Frank Shaw的说法,自那时以来,AI一直是微软的重点。
他说:“我们在Copilot和AI堆栈的每个层面进行创新,包括开发者工具、AI平台和数据基础设施,所有这些都是为了让客户能够构建自己的AI应用程序,并在其业务的各个方面注入AI。”
Fabric中的新功能——包括Fabric数据库和AI函数——目前处于公开预览阶段。这些产品进一步推动了微软为用户快速轻松构建AI应用程序的生态系统的发展。
Fabric数据库旨在通过提供自主数据库来简化AI应用程序的创建,利用AI和机器学习直观地提供相关数据。
Microsoft Fabric中的SQL数据库是首个推出的Fabric数据库,它是一个数据库引擎,使用户能够开发一个统一的数据平台,应用AI于操作数据和分析数据。操作数据包括单个交易记录,而分析数据则跟踪这些单个记录随时间变化的模式。
Microsoft Fabric中的SQL数据库的功能包括:
- 数据自动复制到OneLake,以便Fabric分析引擎可用;
- 与Azure AI中的嵌入模型结合的原生向量搜索,以实现检索增强生成;
- 支持持续集成和持续交付(CI/CD);
- Fabric中的Copilot,使用户能够使用自然语言与数据进行交互。
Fabric中的AI函数使用户能够分析文本,提供摘要、翻译和情感分析等功能。
Henschen指出,微软Fabric最初专注于分析数据,因此在同一平台上增加对开发事务数据应用程序的支持是重要的。
此外,通过将数据自动复制到OneLake和Microsoft Fabric中的新功能“开放镜像”,用户可以在数据变化时自动复制来自任何应用程序或其他数据源的数据,从而进一步扩展操作和分析数据的组合。
他表示:“增加[事务]选项和支持变更数据捕获复制,使Fabric成为数据驱动应用程序以及数据驱动洞察的平台。”
然而,Henschen补充说,微软的新数据复制和捕获数据变化的能力并不独特,指出AWS提供了类似的功能。
他说:“这些选项与AWS在数据库服务之间引入的类似于Amazon Aurora和Amazon Redshift的连接非常相似。”
微软其他新推出的数据管理和分析能力包括:
- OneLake Catalog,这是一个数据目录,使用户能够管理和探索其整个Microsoft Fabric生态系统中的结构化和非结构化数据、数据湖和仓库、机器学习模型、笔记本、报告、仪表板和其他数据及AI资产。OneLake Catalog的探索功能已普遍可用,而其治理功能将在2025年初公开预览。
- SQL Server 2025,这是SQL Server数据库的更新版本,目前处于私有预览中,包含旨在支持AI开发的功能,如向量存储和一个帮助SQL开发的Copilot,提供建议、完成代码和提供最佳实践。
- Azure Managed Redis,这是一个现在处于公开预览中的服务,将自动提供开源Redis数据存储的最新发展,包括更高效地缓存数据以提高性能和降低成本的能力。
虽然每个功能都提供了新功能,但Henschen表示,OneLake Catalog提供了特别有价值的能力。
微软通过Purview提供企业级数据目录和元数据管理能力。OneLake Catalog将这些能力集中在Microsoft Fabric的数据湖上,为组织提供可信的数据,以便开发AI应用程序,以及关于其数据和AI资产的信息。
Henschen表示:“OneLake Catalog将数据探索和治理的所有优点带入OneLake。这里有一套非常专注、易于实施和管理的能力,专门针对OneLake。”
Petrie同样强调了OneLake Catalog。在新数据目录推出之前,微软仅为Fabric用户提供了一个数据中心。数据目录为Fabric用户提供了更先进的治理和数据发现能力。
Petrie表示:“新的OneLake Catalog是微软用户在他们的分析项目中需要文档、查找和治理元素(数据、模型、平台)的一大进步。”
除了简单地帮助微软用户外,新的数据管理和分析能力还帮助这家科技巨头在与其他超大规模云服务商的竞争中保持领先地位。
与从一开始就为云构建的平台不同,微软在开发云原生能力之前,曾服务于一个本地用户群体。现在,许多企业更喜欢混合部署,使他们能够将最敏感的信息保留在本地,而将其他数据存储在云中。
凭借其SQL重点和Fabric的其他功能,微软可能比一些竞争对手更好地满足这些客户的需求。
Petrie表示:“微软正在利用其相对于Databricks、Snowflake和云超大规模服务商的主要优势之一——即长期支持混合环境。许多SQL环境包括仍然在本地的数据和应用程序。与其主要竞争对手不同,Microsoft Fabric帮助管理本地元素。”
微软首席传播官Frank Shaw在微软Inspire之前的虚拟新闻发布会上发言。
下一步
随着在Inspire上推出的大多数功能现在处于预览阶段,Microsoft Fabric中的SQL数据库等功能基本上构成了微软的数据管理和分析路线图。
Shaw表示,这些功能的核心——以及这家科技巨头周二推出的近100个新功能的核心——是使Microsoft Fabric用户能够开发AI应用程序,从而提高用户的生产力。
他说:“我们的愿景是为每位员工提供一个Copilot和一个为他们工作和与他们合作的代理团队。”
与此同时,Henschen表示,除了在Microsoft Fabric中推出SQL数据库外,他预计将看到不仅仅是一个Fabric数据库。
与AWS一样,微软在Azure上已经拥有一系列数据库产品。但Fabric数据库承诺与Fabric特别集成,这使其不同于其他微软数据库。
Henschen说:“Fabric数据库听起来是一个承诺,不仅仅提供一个通用的SQL数据库,所以我不会感到惊讶,如果未来看到更多的数据库选项,类似于AWS通过其关系数据库服务提供的许多选项。”
Eric Avidon是TechTarget Editorial的高级新闻撰稿人,拥有超过25年的新闻经验。他专注于分析和数据管理。