You dont have javascript enabled! Please enable it!

Snowflake 推动教育科技供应商的数据和人工智能计划

在PowerSchool成为数百个学区运转的引擎的同时,Snowflake的数据管理和开发能力则是为该供应商提供分析和AI开发所需能量的燃料。

PowerSchool是一家位于加利福尼亚州福尔森的教育科技公司,其软件被美国及海外的学区用于收集和提供信息访问。

这是教师输入成绩、考勤和发布作业的系统。学生在这里查看课程表和成绩。管理员在这里管理学区的数据,包括教师和学生的课程安排、特殊教育项目以及为有特殊需求的学生制定的个性化教育计划。家长则在这里查看有关孩子评估和课堂表现的信息,以及孩子所就读学校的数据。

其核心是来自北美近17,000个学区和全球90个国家的大量数据,这些数据需要以某种方式组织,以便具备价值。

根据PowerSchool首席产品与创新官Shivani Stumpf的说法,在一个学生从幼儿园到高中毕业的过程中,学区平均会收集超过170,000个关于该学生的数据点。

但PowerSchool并不只是满足单个学生的需求。相反,它满足6000万学生的独特需求。

“每一款可以被学生、家长、教育工作者、管理员、顾问和校长使用的软件,都由PowerSchool提供,”Stumpf说。

Snowflake是一家数据管理供应商,现在也提供AI应用开发能力,是PowerSchool管理所有所需数据的手段,以满足学生、教师、家长和管理员的需求。

但这并非总是如此。

在2021年之前,PowerSchool使用不同的数据管理工具来监督其数据。最终,随着教育科技供应商的数据量增长以及将数据实现运营化的计划变得更加雄心勃勃,这些工具未能满足需求。

“我们主要是因为性能原因而放弃了[之前的数据管理供应商],”Stumpf说,她拒绝透露该供应商的名称,因为PowerSchool仍然在其他用途上使用其某些功能。“我们真的不满意,因为我们想要扩展。”

PowerSchool需要其他东西,需要更强大的东西。

问题与解决方案

PowerSchool收集和管理约780TB的数据和每月350亿次数据更改。这些数据对学区运营的每个方面都至关重要,从满足每个学生的需求到制定广泛的学区计划。

如果学生在学习上遇到困难,数据将帮助确定如何解决这些问题并制定帮助学生成功的计划。如果学生表现优异,数据将帮助制定一个保持学生参与的计划。如果学区需要确定下一年的预算,学校官员会利用这些数据做出关键决策。

如果学区希望利用最新技术并使用AI来帮助学生、教师和管理员,学区将利用这些数据来训练提供帮助的AI应用。

在COVID之后,数据和分析成为教育系统中最重要的组成部分之一,就像在其他行业一样。我们开始看到巨大的需求和增长。Shivani StumpfPowerSchool首席产品与创新官

在2021年,随着学校找到应对持续的COVID-19大流行的方法,学生在2020年春季关闭后重返校园,数据的重要性可能比以往任何时候都更加突出。

“数据和分析,尤其是在COVID之后,是教育系统中最重要的组成部分之一,就像在其他行业一样,”Stumpf说。“我们开始看到巨大的需求和增长。”

然而,PowerSchool现有的数据基础设施无法应对对数据的增加需求,以及公司扩展数据使用计划的能力,她继续说道。

其中一个重大问题是其无法将计算与存储分离,这迫使系统管理员在加载数据和加载仪表板之间进行优先选择,而不是同时进行。随着数据项目的增加以及运行这些项目所需的计算能力的提升,学校管理员早晨登录仪表板时,前一天的数据仍在加载。

“我们对看到的性能延迟感到非常不满,”Stumpf说。“这是一种非常令人沮丧的体验。”

当PowerSchool最终对其旧数据管理系统感到厌倦时,它列出了大约50个希望在新系统中实现的标准,并开始寻找。

PowerSchool希望在新数据管理平台中的一个关键标准是计算与存储的分离。另一个是数据治理,特别是保护敏感数据的能力。

作为一家教育科技供应商,PowerSchool收集的大部分数据都是受保护的个人身份信息。如果曝光,PowerSchool及其服务的学区可能会因违反规定而面临严厉的处罚。因此,提供强有力的数据治理能力的平台,以及使系统管理员能够限制每个用户所接触数据的能力,对PowerSchool至关重要。

“对于我们所有应用程序来说,首要任务是严格的数据治理、安全性和隐私,以及保护客户的这些权益,”Stumpf说。

与此同时,根据Snowflake的数据仓库负责人Josh Klahr的说法,数据治理是Snowflake的重点之一。

Snowflake的架构,包括其Horizon数据目录,旨在消除不同数据治理模型、数据类型和数据共享生态系统之间的隔离,Klahr指出。

“这使其成为具有独特合规要求和需求的组织的理想选择,”他说。“客户获得一个单一的数据治理模型,具有全面的合规性、安全性、隐私和协作控制,这些控制在保护个人身份信息方面是普遍执行的。”

除了数据治理能力,Snowflake还使客户能够分离计算和存储工作负载,Klahr继续说道。

“Snowflake的弹性计算层可以扩展以满足最苛刻和不可预测的分析工作负载,”他说。

然而,尽管Snowflake专注于数据治理和隐私保护,并且能够将计算与存储分离,PowerSchool在确定需要新的数据管理供应商时并没有立即选择Snowflake。

PowerSchool进行了广泛的新数据管理供应商搜索。它已经是AWS、Google Cloud和Microsoft的合作伙伴,因此它查看了这些公司的数据管理生态系统以及其他供应商的生态系统。

最终,尽管与Snowflake没有之前的合作历史,但它在2021年10月选择了该供应商作为其数据管理和分析计划的支柱。

“我们进行了非常正式的深入评估,并对Snowflake在初步概念验证中的表现感到非常满意,然后决定这是我们所需的平台,”Stumpf说。“我们对此决定非常满意。”

与Snowflake共同发展

当PowerSchool在2021年底开始使用Snowflake时,Snowflake主要专注于数据管理。PowerSchool也是如此,它只需要一个能够满足其日益增长的数据需求的数据管理平台。

然而,随着在2022年11月推出ChatGPT,Snowflake的重点发生了变化,激发了对生成性AI的兴趣。

由于数据是任何AI模型或应用的基础,许多数据管理供应商——包括Snowflake的竞争对手Databricks——开始为客户创建开发AI工具(如自然语言助手)的环境。他们开始添加向量搜索、检索增强生成和与大型语言模型(LLMs)的集成等功能。

Snowflake也在其中。尽管在拥抱AI开发方面可能比某些公司稍慢,但自从2月份更换首席执行官以来,该供应商在开发旨在使客户能够构建AI工具的环境方面表现得非常积极。

其当前的AI开发套件,一个名为Cortex AI的托管服务,包含旨在使客户能够轻松创建AI聊天机器人和代理——超越问答能力的AI助手——以及其他AI应用的功能和集成。此外,它还包括Snowpark容器服务,这是一个托管服务,能够安全地部署AI应用。

“我们处理复杂的管理工作,以便客户能够专注于快速在其组织中部署AI和,以推动业务价值,”Klahr说。

最近,Snowflake与AI供应商Anthropic建立了合作关系,以优化其代理以适应Anthropic的LLMs,并收购了Datavolo以改善数据集成。

PowerSchool的主要目标是以单一、受管控的方式使客户的所有数据可用,并实时提供,以便用于决策的数据尽可能完整和最新。

据Stumpf说,Snowflake与执行数据摄取和数据可观察性等任务的其他平台合作,使PowerSchool能够实现这一目标。特别是,Snowflake的计算与存储分离是实现实时数据交付的关键。

然而,现在,正如Snowflake已经超越数据管理发展到包括AI开发能力一样,PowerSchool的目标也从实时分析扩展到使用AI实现更明智的决策。

像许多行业中的企业一样,PowerSchool开发了生成性AI助手,使用户能够使用自然语言而非代码向数据提问,从而将分析的使用扩展到小部分技术专家之外。

在1月份,PowerSchool利用其在Snowflake中整合的数据以及来自Snowflake的AI开发能力工具——其中包括Snowpark容器服务——以及Microsoft的Azure AI Studio,推出了PowerBuddy,这是其版本的AI助手。

“数据确实为我们的PowerBuddy提供了智能,”Stumpf说。“我称之为‘与数据对话'。它允许一位校长、一位校长和其他非技术用户提出自然语言问题。”

例如,管理员可以使用自然语言提出复杂的数据相关问题,例如某个年级在特定时期缺席的学生人数及其数学成绩低的情况,以获取即时答案。

与此同时,家长可以使用PowerBuddy询问他们的孩子是否提交了作业,或了解他们的孩子在考试中的表现。学生也可以使用PowerBuddy来帮助他们完成作业和其他任务。

“我们在后台做了大量工作,因此现在任何用户都可以提出自然语言问题,”Stumpf说。“这个想法是,教育界的每一个人,无论是家长、学生、管理员、顾问还是校长,都可以使用一个提供与其相关信息的助手。”

自1月份以来,PowerSchool推出了五个PowerBuddy助手,每个助手都经过不同数据的训练以响应问题。

截至目前,PowerSchool已经为评估推出了PowerBuddy助手,以便教育工作者可以创建学生评估;为大学和职业准备的学生提供帮助;为分析师和IT团队提供与数据对话的助手;为家长提供提问的方式的助手;以及帮助教师创建教学内容的助手。每个助手都可以个性化以满足用户的需求。

据Stumpf称,PowerBuddy在近250个学区中使用,覆盖超过300万名学生。

同时,考虑到从学生进入幼儿园到高中所收集的所有数据点,AI提供的分析比人类更全面、更准确。

“人类无法分析所有这些数据点,”Stumpf说。“它可以告诉你哪些科目是某人掌握的,这是他们的熟练程度,这是他们需要额外帮助的地方。它利用所有这些数据点来帮助教师理解所有学生,帮助学生理解他们需要的支持,帮助家长理解他们的孩子需要的支持。”

开始并渴望更多

尽管PowerSchool正在享受转向Snowflake的好处,但开始使用新系统并非小事。尽管相对顺利,PowerSchool向Snowflake过渡其数据管理和分析需求的过程并非没有一些波折。

根据Stumpf的说法,PowerSchool在更改数据平台时有两个初步优先事项。一个是为其学生数据构建一个安全的数据湖,涵盖从幼儿园到12年级。

“这是我们想要提供给客户的一项全新服务,”Stumpf说。

另一个是将所有现有的分析工作负载从旧系统迁移到Snowflake。

根据Stumpf的说法,第一项倡议,从零开始构建数据湖,相对简单。然而,将数据从旧数据管理平台迁移到Snowflake并不那么顺利。

PowerSchool无法简单地将数据从旧系统中提取并放入Snowflake。相反,PowerSchool的数据团队不得不重新设计其数据以使其与Snowflake兼容,这是一项劳动密集型且耗时的过程,考虑到涉及的数据量和关于学生数据的独特隐私要求。

“这确实花费了比我们最初预期的更长的时间,”Stumpf说。“我们不得不进行大量的重写和调整。”

最终,数据迁移任务完成了,PowerSchool能够完成其首个倡议。如今,三年后,它正在构建创新的AI应用,以更好地满足数千万学生和教育工作者的需求。

与此同时,Snowflake优先考虑使入驻过程尽可能无痛,并旨在帮助客户在初始项目之外扩展,Klahr说。因此,PowerSchool与Snowflake的进展,从最初的一两个项目扩展到广泛使用,实际上是相当典型的。

“通常,像PowerSchool这样的客户会将初始的分析用例从遗留数据平台迁移到Snowflake,”他说。“从那里,他们可以开始建立强大的数据基础,然后使用Snowflake部署高级分析……并扩展到构建复杂的应用程序,利用AI和机器学习的力量来民主化访问洞察。”

现在,PowerSchool已经使用Snowflake超过三年,并扩展其使用范围超越数据管理,根据Stumpf的说法,PowerSchool确实希望从Snowflake的AI开发环境中获得更多。

由于Snowflake在推出某些属于其他供应商开发套件的功能方面进展缓慢,PowerSchool在开发和改进PowerBuddy时并不单独依赖Snowflake。PowerSchool实际上使用Microsoft的Azure AI Studio与其Snowflake数据结合,而不是使用Cortex AI,后者的大部分功能仍处于预览阶段且尚未普遍可用。

一个具体的愿望是希望Snowflake提供比目前更多的LLM访问权限。随着Anthropic(Claude系列LLM的开发者)成为合作伙伴,Snowflake与七个LLM开发者提供集成,包括Google、Meta和Mistral AI。

一个不在Snowflake生态系统中的LLM提供商是OpenAI,其GPT模型仍然是最受欢迎且表现最好的模型之一。

“我们希望在Snowflake中看到更多生成性AI模型,”Stumpf说。“这将使我们能够更好地利用Cortex和其他AI能力。目前,他们可用的一些模型在准确性和性能方面与我们的需求不符。”

此外,访问开源LLM将是有益的,她继续说道。开源模型比专有模型需要更多的微调,但它们更具成本效益。

“我们目前正在测试不同的模型,但OpenAI的GPT模型无疑是目前的首选,”Stumpf说。

Snowflake 推动教育科技供应商的数据和人工智能计划

教育科技供应商PowerSchool正在利用Snowflake的数据管理和AI开发能力来改善学生体验。

未来

随着PowerSchool继续扩展其数据使用并开发更多AI工具,Snowflake旨在继续为这一教育科技供应商提供所需工具。

随着许多AI开发能力处于预览阶段——其中许多于11月12日推出,包括专为开发代理AI工具而设计的工具,以及在春季黑客通过用户密码访问Snowflake环境后增加的安全措施——Snowflake正在继续解决和改善AI开发。

“PowerSchool是一个激励人心的例子,展示了正确的数据和AI策略如何转变企业,”Klahr说。“我们自豪地说,Snowflake是他们值得信赖的合作伙伴。”

与此同时,PowerSchool计划利用数据进一步改善所有相关人员的教育体验。在2024年推出PowerBuddy的初始版本后,该公司希望利用其数据和AI提供的不仅仅是一个提供即时访问智能的对话界面。

PowerSchool希望利用关于每个学生的所有数据点——确切地说,平均171,955个——来创建个性化的教育体验,Stumpf说。

“对我们来说,理想的状态是为每个学生提供个性化的学习路径,以便他们能够以最适合他们的方式最大化潜力,”她说。

这包括考虑从学生的校车路线等看似微不足道的数据到特殊教育和语言适应等关键要素,Stumpf继续说道。

“如果我们能够真正利用这171,955个数据点,为某人个性化体验,以最大化他们的潜力,而这是人类之前从未能够做到的,那对我和PowerSchool来说就是成功。”

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...