苹果原本计划在上个月随iOS 18.4的发布推出备受期待的个性化Siri功能。然而,后来确认这一新功能将推迟到明年发布。最近有报道称,分享了苹果如何训练其AI模型的细节,涉及到苹果智能技术。

苹果的AI模型通过合成电子邮件变得更智能,同时确保用户隐私的完全保护
尽管苹果官方表示个性化Siri功能将推迟到明年,但公司内部员工对这一功能在今年晚些时候发布的信心正在增强。在一份新报告中,彭博社强调了苹果如何为苹果智能技术训练其AI模型。报告引用了苹果机器学习研究网站的一篇博客文章,描述了苹果如何利用合成数据来训练其AI模型。
我们之前多次报道,苹果在AI竞争中落后于对手,而该公司使用合成数据训练AI模型的策略有些不寻常,并且存在局限性。首先,当涉及到需要更长句子或完整电子邮件的摘要或写作工具时,数据“理解趋势”是相当繁琐的。
苹果注意到了这一点,并强调了一项新技术,该技术将通过将合成数据与最近用户电子邮件的样本进行比较来规避这些限制。然而,这一过程并不妨碍用户隐私。
为了改进我们的模型,我们需要生成一组涵盖消息中最常见主题的电子邮件。为了策划一组具有代表性的合成电子邮件,我们首先创建一大组关于各种主题的合成消息。例如,我们可能会创建一条合成消息:“你明天11:30想打网球吗?”
这一过程是在没有任何个别用户电子邮件知识的情况下完成的。然后,我们为每条合成消息生成一个表示,称为嵌入,捕捉消息的一些关键维度,如语言、主题和长度。这些嵌入随后被发送到少量选择参与设备分析的用户设备上。
参与的设备然后选择一小部分最近的用户电子邮件并计算它们的嵌入。每个设备接着决定哪些合成嵌入与这些样本最接近。通过差分隐私,苹果可以学习所有设备中最常被选择的合成嵌入,而无需了解任何特定设备上选择了哪个合成嵌入。
这些最常被选择的合成嵌入可以用于生成训练或测试数据,或者我们可以进行额外的策划步骤以进一步完善数据集。例如,如果关于打网球的消息是最顶尖的嵌入之一,可以生成一条类似的消息,将“网球”替换为“足球”或其他运动,并将其添加到下一轮策划的集合中(见图1)。这一过程使我们能够改善合成电子邮件的主题和语言,帮助我们训练模型在电子邮件摘要等功能中生成更好的文本输出,同时保护隐私。
尽管公司意识到这些局限性,但它解释说,新技术将使其能够在不妨碍用户隐私或收集信息的情况下,更好地理解整体趋势。彭博社还声称,该公司将在iOS 18.5和macOS 15.5的新测试版中发布这一新技术。您可以查看苹果在此事上的完整帖子以获取更多细节。