机器学习和人工智能正在改变企业的运作方式:提高效率、简化工作流程、建立一致性、维护安全性和合规性,并创造新的收入和增长机会。
数据令人印象深刻。根据行业研究,预计到2029年,机器学习市场的估值将超过2000亿美元,而到2030年,人工智能产品预计将超过1万亿美元。
随着机器学习和人工智能的进步,生成性人工智能的出现为处理、创建和使用复杂数据提供了新的方式,但也给企业带来了新的挑战。在开展任何人工智能项目之前,信息技术和商业领导者应该了解机器学习的基本原理以及诸如生成性人工智能等最近的进展。
什么是机器学习?
机器学习是一个软件工程领域,它分析数据以寻找模式,然后利用这些模式来帮助人类根据大量相似的新旧数据做出决策——有些数据对人类观察者可能看起来只是次要的。实际上,机器学习算法关注过去的决策或因果关系模式,然后尝试预测性地重复这些相同的决策,以帮助用户或企业。
本文是
什么是生成性人工智能?生成性人工智能解读
- 其中还包括:
- 2024年八大生成性人工智能工具类别
- 人工智能会取代工作吗?17种可能受到影响的职业类型
- 2024年最佳大型语言模型的19个实例
举个简单的例子,假设一位老师访问了一个零售网站,习惯性地购买铅笔。作为人工智能驱动的个人购物助手实施的机器学习平台能够识别这个回头客,包括他们购买铅笔的历史记录。
考虑到网站现有的库存和可用性,个人购物工具可以向该客户展示一份可用铅笔的短名单,数量与他们平常的购买量相符。这节省了购物者的时间,提高了他们的购物体验,并增加了销售的潜力。
机器学习依赖于一系列算法来构建针对特定目的的软件模型。该模型经过系统训练,以通过访问现有数据来提供多种输出。可以选择最理想或最吸引人的输出,以根据一组参数增强模型的学习。
因此,模型通常会经历初步训练和验证,并随着更多输入、数据、响应和选择的可用性而不断完善。这创造了自我学习的能力,几乎不需要人类干预。
机器学习模型需要访问大量数据资源以进行学习和正常运行,并且往往需要定期更新和重新训练,因为数据在不断演变和变化,数据质量水平随时间而异。这种持续的训练是每个人工智能驱动的企业都应接受的机器学习模型管理的重要组成部分。
机器学习的应用案例
机器学习算法可以处理主要商业领域的各种任务。
零售
如前面所描述的例子,机器学习算法可以利用过去和当前的销售数据来个性化优惠、进行产品推荐或启用推荐系统、预测销售和订货量——间接转化为制造和物流规划——并根据访客的浏览和购买行为进行个性化服务。
商业
机器学习算法可以访问大量商业数据,以协助完成多种任务,例如识别趋势;预测商业结果;发现性能、流程或供应链瓶颈。
医疗保健
机器学习算法可以利用患者数据来帮助诊断或追踪感染模式,例如监测COVID-19大流行期间的暴露情况。
制造业
机器学习算法可以利用来自物联网设备的数据来追踪制造机器的性能,监控材料和流程工作流,并推荐流程优化。
金融服务
机器学习可以协助银行和金融服务行业完成如防止欺诈、洗钱预防、个性化财务规划和整体流程优化等任务。
客户服务与支持
机器学习算法是交互式聊天工具的基础,帮助客户解决问题,从而提高用户参与度并帮助找到适合的解决方案以应对常见客户问题。
营销
机器学习算法可以模拟重要的营销考虑因素,例如客户流失、定向和细分,从而实现更高效和有效的销售工作。
物流与运输
机器学习能够处理来自车辆性能传感器、道路传感器和GPS等车辆定位系统的综合数据,以及天气和交通数据,以为物流操作和车队维护提供详细计划。
什么是生成性人工智能?
生成性人工智能在机器学习的基础上增加了新的功能,使其能够根据用于训练模型的现有数据创造或合成新数据,例如文本或图像。
生成性人工智能工具可以使用来自多个机器学习学科的算法和见解,包括自然语言处理和计算机视觉。生成性人工智能应用中常见的一些复杂模型包括:
- 生成对抗网络。 GAN 是一种重要的深度学习算法。它依赖于多个神经网络,这些网络相互竞争,以产生基于现有数据的更理想的新数据。一个网络,生成器,创建新输出,而另一个,判别器,试图判断新数据是真实的还是人工智能生成的。随着时间推移,生成器创造原始数据的能力逐渐提高,直到判别器无法再区分新数据与原始数据。
- 变换器。这些模型利用一种称为自注意力的数学技术以及神经网络,来识别上下文并建立数据点之间的关系。变换器是许多人工智能应用的基础,包括文本到语音转换和基于理解DNA中的基因序列的药物研究。
- 扩散。扩散模型根据其训练数据创建新数据。正是扩散使得生成性人工智能能够,例如,以像毕加索这样的大师风格创建图像。实际上,扩散首先将原始图像还原为一组像素,然后使用用户提示的元素和风格重建图像。
- 自回归模型。自回归模型通过检查序列中之前的或回归的元素自动预测序列的下一个元素。这些模型非常适合与时间相关的事件,例如股票价格预测、天气预测和交通预测。
- 大型语言模型。像 ChatGPT 这样的流行生成性人工智能平台使用 LLM 来解释用户查询(称为提示),然后生成复杂的文本、图像甚至软件代码作为响应。
- 变分自编码器。 VAE 是一个由编码器和解码器组成的无监督神经网络。编码器学习简化数据,捕获输入的基本特征。解码器接受简化的输入并反向处理,从而创建出与训练数据集中的示例相似的新内容。
- 递归神经网络。 RNN 是旨在将输入数据转换为特定输出的深度学习模型。通过对每个输入使用相同的参数,它可以减少参数的复杂性。 RNN 非常适合语言翻译、语音识别和其他自然语言处理任务。
- 多模态人工智能。多模态AI模型可以解读多种类型的数据,例如图像、文本、音频和视频。例如,一个多模态模型可以根据文本提示生成带有背景音乐的视频。
在实践中,生成性人工智能的运作方式与其他机器学习系统相似。生成性人工智能系统首先在相关数据上进行广泛训练。一旦训练完成,生成性人工智能系统接受用户提示,这些提示概述了请求内容,并可以包含高度结构化和复杂的元素。
生成性人工智能系统将提示转换为特定元素,并将输出发送给用户。在许多情况下,结果随后可以由人类用户进行评分或评估,用户反馈有助于进一步训练和优化生成性人工智能系统。
如今,生成性人工智能借助基础模型得到了扩展,这些模型使用在大量一般和未标记数据上训练的大型深度学习神经网络。这些基础模型往往可以用作新的人工智能平台,帮助企业快速启动人工智能项目,集中精力关注最终结果——例如理解语言、生成文本、创建图像或进行自然对话——而不是从零开始构建一个人工智能系统。
生成性人工智能的局限性
生成性人工智能迅速获得了强大和创造性工具的声誉。然而,它也有显著的局限性。
首先,生成性人工智能无法想象;它只能利用其训练数据进行合成。这使得生成性人工智能的输出是独特的,但不一定是原创的。例如,如果用户请求一种以毕加索风格绘制的图像,而该生成性人工智能工具从未接受过毕加索画作的训练,那么模型无法理解该请求或在其输出中模仿毕加索的风格。这一局限性还引发了有关原创性、版权和知识产权所有权的问题。
其次,生成性人工智能并非完美。它并不具备完美的理解能力,不能在所有情况下或针对所有提示生成理想的输出。与其他人工智能一样,生成性人工智能可能会产生奇怪、不准确或意外的结果,这些结果可能与用户的提示不符,这种现象被称为幻觉。
生成性人工智能的应用案例
企业正在各个主要领域中采用生成性人工智能,而这些领域以往则出现了较老版本的机器学习。生成性人工智能和其他类型机器学习(如预测人工智能)的应用案例之间的区别主要在于用例的复杂性和涉及的数据处理类型。
较简单的机器学习算法通常在更直接的因果关系基础上运作。相比之下,生成性人工智能工具可以提供更深入和更具创造性的响应,从而产生新的应用案例。
零售
生成性人工智能可以根据销售趋势、库存水平或竞争数据等动态条件更新产品展示图(即平面图);甚至定价也可以动态调整。生成性可视化工具可以创建人们穿戴或使用不同产品的图像,使虚拟试穿成为可能。人工智能还可以生成详细的产品描述以及定制促销和产品推荐。
商业
生成性人工智能可以利用非结构化内容(比如地图、目录、订单和供应链关系、电子邮件以及大型文件集)寻找商业价值。先进的聊天机器人可以自动将复杂问题翻译成潜在语义含义,分析这些含义以获取上下文,然后生成高准确度的对话响应,以提供下一代自动化帮助。
医疗保健
生成性人工智能能够自动转录和总结临床记录,解释图像和测试结果以辅助诊断,甚至根据基因、生活方式和症状等复杂因素为患者生成个性化的治疗方案。
制造业
生成性人工智能可以生成和评估设计选项,帮助制造商选择最优化、高效和具有成本效益的设计和流程,同时提高供应链的可见性。同样,生成性人工智能可以发现见解并验证模型,以协助设计和制造。生成性人工智能模型可以超越较老的机器学习形式,利用诊断来诊断设备故障并推荐行动,甚至指导技术人员进行维修和保养。
金融服务
生成性人工智能可以支持精心策划的投资策略和组合,以实现特定的财务目标,甚至驱动新的金融顾问或财富管理服务,服务于经纪客户和顾问。大型语言模型也可以支持高级工具,例如使用自然语言进行股票筛选。此外,它们还可以处理和生成大量财务文档,例如商业备案、贷款文件、保险政策和法规文件。
客户支持
生成性人工智能建立在现有聊天机器人之上,能够解析和解释上下文和语义——甚至用户的压力水平或情绪状态——通过语言界面。这使得各类市场的虚拟助手能够更加灵敏和准确。
概述:生成性人工智能与机器学习
简单地说,机器学习教会计算机理解某些数据并执行某些任务。生成性人工智能在此基础上增加了新功能,试图模拟人类的智能、创造力和自主性。
生成性人工智能 | 机器学习 |
让机器通过模拟人类智能来解决问题,并支持复杂的人际交互。 | 让机器在过去的数据上进行训练,并从新数据中学习,具备一定层次的自主性。 |
旨在创造一个能够执行复杂任务和交互的系统,并具备一定的自主性。 | 旨在通过学习数据来不断增强和改善模型的准确性。 |
具有广泛的潜在应用和多样化的能力。 | 具有广泛的潜在应用,但能力相对较窄。 |
模仿人类决策。 | 使用算法学习并操作预测模型,协助人类决策。 |
处理所有类型的数据,包括结构化、半结构化和非结构化数据。 | 通常只使用结构化和半结构化数据,因为机器学习算法在处理非结构化数据时会由于缺乏上下文而遇到困难。 |
使用逻辑和决策学习,最终随时间进行推理、调整和自我修正。 | 使用统计模型进行学习,但只能通过用户反馈或新数据进行调整或自我修正。 |
适合于图像合成、文本生成、音乐创作及其他与创造性工作和数据变更相关的任务。 | 在垃圾邮件过滤和物体识别等数据分类和回归中有用。 |
能够根据现有或训练的数据创造或合成新数据。 | 只能使用现有数据,无法创造新数据。 |
简单的机器学习模型有时可以回答问题,但其范围有限,通常不会以任何显著的自主性执行任务。例如,一个机器学习模型或系统可能分析商业数据以寻找商业机会,但它只能对已有数据做出反应,并根据用户的查询进行行动。
相比之下,生成性人工智能工具可以作为虚拟助手,提供更全面的支持。例如,生成性人工智能助手可以接听电话,并使用自然语言与用户互动,动态收集用户的信息,诊断问题,处理日程安排,并引导来电者完成诊断和解决方案。
虽然机器学习提供了明确的洞察,其数据来源可以很好地记录,但使用生成性人工智能给企业和用户带来了额外的挑战。生成性人工智能的一个核心问题是知识产权(IP)所有权。企业必须解决当产出最终是其他知识产权输入的合成时,谁拥有产出的问题。例如,如果10本关于某一主题的书籍输入到生成性人工智能平台,且这些书籍中的大部分甚至全部书籍的内容都涉及到生成的输出,那么谁真正拥有这个输出,并能够合理主张版权或其他知识产权的所有权?这些问题及其他问题必须在生成性人工智能进入商业主流之前得以明确解决。
斯蒂芬·J·比格洛(Stephen J. Bigelow),TechTarget的高级技术编辑,拥有超过30年的个人电脑和技术产业技术写作经验。