人工智能,或者说现代概念的人工智能,已经伴随我们数十年,但仅在最近,人工智能才真正吸引了日常商业和社会的集体关注。
人工智能是指计算机和系统执行通常需要人类认知的任务的能力。我们与人工智能的关系是共生的。它的触角渗透到我们生活和生计的各个方面,从早期癌症患者的检测和更好的治疗,到为各种规模的企业创造新的收入来源和更顺畅的运营。
人工智能可以被视为大数据在收集、分析、民主化和货币化信息方面的伟大平衡器。我们每天产生的数据洪流对于训练和改善人工智能系统至关重要,这些系统的任务包括更高效地自动化流程、产生更可靠的预测结果以及提供更强大的网络安全。
漫步人工智能时间线
20世纪50年代人工智能的引入与原子时代的开始有着密切的平行关系。尽管它们的演变路径不同,但这两种技术都被视为对人类构成生存威胁。
本文是
企业人工智能指南的一部分
- 其中还包括:
- 人工智能如何推动收入?这里有10种方法
- 8个人工智能无法替代的工作及其原因
- 2024年十大人工智能和机器学习趋势
多年来,人工智能和原子分裂在世界末日观察者的视角中得到了相对平等的对待。在他们看来,人类注定要在由机器人接管地球引发的核浩劫中自我毁灭。围绕生成式人工智能(GenAI)的焦虑并未缓解他们的恐惧。
尽管对人工智能阴暗面有种种看法,自1950年图灵测试问世以来,人工智能工具和技术取得了令人难以置信的进展——尽管由于资金的不稳定,研究经历了间歇性的过山车式波动。许多突破性进展在过去十年之前大多未被广泛关注,主要为学术界、政府和科学研究圈所知,直到人工智能被实际应用于大众的需求和愿望。像苹果的Siri和亚马逊的Alexa这样的人工智能产品、在线购物、社交媒体动态以及自动驾驶汽车,永远改变了消费者的生活方式和企业的运营。
几十年来,一些更显著的发展包括:
- 20世纪50年代的神经网络以及人工智能和机器学习术语的创造。
- 20世纪60年代的Eliza,具有认知能力的聊天机器人,以及Shakey,第一款移动智能机器人。
- 20世纪70年代和80年代的人工智能寒冬和复兴。
- 20世纪90年代的语音和视频处理。
- 20世纪00年代的IBM Watson、个人助手、人脸识别、深度伪造、自动驾驶汽车、GPT内容和图像生成,以及栩栩如生的GenAI克隆。
1950年
艾伦·图灵发表了《计算机与智能》,引入了图灵测试,为人工智能的诞生打开了大门。
1951年
马文·明斯基和迪恩·埃德蒙兹开发了第一个人工神经网络(ANN),称为SNARC,使用3000个真空管模拟40个神经元的网络。
1952年
亚瑟·塞缪尔开发了塞缪尔跳棋程序,这是世界上第一个自学习的游戏程序。
1956年
约翰·麦卡锡、马文·明斯基、纳撒尼尔·罗切斯特和克劳德·香农在一项提案中创造了“人工智能”一词,该提案被广泛认为是人工智能领域的奠基事件。
1958年
弗兰克·罗森布拉特开发了感知器,这是一种早期的人工神经网络,能够从数据中学习,并成为现代神经网络的基础。
约翰·麦卡锡开发了编程语言Lisp,该语言迅速被人工智能行业采用,并在开发者中获得了巨大的普及。
1959年
亚瑟·塞缪尔在一篇开创性论文中创造了“机器学习”一词,解释了计算机可以被编程以超越其程序员。
奥利弗·塞尔弗里奇发表了《Pandemonium: A Paradigm for Learning》,这是对机器学习的重要贡献,描述了一种能够自适应改进以发现事件模式的模型。
1964年
丹尼尔·博布罗开发了STUDENT,这是一个早期的自然语言处理(NLP)程序,旨在解决代数文字问题,当时他是麻省理工学院的博士候选人。
1965年
爱德华·费根鲍姆、布鲁斯·G·布坎南、约书亚·莱德伯格和卡尔·德贾拉西开发了第一个专家系统Dendral,帮助有机化学家识别未知的有机分子。
Eliza为今天的聊天机器人铺平了道路。
1966年
约瑟夫·韦岑鲍姆创建了Eliza,这是有史以来最受欢迎的计算机程序之一,能够与人类进行对话,并让他们相信软件具有类人情感。
斯坦福研究所开发了Shakey,这是世界上第一款结合人工智能、计算机视觉、导航和自然语言处理的移动智能机器人。它是自动驾驶汽车和无人机的祖先。
1968年
特里·温诺格德创建了SHRDLU,这是第一款多模态人工智能,能够根据用户的指令操纵和推理出一个由方块组成的世界。
1969年
亚瑟·布赖森和余志豪描述了一种反向传播学习算法,使多层人工神经网络成为可能,这比感知器有了更大的进步,并为深度学习奠定了基础。
马文·明斯基和西摩·帕帕特出版了《感知器》一书,描述了简单神经网络的局限性,导致神经网络研究的衰退,而符号人工智能研究却蓬勃发展。
1973年
詹姆斯·莱特希尔发布了《人工智能:一般调查》报告,导致英国政府大幅减少对人工智能研究的支持。
1980年
Symbolics Lisp机器商业化,标志着人工智能的复兴。几年后,Lisp机器市场崩溃。
1981年
丹尼·希利斯为人工智能和其他计算任务设计了并行计算机,这种架构与现代GPU相似。
1984年
马文·明斯基和罗杰·香克在人工智能促进协会的一次会议上创造了“人工智能寒冬”一词,警告商业界人工智能的炒作将导致失望和行业的崩溃,这在三年后发生了。
1985年
裘达·佩尔介绍了贝叶斯网络因果分析,为计算机表示不确定性提供了统计技术。
1988年
彼得·布朗等人发表了《一种统计方法的语言翻译》,为一种广泛研究的机器翻译方法铺平了道路。
1989年
扬·勒昆、约书亚·本吉奥和帕特里克·哈夫纳演示了卷积神经网络(CNN)如何用于识别手写字符,表明神经网络可以应用于现实世界问题。
神经网络具有不同的特性。
1997年
塞普·霍赫赖特和于尔根·施密特胡伯提出了长短期记忆递归神经网络,可以处理整个数据序列,如语音或视频。
IBM的深蓝在历史性的国际象棋复赛中击败了加里·卡斯帕罗夫,成为第一个在比赛条件下击败现任世界象棋冠军的计算机。
2000年
蒙特利尔大学的研究人员发表了《一种神经概率语言模型》,提出了一种使用前馈神经网络建模语言的方法。
2006年
李飞飞开始研究ImageNet视觉数据库,该数据库于2009年推出,成为人工智能热潮的催化剂,并为图像识别算法的年度竞赛奠定了基础。
IBM Watson的初衷是击败人类,参加经典的问答节目《危险边缘》。在2011年,这个问答计算机系统击败了该节目的历史冠军肯·詹宁斯。
2009年
拉贾特·雷纳、阿南德·马达万和安德鲁·吴发表了《使用图形处理器的大规模深度无监督学习》,提出了利用GPU训练大型神经网络的想法。
2011年
于尔根·施密特胡伯、丹·克劳迪乌·奇雷山、乌埃利·梅耶和乔纳森·马斯基开发了第一款CNN,获得了“超人类”性能,赢得了德国交通标志识别比赛。
苹果发布了Siri,这是一款语音驱动的个人助手,可以根据语音请求生成响应和执行操作。
2012年
杰弗里·辛顿、伊利亚·苏茨凯弗和亚历克斯·克里兹赫夫斯基推出了一种深度CNN架构,赢得了ImageNet挑战,并引发了深度学习研究和实施的爆炸性增长。
2013年
中国的天河-2在33.86 petaflops的速度上将世界顶级超级计算机的速度翻了一番,连续第三次保持世界最快系统的称号。
DeepMind引入了深度强化学习,这是一种基于奖励学习的CNN,通过重复学习玩游戏,超越人类专家水平。
谷歌研究员托马斯·米科洛夫及其同事推出了Word2vec,以自动识别单词之间的语义关系。
2014年
伊恩·古德费洛及其同事发明了生成对抗网络,这是一类用于生成照片、转换图像和创建深度伪造的机器学习框架。
迪德里克·金马和马克斯·威林推出了变分自编码器,用于生成图像、视频和文本。
Facebook开发了深度学习人脸识别系统DeepFace,可以以接近人类的准确度识别数字图像中的人脸。
2016年
DeepMind的AlphaGo在韩国首尔击败了顶级围棋选手李世石,引发了与近20年前深蓝与卡斯帕罗夫国际象棋比赛的比较。
优步在匹兹堡启动了自动驾驶汽车试点项目,专门为一小部分用户提供服务。
改变商业运营方式的人工智能技术五大支柱。
2017年
斯坦福研究人员在论文《使用非平衡热力学的深度无监督学习》中发布了扩散模型的研究。该技术提供了一种逆向工程的方法,将噪声添加到最终图像中。
谷歌研究人员在开创性论文《注意力机制是你所需的一切》中发展了变换器的概念,激发了后续研究,开发能够自动解析未标记文本的大型语言模型(LLMs)的工具。
英国物理学家斯蒂芬·霍金警告说:“除非我们学会如何准备和避免潜在风险,否则人工智能可能是我们文明历史上最糟糕的事件。”
2018年
由IBM、空客和德国航空航天中心DLR开发的Cimon是第一款被送入太空以协助宇航员的机器人。
OpenAI发布了GPT(生成预训练变换器),为后续的LLMs铺平了道路。
Groove X推出了一款名为Lovot的家庭迷你机器人,能够感知和影响人类的情绪变化。
2019年
微软推出了具有170亿参数的图灵自然语言生成生成模型。
谷歌人工智能和朗戈医疗中心的深度学习算法在检测潜在肺癌方面超越了放射科医生。
2020年
牛津大学开发了一种名为Curial的人工智能测试,能够快速识别急诊室患者的COVID-19。
OpenAI发布了包含1750亿参数的GPT-3 LLM,以生成类人文本模型。
Nvidia宣布其Omniverse平台的测试版,以在物理世界中创建3D模型。
DeepMind的AlphaFold系统赢得了蛋白质折叠竞赛的关键评估。
2021年
OpenAI推出了Dall-E多模态人工智能系统,可以根据文本提示生成图像。
加州大学圣地亚哥分校创建了一款四足软机器人,使用压缩空气代替电子元件进行工作。
2022年
谷歌软件工程师布雷克·勒莫因因揭露Lamda的机密并声称其具有意识而被解雇。
DeepMind推出了AlphaTensor“用于发现新颖、高效且可证明正确的算法。”
英特尔声称其FakeCatcher实时深度伪造检测器的准确率为96%。
OpenAI于11月发布了ChatGPT,为其GPT-3.5 LLM提供了基于聊天的界面。
2023年
OpenAI宣布了处理文本和图像提示的GPT-4多模态LLM。微软将ChatGPT集成到其搜索引擎Bing中,谷歌发布了其GPT聊天机器人Bard。
埃隆·马斯克、史蒂夫·沃兹尼亚克和数千名其他签署人呼吁暂停培训“比GPT-4更强大的人工智能系统”六个月。
2024年
生成式人工智能工具继续迅速发展,改进了模型架构、提高了效率并获得了更好的训练数据。直观的界面推动了广泛的采用,即使在关于偏见、能源消耗和工作替代等问题的持续担忧中。
谷歌对其Bard GenAI聊天机器人的重新品牌化开局不顺,因为新命名的Gemini因生成多位历史人物的不准确图像而受到严重批评,包括乔治·华盛顿和其他开国元勋,以及许多其他事实上的不准确性。谷歌推出的AI概述提供了主题的快速摘要和深入研究的文档链接,加剧了人们对其搜索引擎垄断的担忧,并在传统出版商和在线出版商之间引发了关于知识产权控制的更多问题。
欧洲议会通过了人工智能法案,规定了随着时间推移将适用的条款,包括行为规范、禁止那些“不可接受风险”的人工智能系统以及对通用人工智能系统的透明度要求。
科罗拉多州成为第一个实施广泛人工智能使用法规的州,称为科罗拉多人工智能法案,要求人工智能系统的开发者“合理谨慎地保护消费者免受任何已知或合理可预见的算法歧视风险。”加利福尼亚州立法机构通过了几项与人工智能相关的法案,定义了人工智能并对最大人工智能模型、生成式人工智能训练数据透明度、算法歧视和选举中的深度伪造进行监管。美国超过一半的州已提出或通过某种形式的针对性立法,涉及人工智能在政治竞选、教育、犯罪数据、性犯罪和深度伪造中的使用。
Delphi推出了GenAI克隆,允许用户创建栩栩如生的数字版本,从公司首席执行官在Zoom会议中出席的肖像到在YouTube上回答问题的名人。
2025年及以后
预计企业在生成式人工智能上的支出将在未来几年超过1万亿美元。彭博社预测,生成式人工智能产品“可能会增加约2800亿美元的新软件收入,推动专业助手、新基础设施产品和加速编码的副驾驶。”
随着生成式人工智能的兴起,人工智能在商业流程、自动化系统、制造、医疗保健、金融服务、市场营销、客户体验、工作环境、教育、农业、法律、IT系统和管理、网络安全以及地面、空中和太空运输等领域的持续技术进步和影响仍在初期阶段。
到2026年,Gartner报告称,“实现人工智能透明度、信任和安全的组织将看到其人工智能模型在采用、商业目标和用户接受度方面提高50%。”然而,Gartner分析师丽塔·萨拉姆在7月的数据与分析峰会上透露,企业高管“急于看到生成式人工智能投资的回报……[并且]组织在证明和实现价值方面面临困境。”因此,研究公司预测,到2025年底,至少30%的生成式人工智能项目将因“数据质量差、风险控制不足、成本上升或商业价值不明确”而被放弃。
今天的具体进展——有些是渐进的,有些是颠覆性的——正在推动人工智能实现人工通用智能的最终目标。在这方面,神经形态处理显示出模仿人类脑细胞的潜力,使计算机程序能够同时而非顺序地工作。在这些和其他令人震惊的进展中,信任、隐私、透明度、问责制、伦理和人性等问题已浮出水面,并将继续在商业和社会中产生冲突并寻求可接受的水平。
目前已经提出或实施的美国各州和地方立法的拼凑,可能会导致一项广泛的两党国家法律,专门规范或限制人工智能的开发、部署和应用。