There are many types of AI content generators with a variety of uses for consumers and businesses.
ChatGPT,一个强大的人工智能聊天机器人,于2022年11月发布时引起了广泛关注。其发布时所使用的技术——GPT-3语言模型,实际上已经存在了一段时间。但ChatGPT使这一技术对非技术用户公开可用,并引起了人们对人工智能在内容生成方面的各种应用的关注。现在,距离其发布已经两年多,许多针对不同使用场景的AI内容生成器应运而生。
这引发了关于该技术将如何改变工作性质的问题。一些学校因担心抄袭和作弊而禁止使用该技术。其他学校则积极采用这一技术。律师们正在辩论这是否侵犯了版权及其他与数字媒体真实性相关的法律。2023年10月,乔·拜登总统还签署了一项行政命令,涉及该技术在劳动力、教育、消费者隐私及其他多个领域的机遇与风险。生成式AI有潜力改变内容创作的方式。
什么是AI生成的内容?
AI生成的内容——或称生成式AI——是指能够自动创建任何数字媒介中新内容的算法。这些算法在大量数据上进行训练。然后根据这些数据和相对较少的用户输入返回输出。但关键在于,内容是新的并且是自动生成的。
生成式AI工具中最常见的例子是ChatGPT。ChatGPT执行自然语言处理和多模态处理。它基于GPT系列的AI模型,最新的是GPT-4o。GPT-4o在互联网上的大量人类数据(音频、文本和图像)上进行训练,教会语言模型如何在与用户互动时做出响应。
本文是
什么是生成AI?生成式AI解释
- 还包括:
- 2024年8大生成式AI工具类别
- 人工智能会取代工作吗?17种可能受影响的工作类型
- 2024年19种最佳大型语言模型
其他生成式AI程序的工作方式类似。它们经过训练以发展知识体系,并利用这些知识创造新颖的输出。
许多商业生成式AI产品目前基于OpenAI的生成式AI工具,如ChatGPT和Codex。
AI生成的内容有哪些不同类型?
AI生成的内容不仅限于模仿人类作家。AI生成的内容还存在于其他媒介中,例如:
- 图像。
- 语音。
- 视频。
- 音乐。
- 代码。
尽管生成式AI可以创建多种类型的内容,但用于创建这些内容的算法通常是大型语言模型,如GPT-4和Gemini。许多内容生成器还使用多模态模型,使它们能够接受输入并以不同媒介(包括文本、图像、视频和音频)生成输出。随着时间的推移,越来越多的模型被注入多模态能力,扩展了它们的功能,不仅仅局限于书面文字。GPT-4和Gemini都是多模态的,而GPT-4的前身——GPT-3及之前的模型则不是多模态的。
生成式AI的使用方式
这些不同的媒介可以结合使用,以生成各种内容。它们可以应用于多个不同的领域,包括:
- 学术界,用于撰写论文和其他长篇内容。
- 法律,用于撰写法律文件。
- 科学,自动化和加快药物发现。
- 艺术,生成新作品和独特的内容创意。
- 制造,促进产品开发。
- 数字营销,制作文案和产品描述,以及起草社交媒体帖子。
- 软件开发,生成、修复和总结代码。
- 网络安全,执行加速威胁检测和开发恶意软件。
AI内容生成器
每种媒介都有AI内容生成工具——有些是付费的,有些是免费的。许多工具基于类似的技术,并增加功能以满足特定用户需求。以下是按内容类型组织的一些顶级内容生成器。
书面内容
- AI-Writer是一款AI写作助手,帮助重新措辞和修正现有内容,创建独特的文章草稿,提供引用列表,总结SEO竞争者,并生成来自Google的SEO优化内容。
- ChatGPT是一款基于机器学习的聊天机器人,经过训练以进行逼真的对话。该聊天机器人可以调试代码,质疑错误的前提,并拒绝响应某些请求。该模型生成令人信服的内容,但在事实准确性方面存在困难,尽管已经有所改善。它是通过强化学习进行训练,并受到OpenAI之前项目(如GPT-3和Codex)的启发。它还可以生成图像和音频,并能够接受这两种媒介作为输入。
- ChatSonic是Writesonic推出的一款对话聚焦内容生成器,基于GPT-4并增加了附加功能。用户还可以通过语音与ChatSonic互动,并选择让ChatSonic以声音回应。ChatSonic连接到Google的知识图谱,并包含来自互联网的最新信息。Writesonic为企业提供ChatSonic服务,以创建SEO优化内容。
- Claude是由Anthropic开发的一款对话AI工具,Anthropic是一家AI安全和研究实验室。Claude可以集成到企业Slack工作区中,以总结线程和回答问题。它提供了一种基于原则的方法来执行聊天机器人功能,并能够处理对抗性问题。它还提供计算机使用功能——在撰写本文时处于公共测试阶段——允许模型以人类用户的方式与计算机的GUI元素进行交互。Anthropic由两位前OpenAI员工创立。
- Docs是Google的基于云的协作文字处理器,具有生成、总结和头脑风暴文本的AI功能。Docs也与Google Gemini集成。
- Gemini是Google的对话AI工具,由同名语言模型驱动。Gemini与OpenAI的ChatGPT竞争,旨在改善人们搜索和检索信息的方式。Gemini的一个使用示例是根据家中食物请求餐点创意。另一个示例是要求它以儿童能够理解的方式解释复杂的科学概念。Gemini与ChatGPT一样是多模态的,意味着它可以处理图像和文本。Gemini还与其他Google服务(如Gmail和Google Docs)集成。
- Jasper AI是一款长篇AI文案撰写工具和文章生成器,包括80多种主要面向企业市场营销人员的AI应用。Jasper的用户界面简单易用,允许内容创作者在提示中指定SEO关键词和语气。它还与一系列第三方企业应用集成,并使客户能够根据其组织的品牌声音训练该工具。
- Magic Write是Canva Docs的AI文本生成器。用户可以提示Magic Write进行头脑风暴、生成大纲和内容创意。它是使用OpenAI的GPT系列语言模型开发的,并且也与ChatGPT集成。
- Perplexity AI是一款AI驱动的搜索引擎。它包括许多与ChatGPT提供的自然语言功能相同的功能。Perplexity的一个独特功能是它可以提供来源来支持其生成的答案。它更像是一个搜索引擎,而不是原创作家,但仍然生成原创内容。其用户界面也支持这种搜索引擎功能,具有发现页面,向用户呈现定制的内容。
- Rytr是一款AI内容生成器,允许内容创作者指定内容使用案例、语气和关键词。它还附带WordPress插件。Rytr主要面向内容写作者,旨在在生成内容时反映用户的语气。
- Spellbook by Rally是设计用于帮助律师进行法律起草的写作软件。Spellbook可以起草新的合同条款,列出基于合同的常见谈判点,并创建合同摘要。它还具有Microsoft Word插件。
- Wordtune是AI21 Labs的一款AI工具,可以执行多种通用语言任务,例如重写句子和引用来源。
图像
- Craiyon,最初称为DALL-E mini,由Google和Hugging Face的研究人员开发。它根据文本提示生成一批AI生成的图像。图像质量通常低于Midjourney、Stable Diffusion和DALL-E。
- DALL-E是OpenAI的图像生成器,可以从简单的文本提示创建图像和艺术作品。DALL-E还可以使用说明对图像进行逼真的编辑。例如,它可以移除组件并更改图像纹理。它还可以基于原始图像创建多个变体。DALL-E使用扩散技术,从随机的点模式开始创建图像。DALL-E与ChatGPT集成。
- Midjourney是独立研究实验室的图像生成器。用户可以通过Discord机器人命令或通过Web应用程序操控该生成器。它根据文本提示生成逼真的图像。一些用户指出,Midjourney的输出更像是绘画而不是照片。用户被鼓励在指定的X(前称Twitter)和Reddit页面上发布他们的作品,以帮助训练系统。
- Stable Diffusion是Stability AI的生成器,可以根据输入的文本创建逼真的图像。它还可以用于填补缺失或恶化的艺术作品,并通过DreamStudio提供易于使用的浏览器功能。Stable Diffusion使用扩散来创建图像。用户还可以通过Hugging Face访问Stable Diffusion。
音乐
- Amper music是一款从预录样本生成音乐的生成器。该软件可用于将音乐与视频匹配,用户可以指定音乐的持续时间和高潮部分的位置。
- Dadabots是一家创建生成神经网络的研究实验室。他们的作品制作出不同类型的人工音乐的实时流,并模仿乐队的原始音频神经网络。例如,他们的无限低音独奏视频是一个24/7的仿真低音噪音流。
- MusicGen是Hugging Face Space,允许用户根据描述、示例文件或直接从设备麦克风录制的声音片段生成音频。
- Soundraw是一款AI音乐生成器,可用于生成免版税的背景音乐。用户可以选择歌曲的节奏、情绪、类型和主题。
- Suno是一款根据用户文本输入生成歌曲的AI音乐生成器。用户可以使用免费账户创建有限数量的歌曲,并通过付费账户访问更多高级功能。Suno还拥有移动应用,并作为Microsoft Copilot的插件。
- Udio是一款基于用户文本输入生成音乐的AI音乐生成器。用户提供音乐类型、声乐声音或歌词等细节,然后通过进一步的文本提示修改他们的歌曲。Udio有免费和付费两个层级;付费用户可以访问音频修复等高级功能。
代码
- Aider是一款AI配对编程工具,使用户能够在本地git仓库中与LLMs一起编写代码。Aider可以连接到多种LLMs,并可以处理新项目或现有的Git仓库。
- Amazon Q Developer是来自亚马逊的AI编码助手,为AWS用户提供基于现有代码和注释的代码建议。该工具还可以突出可能造成安全漏洞的代码并建议更改。它与流行的IDE(如VSCode和Jetbrains)集成,也可以在命令行中使用。Q Developer有免费和付费两个层级。客户可以在自己的代码库上微调该工具,以提高代码建议的质量。
- CursorAI是一款AI驱动的代码编辑器,提供代码建议并与多种开发工具集成。Cursor的优势在于将AI直接引入开发环境,使其更容易访问代码库,并能够比独立工具发展更广泛的代码上下文理解。
- CodeWP是一款专门为WordPress设计的AI代码生成器。它支持JavaScript、PHP、WooCommerce、Breakdance、Oxygen和正则表达式条件。CodeWP帮助WordPress用户减少开发时间。与其他内容生成器类似,CodeWP基于小文本提示进行工作。
- GitHub Copilot是一款AI驱动的代码生成器,可以根据代码注释中的自然语言提示生成代码。例如,程序员可以写“设计一个网站着陆页”,它将生成相应的代码。对经过验证的学生、教师和开源项目维护者免费使用。其他人可以通过付费订阅或一次性30天的免费试用使用Copilot。Copilot还提供企业级,供公司开发人员作为配对程序员与内部源代码一起使用。
- Tabnine是一款编码助手,根据语法预测和生成程序员的下一行代码。Tabnine根据程序员的风格和编程模式提出建议。它支持多种语言,包括Ruby、Python、Rust和Go。它还支持多种编码环境,如IntelliJ、Visual Studio和VSCode。Tabnine非常适合对代码安全和质量有严格要求的团队。
其他
- Absci是一家药物创制公司,利用AI从头设计抗体。他们的综合药物创制平台在没有对现有目标进行先前训练的情况下设计抗体。这加快了药物发现的过程,使新药设计成为可能,并实现个性化医疗。科学家向模型提供目标蛋白,程序生成抗体作为响应。
- Bing是微软的AI搜索引擎,具有聊天机器人和图像生成功能。用户可以像使用普通搜索引擎一样查询它,它将返回完全合成的答案,而不是标准的链接列表。
- Creo是一款计算机辅助设计系统,使用生成设计,能够加快物理对象的设计。它还根据材料和制造要求优化设计。
- DuckAssist是DuckDuckGo搜索引擎中的一项AI功能,使用搜索信息的摘要生成答案。它旨在限制自然语言模型产生虚假答案的倾向,并提供不正确的信息。DuckAssist始终链接到引用的来源,但无法回答后续问题。
- Duet AI是一组AI功能,适用于Google的企业协作套件Workspace Enterprise和Google Cloud。Duet在多个Google工具中嵌入AI功能。Google Slides可以为演示文稿生成AI图像、音频和视频。Google Sheets可以自动从数据中得出见解,并使用AI生成公式。Gmail可以自动起草和生成电子邮件回复。
- Grok是xAI(埃隆·马斯克的AI初创公司)推出的ChatGPT版本。它具有互联网浏览能力,可以根据网络上的最新信息回答用户。该工具旨在回答其他AI系统通常会避免的问题,并具有更幽默的语气。Grok还为开发人员提供API。
- Pi是一个聊天机器人,旨在作为用户的个人助手。Inflection AI推出了该工具。它旨在提供个人建议和支持。该工具来自LinkedIn联合创始人Reid Hoffman和DeepMind联合创始人Mustafa Suleyman的公司Inflection AI。
- Supermeme.ai是一个AI驱动的表情包生成器。用户可以输入几百个字符的文本,程序将基于这些文本生成表情包。AI自动选择模板并撰写标题。用户还可以根据主题生成表情包。生成的表情包遵循经典的“底部文本”格式。
- You.com是一个具有聊天机器人功能的AI搜索引擎。用户查询You.com,该搜索引擎以对话的语气返回搜索结果摘要。You.com还为其回答提供引用。但它不仅限于文本——它还具有图像生成器和代码生成器。
虽然自动生成内容有其好处,但也充满了风险和不确定性。了解一些AI生成内容的优缺点。
Ben Lutkevich是WhatIs.com的技术特写作家,撰写技术解释和定义。