在生成型人工智能的领域中,一个主要挑战是知识截止问题。
OpenAI 的 ChatGPT 早期就引发了对知识截止问题的担忧——这意味着大型语言模型(LLM)只能了解截至某一特定日期的世界信息。例如,当前驱动 ChatGPT 的 GPT-4o 模型的知识截止日期为 2023 年 10 月,而较早的 GPT-4 模型的截止日期则为 2021 年 9 月。
相比之下,传统的搜索引擎如 Google 并不存在这样的知识截止问题。Google 搜索通过不断抓取互联网,更新索引中的最新信息。解决 LLM 知识截止问题的挑战,已经引起了多个供应商的关注,他们正在寻求通过生成型人工智能(GenAI)驱动的搜索能力来解决这一问题。OpenAI 就是其中之一。
什么是 SearchGPT?
SearchGPT 是 OpenAI 构建的生成型人工智能搜索引擎,于 2024 年 7 月 26 日首次宣布。
GPT 代表生成式预训练变换器。GPT 家族的大型语言模型包括 GPT-3、GPT-4 和 GPT-4o,是 OpenAI 开发的基础 LLM,支撑着 ChatGPT。通过 SearchGPT,OpenAI 将结合传统搜索引擎的一些功能与其 GPT LLM 的能力。SearchGPT 不会有知识截止问题,因为它从网络中获取实时数据。
SearchGPT 目前是 OpenAI 的一个原型,已向有限数量的测试用户推出。对于未来希望成为测试组成员的人,还有一个等候名单。测试用户包括个人和出版商。OpenAI 邀请出版商参与 SearchGPT 的评估,以确保他们对搜索结果中其内容的表现感到满意。
该服务不仅是原型,OpenAI 还将其定位为一个临时服务。目标是测试和评估其长期运行效果。当评估完成且 OpenAI 对进展感到满意时,计划将 SearchGPT 功能直接集成到 ChatGPT 界面中。
截至 2024 年 8 月,OpenAI 尚未明确声明 SearchGPT 服务何时将对公众普遍开放或与主要的 ChatGPT 用户体验集成。
SearchGPT 的特点
SearchGPT 将为用户提供许多功能,以扩展 ChatGPT 的能力。主要特点包括:
- 对话式人工智能。 由于 SearchGPT 使用与 ChatGPT 相同的 LLM,该服务提供了自然语言界面来提问。
- 后续问题。 该服务允许用户提出后续问题,使体验更加互动,类似于人类对话。
- 实时响应。 不再有任意的知识截止日期。SearchGPT 能从网络中获取实时信息,向用户提供最新的信息。
- 摘要功能。 与传统搜索引擎仅提供指向更多信息的链接不同,SearchGPT 提供信息的简明摘要。
- 来源归属。 OpenAI 包括了清晰的来源归属和链接,允许用户验证信息并进一步探索原始网站上的详细信息。
- 视觉结果。 SearchGPT 的一项功能是提供以图片和视频形式呈现的视觉结果,以回答用户查询。
OpenAI 对 Google 搜索的回应
Google 长期以来主导了搜索领域。OpenAI 正试图通过 SearchGPT 原型挑战这一地位。
答案,而非链接
Google 搜索和传统搜索引擎的一个长期问题是,它们功能上是信息的索引或指针。Google 搜索不一定提供问题的答案,而是指向答案所在的位置。
Google 确实提供了 AI 概览功能(前称搜索生成体验或 SGE),提供 AI 生成的摘要和片段以便快速获取答案。然而,它主要依赖于呈现指向第三方网站的链接。
SearchGPT 原型的目标是提供对用户问题的答案。它不仅仅提供链接,而是提供信息来源的总结,直接给用户所需的信息。
上下文连续性
传统的 Google 搜索查询是一个时点查询,没有从一个查询到下一个查询的上下文延续。而 SearchGPT 的目标是提供在多个查询之间保持上下文的能力。
搜索准确性
传统的 Google 搜索注重关键词匹配,这有时需要用户翻阅多页才能找到相关信息。此外,传统搜索引擎还存在搜索引擎优化的做法,这利用各种技术来优化搜索结果。SearchGPT 将实时信息与 LLM 结合,以便找到更多具有上下文相关的信息。
无广告体验
SearchGPT 提供无广告的界面,创建了比 Google 更清洁和更友好的用户体验,Google 在搜索结果中显示广告。
AI 驱动的搜索引擎比较
以下是当前 AI 驱动的搜索引擎比较图表。
搜索引擎 | 平台集成 | 出版商合作 | 广告 | 费用 |
SearchGPT (OpenAI) | 独立原型 | 重点合作 | 无广告 | 免费(原型阶段) |
Google SGE | 基于 Google 基础设施 | SEO 实践,内容合作 | 包括广告 | 免费 |
Microsoft Bing AI/Copilot | 基于 Microsoft 基础设施 | SEO 实践,内容合作 | 包括广告 | 免费 |
Perplexity AI | 独立 | 基本来源归属 | 无广告 | 免费;高级版 $20/月 |
You.com | 具有多种模式的 AI 助手 | 基本来源归属 | 无广告 | 免费;可用高级版 |
Brave Search | 独立搜索索引 | 基本来源归属 | 无广告 | 免费 |
Sean Michael Kerner 是一位 IT 顾问、技术爱好者和研究员。他曾配置 Token Ring、NetWare,并以编译自己的 Linux 内核而闻名。他为行业和媒体组织提供技术问题咨询服务。