You dont have javascript enabled! Please enable it!

如何选择退出跨社交媒体平台的人工智能培训

AI技术30分钟前更新 庆龙江
0 0 0

你一直想成为一名教师吗?你的梦想可能正在实现——但不一定是你所希望的那样。

你在Instagram上发布的最新照片可能会被用来训练AI模型,或者被用于AI生成的图像。你在LinkedIn上的简历数据可能会被输入到AI模型中。如果你在Snapchat上使用某个功能,你的脸甚至可能出现在广告中。

AI公司依赖互联网来训练他们的模型,因为他们需要大量的数据。互联网不仅有海量的数据——包括社交媒体网站——而且这些数据也是免费的。

无论你是否希望用自己的数据来训练AI,你都有选择的余地。

AI如何从社交媒体抓取数据?

AI训练模型消耗数据的速度远快于人类的生产速度。它们在互联网上抓取信息,以学习如何回答问题。AI聊天机器人——例如ChatGPT——利用从网络上提取的信息来制定回答。公司还使用社交媒体数据来寻找语言数据,以帮助大型语言模型理解人们的对话方式和最新趋势。

“AI模型依赖于来自社交媒体的非结构化数据,包括文本、图像和视频。通过自然语言处理和计算机视觉等技术,AI试图理解和分类这些数据,”AIResults Inc.的首席执行官Matt Hasan表示。“但社交媒体是混乱的,跨越多种语言和上下文,这使得AI很难准确学习。AI很容易误解它所看到的内容。”

如何选择退出跨社交媒体平台的人工智能培训Matt Hasan

公司还使用AI来捕捉人们在社交媒体上的帖子,以便进行定向广告。他们利用AI分析你的帖子、点赞和行为,以更好地了解你。他们希望接触到你,了解你更多,并利用AI来找出你所喜欢的内容,DataChat的联合创始人兼首席技术官Rogers Jeffrey Leo John说。

为什么你应该选择退出社交媒体上的AI训练

透明性和披露是非常重要的。如果你没有明确理解这一点,最好选择退出,Ikigai Labs的总裁Kamal Ahluwalia表示。

如何选择退出跨社交媒体平台的人工智能培训Kamal Ahluwalia

你应该考虑采取措施防止你的信息被用于训练AI模型的几个原因包括:

  • 无法控制你的信息(包括图像或私人信息)如何被使用。
  • 对你的思想和文本帖子存在剽窃问题。
  • 传播错误信息——包括误导信息和虚假信息。
  • 隐私缺失。

“模型一旦在你的数据上训练,就没有办法让它‘忘记'或删除这些数据,因此将这些数据排除在AI训练之外以保护隐私是更安全的,”John说。

AI训练中的问题

社交媒体网站可能并不提供最高质量的数据来支持AI模型的表现。为了获得可靠和准确的数据输出,公司需要高质量和多样化的数据。使用社交媒体数据可能导致偏见信息、人类俚语、行话、有害内容和虚假信息。

数据的质量在不同平台之间也有所差异。LinkedIn通常拥有更高质量的职业帖子,而Reddit可能有更多样化的观点。通过在这些信息上训练模型,需要识别那些可能故意传播有害信息的错误信息和虚假信息。这可能成为安全隐患。

如何选择退出跨社交媒体平台的人工智能培训Rogers Jeffrey Leo John

John表示,公司需要过滤数据,因为这些数据往往存在偏见和误导性。社交媒体还持有大量的私人数据——如出生日期、关系状态、联系和就业信息——这些信息被恶意行为者利用。

在评审产品或公司数据时,人们往往更自由地分享负面经历。即使更多人有积极的体验,负面评论的数量也很可能会超过正面评论。

“消极情绪似乎现在传播得更快,”Ahluwalia说。这些关于产品和服务的负面经历在进行情感分析时可能会对产品发布产生不准确的表现。

Ahluwalia还表示,社交媒体内容中存在大量噪音,数据由人生成和机器生成。无论好坏,模型和开发者都不知道如何去除这些噪音。

“这确实是大量垃圾数据,且很难清除这些垃圾,”Ahluwalia说。

AI在未获许可的情况下使用社交媒体信息是否合乎伦理?

隐私是一个主要关注点。在社交媒体上选择退出AI训练并不简单,因为大多数平台默认包含你的数据,Hasan说。用户通常不知道他们的数据正在被用于构建和训练AI模型,这涉及公平性问题。而且,平台往往在没有补偿个人的情况下从用户数据中获利。

Ahluwalia表示,他认为任何训练模型或使用人们数据的行为都应该获得许可。他提到,欧盟的AI法规明确规定,公司在使用数据进行AI训练之前,必须获得用户的同意,并明确传达训练的具体目的。

如何选择退出

选择退出的设置因平台而异,并非所有平台都提供选择退出的选项。关于平台如何使用你的数据的大多数细节都隐藏在隐私政策和服务条款中。

以下是一些在SemRush和Sprout Social等社交媒体网站列表中用户超过1亿的社交媒体平台。

Discord

要阻止Discord使用你的数据进行AI训练,请在左侧的“用户设置”下转到“隐私与安全”。滚动到“我们如何使用你的数据”部分。将“使用数据改善Discord”和“使用数据定制我的Discord体验”关闭。

LinkedIn

LinkedIn也允许用户选择退出使用他们的数据训练AI模型。他们发布了常见问题解答,概述了他们如何使用个人数据进行生成AI。

点击屏幕顶部的“我”选项卡。选择“设置与隐私”,然后在左侧栏中选择“数据隐私”选项卡以选择退出。然后在“LinkedIn如何使用你的数据”下选择“生成AI改进的数据”。将按钮切换为关闭。

当你选择此选项时,LinkedIn及其关联公司将不再使用你的数据进行AI模型的训练。然而,这并不影响你选择此选项之前的训练。

Meta

Meta在其隐私政策中表示,可能会使用公共Facebook和Instagram帖子、评论、个人资料照片和音频来训练AI系统——包括其AI聊天机器人。

如果你不想分享你的信息,请将你的账户设置为私密。如果你属于任何公共群组,你发布和分享的任何帖子也可能会被用于训练。

要在Facebook上将帐户设为私密,请在“隐私与安全”设置的“受众和可见性”部分调整隐私设置。在“关注者和公共内容”中选择“朋友”或“仅我”,而不是“公开”。

点击其他Meta应用的隐私设置说明,了解如何将以下账户设为私密:

  • Instagram隐私设置。
  • Threads隐私设置。
  • WhatsApp隐私设置。

Reddit

Reddit有点棘手,因为它是一个公共平台,AI将像其他网站一样抓取其论坛。Reddit在其隐私政策中表示,当用户提交内容时,它是服务的公共部分,这些内容也可能出现在搜索结果中,并在AI聊天机器人回答中提供。隐私政策还指出,“在发布之前,你应该考虑服务的公共性质。”

由于平台的性质,用户无法选择不分享公共帖子,但私信和私人社区中的帖子不会与第三方共享。Reddit与Google和达成协议,以共享平台数据来帮助训练AI模型。

阅读更多关于Reddit的其他隐私设置。

Snapchat

Snapchat有一个AI聊天机器人和一个“我的自拍”功能,允许用户将自拍转化为AI生成的图像。这些图像可以被转化为广告,并用于开发和训练模型,正如Snapchat的服务条款所述。

要关闭“我的自拍”功能,请转到“设置”,然后选择“我的账户”。选择“我的自拍”功能,并将“在广告中查看我的自拍”关闭。这将防止你的图像被用于AI生成的赞助内容。

要清除用于个性化广告和Snap产品的我的AI聊天机器人的数据,请转到“隐私控制”,选择“清除数据”。有一个“清除我的AI数据”选项。

TikTok

TikTok提供私人和公共账户。然而,私人账户的互动不多。它确实在其平台上使用生成AI功能。通过阅读其账户设置了解如何调整TikTok的隐私设置。

Tumblr

Tumblr表示,它不鼓励“爬虫”从其网站获取信息。然而,Tumblr据说与OpenAI和Midjourney达成协议,以访问其AI模型所需的信息。

要选择退出,请转到博客设置,然后点击“可见性”。将“防止第三方共享”切换为“关闭”。对于多个博客,您需要为每个博客完成此步骤。

X,前身为Twitter

X更新了其服务条款,该条款将于2024年11月15日生效。新服务条款声明,“你同意该许可包括我们分析你提供的文本和其他信息的权利,并提供、推广和改善服务,包括例如用于训练我们的机器学习和模型,无论是生成性的还是其他类型。”这意味着在X上继续发布将允许他们使用你的数据来训练他们的AI模型。

如果你不希望你的数据用于训练AI聊天机器人——Grok——你必须选择退出。转到“设置”。选择“隐私与安全”。在“数据共享和个性化”下,有一个“Grok”选项卡。将该选项切换为“关闭”。

© 版权声明

外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...