【聚看点】AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?
2 月初,随着 ChatGPT 和微软 Bing AI 接连引爆互联网,ChatGPT 概念股应声而起,其中知乎因为大量问答被广泛地用于生成式 AI 的训练,股价一度暴涨 31%,之后百度文心一言发布时又涨了一大波。
但到了 4 月,一位网友就在知名程序员社区 V2ex 发帖感慨:「ChatGPT 会是知乎最大的敌人。」
不仅是他,很多人都发现知乎已经充斥了大量 AI 生成的回答,有些可能是无关痛痒的观点,但不少也出现了「一本正经胡说八道」。与此同时,AI 生成内容也在一步一步扩大自己的「领土」,从互联网延伸真实世界。
【资料图】
海外技术社区 Hacker News 上有人指出,一家网红营销机构网站上的一篇博文出现了「抱歉,作为一种 AI 语言模型,我无法预测未来的事件或趋势」的提醒,类似的话语还出现在卡塔尔的购物中心目录和芬兰的一家电子产品商店的网站等地方。
更多 AI 生成的虚假内容,或许还没有被发现。
没人想要一个虚假的世界
图/AI生成
很多人可能还记得,今年 3 月网上流传出一系列「特朗普被捕」的照片,虽然后续大量报道都指出其为 AI 生成的虚假照片,但照片刚开始被热传时,国内外社交平台上都有不少人信以为真。而后来出现的「甘肃火车事故」「八角大楼被袭」假新闻,也一次又一次挑起了人们的神经。
过去半年我们已经知道,ChatGPT 等生成式 AI 会不顾真假,生成海量似是而非的内容。而由 AI 生成的虚假内容又会被其他 AI 拿来学习后,再生成更加以假乱真的内容。甚至,AI 还可以根据用户的个人喜好一对一地生成虚假信息。因为 AI 可以扩大和再生产假新闻,未来可能造成更加严重的舆论造假。
更大的问题是,如果未来互联网甚至是真实世界都充斥着各种 AI 生成的虚假内容,一切都会崩溃。而从文字到图片再到声音,今天 AI 生成的内容与真人创作的内容之间变得越来越难以分辨,就像大部分人已经无法分辨 AI 孙燕姿、AI Drake 与真人声音。
同时 AI 的进化速度也太快了。几个月前我们可能还在说 AI 绘画「不会画手」,但等到 Midjourney V5 新版本推出之后,AI 不仅在「画手」上越发娴熟,各种细节也变得更逼真。在针对 AI 歌手的回应中,孙燕姿也看到了这一点:
「你可能会反对,说我还是能分辨出区别的,它没有情绪,没有音调和呼吸的变化。很抱歉,我怀疑这只是一个非常短期内的回应。」
图/孙燕姿
所以问题已经不在于我们能不能分辨 AI 生成的内容,而是我们应该如何辨认出 AI 生成的内容。
用「魔法」打败「魔法」?
人工识别首先就不现实,先不说人工分辨 AI 生成内容的准确性,我们还需要投入海量的人力。
去年年底 ChatGPT 发布之后,很多人就用它来生成论文,并取得了很好的成绩,同时也吸引了更多的学生效仿。随后,巴黎政治学院在内的一些全球知名学府纷纷出台了 ChatGPT 禁令。但据在线课程供应商 Study.com 此前发起的一项调查显示,1000 名 18 岁以上的学生中,超过 89%的学生都在使用 ChatGPT 来完成家庭作业。
但这个问题总要解决,而最好的办法,可能还是用「魔法」打败「魔法」?
众所周知,一个社区的核心是用户与用户之间的交流,而 AI 生成的虚假内容一旦泛滥很容易摧毁这种交流,这也是所有在线社区极力避免的。但方法呢?除了依靠个人去辨别,很多时候我们又必须依赖 AI,比如前文提到 V2ex,其站长@Livid 为了分辨 AI 生成的灌水内容,就会直接反过来询问 AI「是否由 AI 生成」,以此作为是否封禁用户的依据。
图/V2ex
问题是这种方法还是存在太多的不确定性。
就在 ChatGPT 刚推出的几天后,OpenAI 宣布联合哈佛大学等高校和机构一起打造了 AI 检测器——GPT-2 Output Detector(GPT-2 输出检测器)。顾名思义,GPT-2 Output Detector 是基于 GPT-2 模型微调输出的工具,对基于 GPT-3.5 的 ChatGPT 实际效果并不好。
于是今年 2 月 1 日,OpenAI 转头又推出「AI 生成内容识别器」,目的是识别文本由 AI 生成还是人类撰写,本质上是一个辨别真实内容和 AI 生成内容的分类器。不过,OpenAI 在博客中指出,该识别器对 AI 生成内容的检测成功率仅为 26%:
可能还不如网友瞎猜。
国内也出现了类似的 AIGC-X。这是一款由人民网下属传播内容认知国家重点实验室、中国科学技术大学、合肥综合性国家科学中心人工智能研究院联合推出的 AI 生成内容检测工具,支持对 AI 生成内容和人工生成内容的分辨。尽管有报道称 AIGC-X 对中文文本检测的准确率超过 90%,但实测并不如意。
即便有这么多错误,图/AIGC-X,Bing
可以说到目前为止,所有试图用 AI 打败 AI 的尝试都没有成功,本身这条路径也存在不少争议,有人就将其形容为新时代的「自相矛盾」——用最强的矛打最强的盾。
相比之下,「水印」成了越来越广泛的选择。5 月谷歌 I/O 大会上,谷歌率先宣布公司的每一张 AI 生成图片都会内嵌水印,水印无法肉眼识别,但可通过谷歌搜索引擎等软件读取并以标签显示出来,用以提醒用户该图片由 AI 生成。不久后,Shutterstock、Midjourney 等 AI 应用也宣布将支持这种新的标记方法。
但 AI 生成文字还在等待一个切实可行的方案。在 AI 生成内容识别器失败之后,OpenAI 也在考虑在生成的文本中加入数字水印,以降低模型被滥用带来的负面影响。OpenAI 对齐团队(主要负责系统安全性)负责人 Jan Leike 表示,OpenAI 已经探索在文本中加入水印。
不过,OpenAI CEO Sam Altman 在接受采访也提醒到,不存在一个完美的 AI 生成文字识别工具,原因是人们总会弄清楚他们要修改多少文字,还会出现修改输出文本的其他工具。
写在最后
之前在某个论坛上看到一个帖子,一位网友通过搜索引擎跳到知乎的一则回答,看到了一半才意识到这则回答大概是由 AI 生成,瞬间有种被喂 x 的感觉。
关键是如果主动使用 ChatGPT 之类的生成式 AI,我们可能对它的真实性、胡说八道都会有一定的预期,但显然我们无法阻止其他人使用并发布 AI 生成的虚假内容。打个比方,如果对历史并不熟悉的人,在知乎上看到一则言之凿凿讨论亚瑟王的回答,会不会误认为亚瑟王是真实存在的人物,甚至是一位女骑士(型月作品中的设定)。
但坦白讲,除了很明显的 AI 生成风格,我们很难在熟知领域之外分辨内容是否由 AI 生成,唯一能做的,可能就是更加审视我们所看到的内容。
标签:
- 黄山提升政府采购透明度 助力实体经济持续健康稳定发展
- 1-2月黄山新签“双招双引”项目103个 总投资额139.7亿元
- 池州海关共签发RCEP原产地证书22份 签证金额92.7万美元
- 宿州泗县深入推进文旅融合发展 擦亮城市品牌
- 河北工业生产平稳开局 固定资产投资较快增长
- 昆明西山区深入实施人才强区战略 建立健全招商招才引资并轨新模式
- 2月唐山新建商品住宅销售价格与上月持平 同比下降0.8%
- 去年河北电子信息产业实现主营业务收入2367.7亿元 同比增长22.4%
- 绥化望奎以工业化思维为引领 推动肉类加工制造产业腾飞
- 绥化市监局推出多项举措 大力促进有机产品产业发展
- 半路出家无心插柳 杭州西湖区“菌菇宝宝”变废为宝
- 温州鹿城区藤桥主打藤桥熏鸡 近两年销售额年均增长20%以上
- 1-2月安徽限额以上消费品零售额1030.4亿元 同比增长10.4%
- 2021年合肥市茶园面积13.6万亩 产值176350万元
- 淡季不忘引流 京郊民宿市场将很快迎来回暖
- 郴州安仁文旅项目集中开工 总投资1000万元
- 江苏服务业继续保持发展强劲势头 为高质量发展提供有力支撑
- 黄山休宁经开区摸排基础设施项目17个 计划总投资29709万元
- 前两个月宣城出口31亿元 增长34.4%
- 滁州凤阳2021年共接待游客225万人次 旅游综合收入20.25亿元
- 1-2月宿州市民间投资同比增长19.2% 居全省第3位
- 宿州严格审核把关 抢抓发行地方政府专项债券政策机遇
- 1-2月亳州市进出口总值5.5亿元 同比下降17.4%
- 合肥:弘扬茶文化 初步形成一条生态发展之路
- 合肥:建成“数字中国”领先城市 推进城市数字化转型
- 甘肃再续“艾黎情”:探职业教育德技并修
- 【城市守望者】致敬抗“疫”一线的“拆弹专家”
- 浙江绍兴越城区核酸检测结果公布 除1例阳性外其余均为阴性
- 内地首例奥密克戎变异株感染者身体状况如何?来自哪里?专家解读→
- 对变异病毒已有准备!关于中国新冠药物,钟南山发声→
- 江苏睢宁小网格大担当 织就乡村振兴“幸福网”
- 改造老旧小区 共享幸福生活
- 天津静海:群众在哪里,文明实践就延伸到哪里
- 齐齐哈尔:初步判断疫情感染来源为接触新冠病毒污染环境和物品
- 重庆大竹林派出所副所长因对群众态度简单粗暴被停职
- 黑龙江讷河病例感染源初步判断为新冠病毒污染的环境和物品
- 致敬2021
- 浙江瑞安民警捐献造血干细胞:14年前的心愿终将如愿
- “考研房”涨价离谱 律师:借机宰客有违市场伦理
- 广州白云机场:14天内有东莞旅居史的旅客须凭48小时核酸阴性证明乘机
- 浙江绍兴本轮疫情已报告确诊病例145例 无症状感染者1例
- 福建龙岩一男子和前妻斗气 扛着126斤硬币到法院“还钱”
- 重庆这座立交酷似“悟空” 走红 设计师揭秘(图)
- 青海警方破获特大电诈案 涉案流水高达1.7亿
- 云南新增境外输入确诊病例3例
- 黑龙江讷河市5名核酸阳性人员流调溯源:接触被新冠病毒污染的环境和物品
- 男子爱上女主播 假扮女主播闺蜜教其他男粉丝刷单
- 广西三市警方联手破获毒品案 全链条摧毁跨境贩毒团伙
- 广东东莞发现2例无症状感染者,部分镇今起全员筛查
- 从百二秦关到闻道凯旋 一个殉职医生最后的朋友圈
- 浙江发补充说明:三地铁路出行政策随风险等级同步调整
- 内蒙古新增本土确诊病例5例 均在呼伦贝尔满洲里市
- 陕西新增本土确诊病例1例 系隔离酒店工作人员
- 31省份新增新冠肺炎确诊病例76例 其中本土51例
- 浙江新增新冠肺炎确诊病例45例 其中本土44例
- 技能就是财富 技工也是人才
- 黑龙江新增本土确诊病例1例、本土无症状感染者4例
- 冷空气“调休”!我国大部陆续迎回暖 中东部雨雪稀少
- 华北黄淮等地大气扩散条件转差 冷空气将影响中东部
- 别误读了野猪或将不再是“三有”动物
- 您的ETC已到期?当心这个诈骗短信!
- 对回家的“宝贝”少一些关注,也是一种帮助
- 升温!北京今日阳光在线 最高气温将升至8℃
- 那年今日 | 一张漫画涨知识之12月14日
- 40岁男子一觉醒来突然听不见了 原因是……
- 本年度星空压轴大赏上演 双子座流星雨观赏地图来了
- 广东东莞大朗镇报告2例新冠肺炎无症状感染者
- 商丘4885份被盗出生证去哪了?10年“悬案”引关注
- 浙江海宁警方通报国家公祭日女子穿和服逛街
- 厨艺不精调料凑?懒人调料:年轻人的“下厨神器”
- “您的ETC已到期?”警方提醒:当心这个诈骗短信
- “网红”局长的热度 自述:走红后我就没有周末了
- 寻回被拐10年的儿子后又送走 儿子:害我没家了
- 小城里的三张面孔和警号301137
- 倡导“就地过年”,需因地制宜科学防疫
- 别用“入乡随俗”为星巴克找借口
- 北京地铁14号线年底全线贯通运营
- 天津市从入境人员中检出奥密克戎变异株
- “外滩活地图”黄俊:一个不想出圈的段子手交警
- 寻找一双儿女的25年
- 无锡市场监管部门责成星巴克涉事门店停业整改
- 海岛警事:为了一座岛和2900平方公里的海
- 北京民警宏福苑抗疫26天:“今夜我和雪花一起出发”
- 星巴克的“金标准”缘何败给了“潜规则”
- 患者被低价药“惊呆”的场面应该更多些
- 影视剧“超前点评”不止是“低级错误”
- “南昌鹦鹉案”下发不起诉决定书 网店上架费氏牡丹鹦鹉被拒
- 河南商丘4885份出生医学证明被盗始末追踪
- 绍兴市病例62-109活动轨迹公布
- 12月7日以来,杭州累计报告新冠肺炎确诊病例19例
- 浙江绍兴新增确诊病例37例 上虞区占36例
- 河南高院对张成功案作出死刑判决
- 四川一滑雪场停电游客被困索道 官方回应
- 浙江绍兴越城区新增1例新冠肺炎确诊病例 当地对防控区域划分进行调整
- 中国内地首次检出新冠病毒奥密克戎变异株
- 知网除了涉及著作权纠纷,是否涉嫌违反《反垄断法》?
- 浙江绍兴越城区新增1例新冠肺炎确诊病例
- 四川眉山千箱柑橘送往呼和浩特市抗疫一线
- 两名青年男女探险三亚落笔洞遗址被困沼泽 消防成功救援
- 中国地理学大会在福州发布《中国地理学界碳中和科技行动福州宣言》
广告
广告
- 【聚看点】AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?
- 天天即时看!安徽省六安市市场监管局抽检食品142批次 全部合格
- 最资讯丨家用NAS重磅安利:极空间Q2C亲身体验简直不要太香
- 科兴制药06月28日下跌,股价创历史新低-当前要闻
- 实对称矩阵的拟特征值理论与应用
- 送男生什么礼物最为经典?捕日者工艺品注入别致创意,独具魅力,让他眼前一亮!
- 微头条丨日媒:福岛核污染水排海隧道建设工程已完工
- 每日快讯!日本见闻之五十三:“义理”、“人情”和“建前”、“本音”
- 即时看!遥感数据更精准!我国地理空间信息技术取得新突破
- @郑州滴滴司机:快来领高温补贴了!
- 特发信息:控股子公司四川华拓800G光模块在预研阶 天天动态
- 游客自陷风险,救援费用谁来出 专家解读遇险救援费用承担问题|视点
- 小野菊花图片(小野菊花的功效与作用)_时讯
- 【世界播资讯】oppo定位追踪网站(oppo定位)
- 世界看热讯:世界RPG韩服夏日活动(6/28~07/23)
- 6月28日生意社丙烯腈基准价为7850.00元/吨 环球看点
- 苹果公开反对强制在 iMessage 中进行 CSAM 扫描的英国法案
- 扬州、北京等地出利好托市,救楼市还需先救基本面!| 新地产 前沿资讯
- 今日视点:吾怎么组词最好_吾怎么组词
- 大利好!四家地产一起公告:再融资获批 今日热讯






