● [AI 36计] 第09计:隔岸观火 ●

,各位榴友。
现在的 AI 公司就像贪婪的饕餮,没日没夜地在互联网上乱爬数据。
它们不管三七二十一,看到文章就吞,看到图片就吸,主打一个“白嫖”。
既然你这么爱吃外卖,那黑客干脆就不黑你的系统了。他们只需在你的“外卖”里下点慢性毒药,然后泡杯茶,坐等你自己毒发身亡。
今天第九计,咱们聊聊这一招兵不血刃的:隔岸观火。
─ · ─ · ─ [ 古人的智慧 ]─ · ─ · ─
原文:阳乖序乱,阴以待逆。暴戾恣睢,其势自毙。顺以动豫,豫以顺动。
翻译:
当敌人内部出现混乱,或者行为极其贪婪跋扈时,你不需要急着出手。
你只要在旁边安安静静地看着,他自己就会把自己作死。
这就叫:我知道你爱翻垃圾桶找吃的,所以我在垃圾桶里放了泻药,然后笑看你窜稀。
─ · ─ · ─ [ AI 的骚操作 ] ─ · ─ · ─
技术名:数据投毒 (Data Poisoning)
它怎么玩弄你?
AI 就像个刚出生的婴儿,它对世界的认知全靠它“看”过的数据。黑客就是利用了这一点,给它洗脑。
• 埋雷: 黑客把一张“狗”的图片,在像素层面上做了肉眼看不见的修改(加入了“猫”的数学特征),然后发到网上。人类看着还是狗,但在 AI 的代码眼里,这是一只猫。
• 白嫖: AI 公司毫无节制地爬取了这张图片,拿回去喂给自家的大模型。
• 观火: 等到模型训练完上线了,用户对 AI 说“给我画一只猫”,结果 AI 脑子里的连线已经彻底错乱了,直接画出了一坨长着狗头的不可名状的肉块。
• 结果: 黑客连 AI 服务器的门都没碰,只用几张图片,就把一个耗资几百万美元训练出来的模型毁了。
─ · ─ · ─ [ 贤者的防御 ] ─ · ─ · ─
破解法:数据清洗与溯源 (Data Curation & Auditing)
怎么防?
想不吃坏肚子,就别去路边摊随便捡东西吃。
1. 高薪聘请试毒员: 别用爬虫瞎抓了,花钱雇真人去审核、清洗数据集。
2. 投毒检测: 使用专门的过滤算法,扫描图片中是否隐藏了对抗性噪点(也就是查查有没有下毒的痕迹)。
3. 控制饮食: 只使用授权的、来源干净的版权图库进行训练。
简单说: 买得起几万块的 H100 显卡,就别在买菜的钱上抠抠搜搜了。
─ · ─ · ─ [ 翻车名场面 ] ─ · ─ · ─
(本期由 艺术家的复仇利器 Nightshade 友情赞助播出)
案发背景:
2024 年,全球的画师们都被 Midjourney 和 Stable Diffusion 气疯了。
自己辛辛苦苦画的作品,被 AI 公司一声不吭地爬走去训练模型,反过来抢自己的饭碗。
既然法律暂时管不了你们,那就别怪老子来阴的了!
芝加哥大学的研究团队为画师们开发了一款名叫 Nightshade(夜影) 的工具。
翻车时刻:
画师们在上传作品前,用 Nightshade 给自己的画“下毒”。
比如,画的是一个“精美的皮包”,但打上的隐形毒药是“烤面包机”;画的是一顶“帽子”,打上的毒药是“蛋糕”。
随后,贪婪的 AI 爬虫把这些剧毒图片照单全收。
几个月后,AI 模型“毒发”了。

结局:
当普通用户给 AI 输入指令:“生成一个真皮手提包” 时。
AI 抽搐了一下,生成了一个带有提手的金属烤面包机,上面甚至还插着两片吐司。
输入“画一顶优雅的法式帽子”,AI 生成了一块扣在头上的巧克力慕斯蛋糕。
AI 公司的工程师们看着满屏的“精神病”产物,抓破了头也找不到 bug 在哪。
而画师们坐在屏幕前,看着 AI 发疯,露出了欣慰的笑容。
这就是典型的:你馋我的身子,我就给你喂百草枯。
─ · ─ · ─ [ 强行升华 ] ─ · ─ · ─
这也告诉我们一个道理:
贪婪,永远是最大的漏洞。
AI 的强大,建立在它能吞噬人类几千年积累的文明数据之上。
但如果它连好坏都不分,只是一味地吞咽,那人类只需要往数据里掺一点沙子,就能让这台庞然大物瘫痪。
兄弟们,别盲目迷信大模型,它脑子里装的,可能有一半都是别人故意喂的“泻药”。