有人已经备份了AI之前人类创作的内容,这是仅存的纯人类遗产

作者:边界之外

每当时代悄然变化时,总有一些人先知先觉,他们敏锐地察觉到了潜在危机的可能性,并开始为未来做准备。

前Cloudflare高管John Graham-Cumming便是这样一类人。他建立了一个叫 lowbackgroundsteel.ai网站,开启了一项史无前例的备份人类创作的项目。

这个项目把AI出现之前,由人类创作的内容视为一份珍贵的遗产,宝贵的、人类独有特质的内容,并把这些内容封存起来,就像封存一个富有人类创造力的时间胶囊。这背后其实是一种“文化纯度焦虑”。 comic_style_the_picture_shows_noahs_ark_filled_with_books_with_the_name_written_on_the_ark-_lowback_rky359cuac82ylqxotqk_3.png

这个项目是试图对“人类表达时代”的封存行动,它试图画出一个断点,保存“未被AI污染的内容”。就像考古学家研究古代陶器残片一样,我们将来可能需要研究“人类语言未被AI污染之前的样子”。

这个网站为什么会叫lowbackgroundsteel?这个名字是来源于冷战时期的一个科学现象。

自从1945年核武器诞生开始,全世界新生产的钢材均会受到大气辐射的污染。为了获取没有辐射的钢材,科学家们就从战前沉船中回收钢材,这种钢材叫作 "low-background steel."。

Graham-Cumming认为,AI对人类信息的侵染,与受核辐射的钢材类似,AI已经影响了人类信息的纯净度。

随着2022年ChatGPT的诞生和Stable Diffusion的兴起,研究人员发现越来难确保从互联网获取的内容是由人类原创的。ChatGPT的广泛应用,让大量AI生成文本充斥网络,迫使他们其中一个研究项目不得不停止。

实际上当网上的信息越来越多地参杂着AI生成的内容,很容易出现一种情况就是,AI模型以自身生成的内容作为训练数据,产生“模拟-复制-降解”这样一种路径:

  1. 人类内容生成 →
  2. AI模仿人类 →
  3. AI内容被新AI用于训练 →
  4. AI再次模仿 →
  5. 意义消失,噪音上升

这是一种知识熵增的过程,可用于训练的真实数据被稀释,系统输出的信息质量将呈退化趋势。

随着AI水平不断进步,人们越来越难以区分人类与AI的内容,这种情况会愈演愈烈,这也是为什么现在的AI巨头对高质量数据如饥似渴。

这个项目宣示人类创作的“原生态”已经成为文物,未经AI加工的人类原始创作可能逐渐从我们的世界消失,变成非常稀缺的“文化化石”。

未来,当人类失去原创的表达能力后,有一天,有人打开 lowbackgroundsteel.ai,会不由得感叹我们的祖先还能写出这么鲜活的文字,如此富有人性的光辉。

lowbackgroundsteel.ai 就是新时代的诺亚方舟。

分享这篇文章

评论 (0)

还没有评论,来说两句吧!