小污染造成大危害!警惕188金宝博- 金宝博官方网站- APP下载AI数据污染引发现实风险

发布日期:2025-11-02 17:44:22 浏览次数:

  188金宝博,金宝博官方网站,金宝博APP下载网络安全专家 曹辉:数据投毒主要针对两个方面,一个是针对视觉类,一个是针对自然语言处理类。这张图片是一个斑马识别人工智能系统的训练数据。我们看到,在这张照片上很多斑马进行了标注。如何进行数据污染?就是在其中的一匹斑马身上加一个绿点。加了绿点的斑马,特意不进行标注。这样的训练数据大概会有几万张,在这几万张训练数据里面的其中三四张进行类似的污染处理,就会导致生成的人工智能模型带有后门,就会导致当它再见到类似身体上有绿点的斑马,它就不会认为这是个斑马,就导致了AI模型的判断受到干扰。

  中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:大语言模型本质上是一种统计语言模型,使用的多层神经网络架构具有高度的非线性特征。在模型训练阶段,如果训练数据集中混入了污染数据,模型可能误将污染数据判定为“有特点、有代表性、高信息量”的内容,这种错觉就会使模型提高污染数据整体在数据集当中的重要性,最终导致少量的污染数据也能对模型权重产生微小影响。而当模型输出内容时,这种微小的影响会在神经网络架构的多层传播中被逐层放大,最终导致输出结果出现明显偏差。