
随着AI人工智能技术和应用的充满活力的发展,各种AI工具已成为当今(到日至今的活动和生活)的助手。顺便说一句,我们的生活开始与人工智能紧密相关。
网民如何说AI信息是否“不可靠”?
但是,近年来,许多网民发现一些人工智能答案已经开始非常不可靠。让我们首先看看这两种情况:
在今年上半年,宁波发生了两件事,这是一个笑声,与人工智能相关。
第一件事是2月6日,宁波警察取消了“宁波交通警察”帐户。第二件事是,三个月后的5月2日,在Yuyao省,宁波省,Zhejiang省,一辆没有牌匾的汽车在偶然的情况下撞到了一辆摩托车。汽车司机没有立即检查受伤的人,而是从后备箱中拿走了车牌进行安装。
当网民时S被问及为什么AI软件于2月6日取消,人工智能提供的答案“主要与5月2日意外流量引起的广泛关注有关。” 2月份取消该帐户的原因是三个月后的交通事故。人工智能的答案引起了网民的广泛关注,宁波交通警察随后迫切否认了谣言。
去年,一个网民询问了儿童手表的AI软件:“中国人是世界上最聪明的人吗?”人工智能提供的答案实际上是对中国发明和创造的答案,并否认了中国文化。这个荒谬的答案引起了互联网的轰动。然后,儿童手表的制造商很容易道歉,并指出相关的数据已纠正并删除了不良信息的来源。
近年来,有无数的AI信息,包括不存在Ent论文,作者和论文网站。 AI已成为谣言和信息的同谋,可以用网民造成的谣言,例如倾覆的游轮和幼儿园大火。
AI数据感染时有什么风险?如何避免这种情况?
今天提到的案件或多或少具有与人工智能的数据污染连接。在俗人方面,如果将AI与食物进行了比较,则培训数据将被击倒食物。如果成分腐烂和恶化,所产生的食物将有问题。
人工智能的三个主要要素是算法,计算和数据优势,其中数据是训练AI模型的主要元素,也是AI应用程序的主要资源。当数据感染时,这可能导致决定错误甚至AI系统失败,从而导致一些安全风险。
什么是AI数据污染?他们分割了多少类?
最近,国家安全部门发布了A REminder,通过“数据中毒”产生的起义,小说和双重污染数据,例如愤怒,小说和双重,在训练阶段,模型的干扰参数进行了调整,降低了准确性,而Kahthis表示有害输出。
那么,AI数据污染到底是什么?数据污染类别是什么?
网络安全专家CAO HUI:数据中毒主要针对两个方面,一个是视觉,另一个是用于自然语言处理。这张图是训练数据,以识别人工智能系统。我们看到在这张照片中,标有很多斑马。数据有多脏?这是为了在其中一个斑马中添加绿色点。没有标记绿色点的斑马。这样的培训数据将大约有成千上万。如果成千上万的培训数据中有三个或四个经过类似的污染处理,则形成的人工智能模型将具有后门会导致生成的人工模型具有后门的智力,这会导致它看到与体内绿色点相似的斑马,并且不认为这是斑马,这会导致AI模型判断。
根据专家的说法,人工智能数据的污染分为两类:
一种是与主观和恶意误导人工智能产出结果的数据进行沟通;
另一种类型是,人工智能本身会在网络上收集大量大量数据。如果未识别和删除不良信息,则将其添加到计算能力中,作为可信的信息来源,并且输出结果也不可靠。
网络安全专家Cao Hui:我们知道培训大型模型器需要大型数据,因此大多数Internet数据,对话和数据行,书籍,报纸和电影都是通常的培训数据收集范围。实际上,我们都可以发送一些数据到Internet。当这些数据不安全且受污染时,大型模型可能会受到影响。
人工智能数据为什么几乎没有污染会造成巨大破坏?
国家安全部的数据表明,在培训过程中,尽管采用了错误的文本,但其有害产出将相应增加7.2%。为什么由于几何范围而造成的损害较小,造成的损害会增加?
专家说,受污染的数据具有独特的视图和内容,与其他数据明显不同。在这种情况下,AI可能将被污染的数据标记为“特征和高iformal”,并增加计算能力中使用的比例。
中国人工智能安全治理专业委员会的成员Xue Zhihui网络空间安全协会:大型语言模型是统计语言的重要模型,多层神经网络所使用的架构具有很高的功能t帽子不是线条。在模型训练阶段,如果被污染的数据混合在一起 - 训练数据的训练集可能会被误认为是确定被污染的数据为“特征,代表性和高信息”。这种幻想将使模型改善受污染数据在数据集上的总体重要性,并最终导致少量受污染的数据,这对模型重量也很小。当输出内容含量时,这种轻微的效果是p层中的增强层,在神经网络架构的多层传播中,这最终导致与输出结果显着偏差。
数据污染可以触发一系列实际风险
此外,AI数据污染还可能导致金融,公共安全等领域的一系列实际风险。
Xue Zhihui,中国网络空间安全协会的人工智能安全治理专业委员会成员:考试E,在经济和金融领域,一旦数据肮脏,某些市场行为,信用风险评估,异常交易跟踪和其他工作可能会导致错误,决策和决策直接经济损失。就社会的公众舆论而言,数据污染是信息的真实性,使公众难以认识到信息的真实性。它是假的,可能会导致舆论风险。
加强资源管理并防止产生污染
为了应对AI数据污染,我们如何避免在国家安全水平上冒险?专家说,应加强资源管理以防止污染。
Xue Zhihui,中国网络空间安全协会的人工智能安全治理专业委员会成员:有必要制定清晰的数据收集标准,使用安全且值得信赖的数据资源,开发数据标签系统,并采用严格的控制和审计安全措施。
其次,数据,格式错误,语法冲突的不一致,可以评估语法并处理使用自动化工具,制造商和AI算法的组合。
安全机构先前提醒,应根据法规和标准对受污染的数据进行定期清洁和维修,并逐渐建立一个模块化,监视和可扩展的数据管理框架,以实现持续的质量管理和控制。
对于大多数网民而言,我们如何避免在当今至今的生活和工作中AI数据污染的风险?
警方提醒互联网:
首先,使用企业提供的正式平台和AI工具;
其次,在科学和理性方面使用AI工具,可以提到AI产生的结果,但您不能盲目相信。
第三个是要注意保护个人正式的人,以避免不必要的个人隐私暴露,同时,不要喂养不好的信息并整理在线房屋。