2301_80166982 2025-10-29 21:58 采纳率: 33.3%
浏览 13
已结题

Deepseek模型被投毒到底是个什么情况?

1.deepseek从算法上到底为什么可以减少对GPU的依赖?
2.为什么现在豆包的使用率会比deepseek高,换言之豆包的优势在哪?
3.对于大模型的投毒有哪些方面?有没有高质量的相关论文可以参考学习?
4.推荐一下现在比较常用的数据集?
5.Ai模型(如CNN这种简单模型),Ai大模型(如Deepseek这种)现在都有哪些评价指标?
(刚做了基于CNN的AI模型投毒攻击,导师提出①尝试下攻击大模型的实验②增强数据量③除了图像还应考虑系统日志、自然语言处理的改进点。我就想到了之前Deepseek被数据投毒的攻击。

说实话,我们本科生对AI的认识真的很浅薄。上个学期,我们才刚学了人工智能基础,我就知道KNN,CNN,Transform(ANN),Yolo,残差神经网络,对数据集的了解就只有MINST,NSL_KDD,CIFAR,对AI性能的评价体系也没有建立。

我一直都认为人的认知只能从自己已知的东西出发,不断向外探索。我不可能一下子就能着手去做一个自己完全不了解的东西。)

  • 写回答

3条回答 默认 最新

  • 紫雾凌寒 新星创作者: 人工智能技术领域 2025-10-29 22:08
    关注

    让 “紫雾凌寒” 来帮你回答,本回答结合 DeepSeek

    如果还有问题,请评论或点击头像私信,如果有帮助到您, 请关注、采纳、点赞

    1. 关键点分析
      - 要了解DeepSeek模型减少对GPU依赖的算法原理。
      - 对比豆包和DeepSeek,找出豆包使用率高的优势所在。
      - 全面掌握大模型投毒的各个方面并找到相关高质量论文。
    2. 解决方案
      - DeepSeek减少对GPU依赖的原因
      • DeepSeek可能采用了一些优化的算法架构,比如更高效的模型压缩技术,像剪枝算法。通过去除不重要的连接或参数,减少模型的计算量,从而降低对GPU计算资源的需求。例如,稀疏矩阵乘法技术可以减少不必要的乘法运算,使得在相同计算任务下,对GPU的负载降低。
      • 还可能运用了量化技术,将模型参数从高精度的数据类型(如32位浮点数)转换为低精度的数据类型(如8位整数),在不显著损失模型性能的前提下,大大减少了计算量,进而减少对GPU的依赖。
      • 豆包的优势
      • 性能方面:豆包经过大量数据的训练和优化,在多种自然语言处理任务中表现出色,能够准确理解和生成高质量的文本。例如在文本生成任务中,豆包可以生成逻辑连贯、语义准确的文章。
      • 功能多样性:提供了丰富的功能,如智能问答、文本摘要、翻译等。用户可以方便地通过简单的交互获取各种信息和服务,满足不同场景下的需求。
      • 用户体验优化:界面简洁易用,响应速度快,便于用户快速上手和使用,无论是在网页端还是移动端,都能提供流畅的交互体验。
      • 大模型投毒方面
      • 数据投毒:攻击者在训练数据中故意插入错误或恶意的数据。例如,在图像识别模型的训练数据中加入错误标注的图像,使得模型在这些错误数据的影响下学习到错误的模式,从而降低模型在正常数据上的性能。
      • 模型参数投毒:直接篡改模型的参数。比如通过恶意软件或黑客手段修改模型权重文件中的参数值,使模型输出错误的结果。
      • 投毒方式:可以是在训练过程中悄悄注入恶意数据或参数,也可能是在模型部署后通过攻击模型的存储或传输环节来进行投毒。
      • 相关论文
      • “BadNets: Identifying and Correcting Backdoored Neural Networks” 这篇论文详细研究了神经网络中的后门攻击(类似投毒),包括攻击原理和检测方法。
      • “Trojaning Attacks on Neural Networks” 探讨了针对神经网络的木马攻击,对理解大模型投毒有一定参考价值。
    3. 多种解决方案的优缺点
      - DeepSeek减少GPU依赖的方法
      • 剪枝算法
      • 优点:能显著减少模型规模和计算量,有效降低对GPU的需求,且在很多情况下能保持模型性能。
      • 缺点:剪枝策略选择不当可能会过度损失模型精度,需要仔细设计剪枝标准和方法。
      • 量化技术
      • 优点:计算效率提升明显,可在硬件资源有限的情况下运行模型,并且能加快推理速度。
      • 缺点:可能会在一定程度上影响模型的准确性,尤其是对于复杂任务的模型。
      • 豆包优势方面
      • 性能优势
      • 优点:在多种任务中表现优秀能吸引大量用户,满足不同场景需求。
      • 缺点:随着新模型不断涌现,性能优势可能会随着时间推移而相对减弱,需要持续优化。
      • 功能多样性
      • 优点:丰富功能方便用户,增加了用户粘性和使用频率。
      • 缺点:功能开发和维护成本较高,要确保各功能的稳定性和准确性。
      • 用户体验优化
      • 优点:良好体验能快速吸引用户并提高留存率。
      • 缺点:对技术团队的开发和运维能力要求高,要不断优化以适应新的设备和网络环境。
      • 大模型投毒相关研究
      • 不同投毒方式的研究
      • 优点:深入研究各种投毒方式有助于全面了解安全威胁,为防范提供理论支持。
      • 缺点:研究成果可能滞后于实际攻击手段的发展,需要持续跟踪新的攻击方式。
    4. 总结
      DeepSeek模型减少对GPU依赖可能是通过模型压缩技术如剪枝和量化等算法实现。豆包使用率高在于其在性能、功能多样性和用户体验方面具有优势。大模型投毒包括数据投毒和模型参数投毒等方面,有相关高质量论文可供学习了解其原理和防范方法。通过对这些方面的分析,可以更深入地理解模型技术及其面临的安全问题。

    希望以上解答对您有所帮助。如果您有任何疑问,欢迎在评论区提出。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 11月6日
  • 已采纳回答 10月29日
  • 创建了问题 10月29日