1.deepseek从算法上到底为什么可以减少对GPU的依赖?
2.为什么现在豆包的使用率会比deepseek高,换言之豆包的优势在哪?
3.对于大模型的投毒有哪些方面?有没有高质量的相关论文可以参考学习?
4.推荐一下现在比较常用的数据集?
5.Ai模型(如CNN这种简单模型),Ai大模型(如Deepseek这种)现在都有哪些评价指标?
(刚做了基于CNN的AI模型投毒攻击,导师提出①尝试下攻击大模型的实验②增强数据量③除了图像还应考虑系统日志、自然语言处理的改进点。我就想到了之前Deepseek被数据投毒的攻击。
说实话,我们本科生对AI的认识真的很浅薄。上个学期,我们才刚学了人工智能基础,我就知道KNN,CNN,Transform(ANN),Yolo,残差神经网络,对数据集的了解就只有MINST,NSL_KDD,CIFAR,对AI性能的评价体系也没有建立。
我一直都认为人的认知只能从自己已知的东西出发,不断向外探索。我不可能一下子就能着手去做一个自己完全不了解的东西。)