我在训练模型,目的是从输入图片生成一组数据(不是分类),真实的这组数据数量级从1e-1到1e-6都有,我现在在考虑来嗯个问题,一个是目标数据数量级太小,会不会因为精度什么的影响梯度下降;另一个问题是目标数据跨度太大,max和min距离太远,用什么方法缩放好一点。
关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
已结题
关于#人工智能#的问题:数据很小,数量级跨度大,怎么缩放
收起
- 写回答
- 好问题 0 提建议
- 关注问题
微信扫一扫点击复制链接分享
- 邀请回答
- 编辑 收藏 删除
- 收藏 举报
0条回答 默认 最新
报告相同问题?
提交
- 2025-12-02 00:43一头老黄牛@的博客 摘要 本研究利用深度学习技术分析20世纪初台湾历史地图,揭示淡水地区茶园分布变化。研究人员采用YOLOv8模型识别1904年和1921...这项研究展示了人工智能在历史地理研究中的潜力,为分析土地利用变迁提供了高效新方法。
- 2025-06-29 18:57淵_ken的博客 随后,BERT等预训练模型的推出进一步推动了大模型的发展,使得模型参数量快速增长,并在多个自然语言处理任务上取得了显著的性能提升(2) Transformer模型结构(3) Transformer工作流程:获取输入(4) Transformer工作...
- 2025-06-05 16:17大模型微调老炮的博客 在2025年Snowflake峰会上,OpenAI CEO Sam Altman与Snowflake CEO Sridhar Ramaswamy探讨了AI发展与企业应用策略。他们指出,当前AI模型可靠性显著提升,建议企业"立即行动、快速迭代"。Altman强调,过去一年模型...
- 2025-09-17 13:34天枢InterGPT的博客 【摘要】面对数据壁垒,中小企业可借助行业数据空间,安全汇聚碎片化数据。通过公平的价值交换机制,将“小数据”转化为驱动行业发展的“大智能”,实现协作共赢的数字化转型。
- 2025-12-20 16:31AI大模型-搬运工的博客 本文提出Sentosa LLM智能维护框架,通过分层架构整合大模型语义理解与小模型精准计算能力,针对工业场景实时性、可靠性等挑战提出解决方案。经通信机房节能与储能电站故障检测案例验证,该框架显著提升预测精度、...
- 2026-02-19 12:01AI Agent学习教程的博客 为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单,这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能...
- 2023-11-06 02:58光子AI的博客 随着技术的飞速发展,人类已经无法用眼睛来看待世界,而是需要通过一些机器来代替人的感官。...然而,在过去几年里,人工智能领域一直被长期忽视的一个重要主题就是大模型学习(Massive Model Learning)。
- 2026-01-08 21:23AI大模型元子的博客 该系统采用动态搜索流程,相比传统RAG方法在开放式问题上表现更优,性能较单智能体提升90.2%。文章详细介绍了系统架构、执行流程、提示工程原则及评测方法,揭示了多智能体在并行任务、大上下文窗口需求场景的优势,...
- 2026-01-16 13:15minhuan@智循AI的博客 本文深入解析了大模型处理长文本的三大核心概念:上下文窗口、注意力跨度和数学边界。上下文窗口决定了模型单次推理可处理的文本长度上限;注意力跨度反映了模型在窗口内有效关注的范围;数学边界则是由算法复杂度和...
- 2024-10-16 20:00正在走向自律的博客 机器学习是一种让计算机系统具备从数据中学习的能力,并通过学习不断优化和改进性能的技术。它主要分为监督学习、无监督学习和强化学习三种类型。在监督学习中,通过已标记的数据进行训练,学习输入数据与输出标签...
- 2025-12-18 18:30AI产品经理的博客 本文系统解析了大模型与智能体的本质区别,指出智能体是一种系统级工程方法论,适用于多步骤、动态决策、工具调用等复杂任务。文章详细分析了智能体的优势(规划能力、工具使用、状态维护)和缺陷(成本高、不稳定、...
- 2025-12-31 14:52代码输入中...的博客 摘要:大模型正成为职场人高效数据分析的智能助手,无需编程即可完成专业级处理。文章详细介绍了六大关键步骤:1)多源数据智能整合(5-10分钟完成传统半天工作);2)自动化数据清洗(识别缺失值、异常值并智能修复...
- 2025-11-12 09:52大模型研究院的博客 当大模型接收到一段医疗文本(如病历、护理记录),会让分词器将其切成很多个小块,这些小块就是token。token可以是单个汉字、词语、短语、标点符号,甚至是单词的一部分。当大模型输出时,也是一个token,一个token...
- 2024-09-05 20:05江湖人称麻花滕的博客 为提高人工智能大模型全生命周期的价值和性能,推动大模型在各行各业落地应用,需要把以数据为中心的人工智能理念和技术贯穿于大模型全生命周期。在分析大模型数据治理的内涵特征、必要性、特殊性及重点内容等基础上...
- 2025-02-04 21:43大模型玩家的博客 三、大语言模型未解决的问题和挑战 (一)未解决的问题 本部分将深入探讨与LLM相关的未解决问题,这些问题最近成为人工智能研发的焦点。 下面将阐明这些未解决的问题的重要性,强调它们对各种应用和整个人工智能...
- 2025-08-14 01:13AI算力网络与通信的博客 企业级提示界面可定义为:在企业AI系统中,负责连接业务用户/系统与AI模型,实现意图表达、上下文管理、输出处理和交互控制的完整架构层。它超越了简单的文本输入框概念,是融合业务逻辑、交互设计、安全控制和性能...
- 没有解决我的问题, 去提问