关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
jingshark鲨鲨
2015-08-05 05:06
采纳率: 0%
浏览 2948
首页
现在有1500万条数据,想从中随机抽取50万条,采用什么方式比较快捷?
现在有1500万条数据,想从中随机抽取50万条,采用什么方式比较快捷。数据是存储在mysql里的。
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
结题
收藏
举报
6
条回答
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
不得闲
2015-08-05 05:46
关注
额,试试随机生成Where条件来做
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(5条)
向“C知道”追问
报告相同问题?
提交
关注问题
10个
数据
分析自动化工具链的最佳实践,AI应用架构师总结
2025-12-23 14:41
光子AI的博客
根据Gartner 2023年报告,78%的企业
数据
团队每周花费超过20小时在重复性
数据
处理工作上,而仅有12%的分析结果能真正转化为业务行动。这种低效不仅制约了
数据
价值的释放,更让企业在瞬息万变的市场中错失先机。核心...
LLM大模型中文开源
数据
集集锦(三)
2023-05-16 23:56
悟乙己的博客
文章目录 1 ChatGLM-Med: 基于中文医学知识的ChatGLM模型微调 1.1
数据
集 1.2 ChatGLM+P-tuning V2微调 1.3 Llama + Alpaca的Lora微调版本 2 LawGPT_zh:中文法律大模型(獬豸) 2.1
数据
集 2.1.1 利用ChatGPT清洗...
数据
分析题库
2022-06-14 17:21
Ysprin的博客
数据
分析题库
万字长文解释 ChatGPT 在做什么,以及为什么它能发挥作用?
2023-02-19 10:30
智能交通技术的博客
利用这一点,我们可以开始生成 “句子”,其中每个词都是独立
随机
抽取
的,其出现的概率与语料库中的相同。下面是我们得到的一个样本: 不足为奇的是,这是一派胡言。那么,我们如何才能做得更好呢?就像对待字母一样...
使用django从
数据
库中
随机
取N条记录的不同方法及其性能实测
2013-12-05 19:43
CuGBabyBeaR的博客
这里(stackoverflow)有一篇关于使用Django
随机
获取记录的讨论。 主要意思是说 Record.objects.order_by('?')[:2] 这样获取2个记录会导致性能问题,原因如下: “ 对于有着相当多数量记录的表来说,这种方法异常...
AI应用架构师必修课:AI驱动企业战略规划系统的7大核心设计原则
2025-07-30 02:58
光子AI的博客
兼容多源
数据
接入
数据
仓库 Snowflake, Databricks, BigQuery 支持结构化战略指标
数据
,提供SQL查询与实时分析能力 ETL/ELT工具 Apache Airflow, Fivetran, Talend 自动化
数据
抽取
-转换-加载,支持复杂
数据
清洗规则 ...
大
数据
分析与挖掘
2021-02-23 21:38
狄洺的博客
概念:
数据
分析是用适当的统计分析方法,对收集来的大量
数据
进行分析,提取有用信息和形成结论并对
数据
加以详细研究和概括总结的过程。
数据
分析可以分为三个层次,即描述分析、预测分析和规范分析。
数据
挖掘:...
ChatGPT 在做什么… 以及它为何发挥作用?最新关于ChatGPT的论文速递
2023-02-15 15:57
AbnerAI的博客
假设你
想
知道(就像伽利略在 15 世纪末所做的那样),从比萨塔的每一层落下的炮弹要多长时间才能落地。那么,你可以在每一种情况下测量它,并将结果制成表格。或者你可以做理论科学的精髓:建立一个模型,给出某种...
大
数据
领域
数据
清洗的技术发展动态
2025-10-05 17:23
AI 项目管理的博客
无论你是刚接触大
数据
的新手,还是需要解决实际
数据
问题的工程师,都能
从中
找到有用的信息。本文将按照"历史演变→核心技术→实战案例→未来趋势"的逻辑展开:首先用生活故事引出
数据
清洗的必要性,然后拆解不同阶段...
山东大学软件学院2022
数据
化企业期末复习总结
2022-05-27 16:05
南河的南的博客
山东大学软件学院2022年5月24日
数据
化企业期末考试复习
17万字 | 2021密码应用技术白皮书(附下载)
2022-01-26 12:14
炼石网络的博客
在获取高价值
数据
的过程中,往往需要借助
数据
挖掘等方法深度分析海量
数据
,
从中
提取出对未来趋势与模式预测分析有价值的
数据
。 基于以上四个特性分析,
数据
在参与经济建设、社会治理、生活服务时,具有重要意义。一...
B.
数据
挖掘[一]---汽车车交易价格预测(测评指标;EDA)
2021-09-07 10:51
汀、人工智能的博客
来自 Ebay Kleinanzeigen 报废的二手车,数量超过 370,000,包含 20 列变量信息,为了保证 比赛的公平性,将会
从中
抽取
10
万条
作为训练集,5
万条
作为测试集 A,5
万条
作为测试集 B。同时会对名称、车辆类型、变速...
深度学习:卷积神经网络从入门到精通
2019-03-28 23:30
蔚1的博客
有兴趣的读者可以从本书开始,通过图像分类、识别、检测和分割的案例,逐步深入卷积神经网络的核心,掌握深度学习的方法和精髓,领会 AlphaGo 战胜人类世界冠军的奥秘。 作者简介 李玉鑑(鉴) 北京工业大学教授,...
Linux日常使用技巧(一)
2021-08-21 19:20
花花少年的博客
Linux日常使用技巧(一)
【论文&模型讲解】CLIP(Learning Transferable Visual Models From Natural Language Supervision)
2022-10-12 09:00
friedrichor的博客
多模态模型 CLIP 讲解,对应...CLIP 的迁移能力是非常强的,预训练好的模型能够在任意一个视觉分类的
数据
集上取得不错的效果,而且最重要的是它是 zero-shot 的,即完全没有在这些
数据
集上做训练就能得到这么高的性能。
金融科技领域的大
数据
批处理解决方案
2025-07-11 02:45
AI大数据智能洞察的博客
实际上,一家中型银行每天的交易
数据
就可能达到TB级(1TB相当于100万本百科全书),而大型金融机构甚至会达到PB级这些
数据
不仅量大,还涉及敏感信息(如账户密码、身份证号),且必须满足监管机构的"每一笔交易都要...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告