100亿行数据存在文件中，每行数据有一个数字，提取前100个最大数字，怎么搞？

假设:100亿行数据存在文件中，每行数据有一个数字，提取前100个最大数字，怎么搞？ (PHP+mysql实现思路即可)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2015-11-02 08:57
关注
用mysql数据库，那你直接把数据插入数据库好了，然后select的时候order排序。limit 100来限制

不过你有100亿，数据库可能支持不了，可以用小根堆的数据结构，遍历所有数字，然后比较插入。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

输出1～100按照每五个数字一行的行式来输出 c++ 有问必答
2021-06-23 19:51

回答 1 已采纳 #include "stdio.h" int main(){ int i; for(i=1;i<=100;i++){ printf("%d\t",i);
在sql中多大的数据才算是大数据？ java mysql 数据库
2022-03-31 17:24

回答 5 已采纳其实没有实际的标准明确定义多少数据量算大数据，不过阿里开发手册中建议，表数据超过500万条时，建议考虑分表，以防影响查询效率，不过我们公司也有单表超过几千万条的数据，效率确实不高，所以理论上百万级别以
高分悬赏提问，Java语言输出1到100，每5个数字换1行，具体怎么来编写开发语言
2019-12-02 00:24

回答 5 已采纳 ``` int count = 0; for(int i=1;i<101;i++){ if(count++ == 5){//先用后加，计数到了 5 个，输出空行，重置计数器
大文件中返回频数最高的100个词
2019-05-12 22:49

一颗向上的草莓的博客有一个1G大小的一个文件，里面每一行是一个词，词的大小不超过16字节，内存限制大小是1M，要求返回频数最高的100个词 2.思考过程（1）参见我的其他大数据面试题博文。此处1G文件远远大于1M内存，分治法，先hash...
如何找到以及清除一个数据表中，两个列中数值相同的数据行 mysql sql
2020-05-17 22:37

回答 5 已采纳先找出相同行的id，sql如下： ``` SELECT DISTINCT(t_s.id) FROM `t_score` t_s INNER JOIN ( SELECT * FRO
python显示100以内素数，5个一行 python
2022-03-29 11:20

回答 6 已采纳 n = 0 for i in range(2,101): count = 0 for j in range(2,i): if i%j == 0:
Python-产生100个随机的两位整数，将其中的偶数写到文件中，10个一行，并在最后输出偶数的个数 python
2022-06-07 01:32

回答 1 已采纳 import random list1, list2 = [], [] for i in range(100): list1.append(random.randint(10,99)) f
全球数据能存在一个咖啡杯中？DNA数据存储意外走红
2021-07-21 12:15

LinkTime_Cloud的博客 DNA储存能否成为数据存储技术的未来?随着互联网、物联网以及各类智能设施的发展，人类已经进入了一个数据呈爆炸式增长的时代。统计显示，目前全世界每天产生的邮件、照片、推文、视频等数字文件超过...
c语言输入输出练习,测试数据有多组，处理到文件尾。每组测试求n个整数之和。 c语言
2022-03-21 12:27

回答 1 已采纳提供参考，如果范围超过int请自行改为long long。 #include <stdio.h> int main() { int n, sum,num; while (~
猜数字游戏是令游戏机随机产生一个100以内 c语言
2021-11-04 09:44

回答 1 已采纳难度：简单解决思路：在一个循环里，不断比较用户输入和目标值的大小，并提示大了还是小了，循环结束的条件是猜数字次数大于 N 次或者输入负数。 PS：有问题可以再问我，学习数据结构和算法、C/C++、L
如何在Matlab挑出一组数据中所有不连续的数 matlab 数据结构有问必答
2022-03-17 15:22

回答 2 已采纳先要获取里面连续的段，然后获取里面的小于1~10的 clc;clear A = [1:2, 1:20, 5:8, 11:20]; c1 = 1; arrset = cell(0,0); while(
怎么在海量数据中找出重复次数最多的一个
2018-05-17 16:51

qq_39081511的博客　此题，在我之前的一篇文章算法里头有所提到，当时给出的方案是：IP的数目还是有限的，最多2^32个，所以可以考虑使用hash将ip直接存入内存，然后进行统计。　再详细介绍下此方案：首先是这一天，并且是访问百度的...
建立一个单链表，随机产生10个100以内的整数，代码已有，希望完善 c++ 数据结构有问必答链表
2022-05-04 02:39

回答 2 已采纳你题目的解答代码如下： #include<stdio.h> #include<stdlib.h> #include<time.h> struct Node{
python处理一亿条数据_Python 处理分析 14 亿条数据实战
2020-11-19 19:45

weixin_39607447的博客原文地址：Analysing 1.4 billion rows with python原文作者：Steve Stagg译文出自：掘金翻译计划本文永久链接：https://juejin.im/post/5aceae206fb9a028d2084fea译者...我想大概不会超过上亿条吧，今天分享一个用...
数据中台建设方案-基于大数据平台
2023-03-14 16:45

FRDATA1550333的博客通过对客户大数据应用平台服务需求的理解，根据建设目标、设计原则的多方面考虑，建议采用星环科技Transwarp Data Hub（TDH）大数据基础平台的架构方案，基于Transwarp Operating System（简称TOS）云平台方式部署...
没有解决我的问题, 去提问

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)

100亿行数据存在文件中，每行数据有一个数字，提取前100个最大数字，怎么搞？

1条回答 默认 最新

悬赏问题

1条回答默认最新