如何将两个文本随机分为个体编号相同的两组

我有两个文件,一个是popdata1,一个是ped,里面的
popdta1文件的表头是

Progeny G Phen Polygene QTL TBV
1 539 1 -0.758716 0.028109 -0.504285 -0.476176
2 540 1 -0.166460 0.047796 -0.702893 -0.655097


ped文件的表头是

Progeny Sire Dam
1 539 6 77
2 540 6 347
3 541 6 308
4 542 6 316

现在,我想把两个文件随机分成两组,1/3的数据做验证,2/3的数据做训练,怎么可以保证两个文件分成的个体是一样的


1个回答

用pandas来分就可以了。你查下pandas

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
10个随机数,需要分为两组,每组分别5个数,要求两个组的和值最接近

比如一个数组10个随机数,需要分为两个数组,每个数组5个数,要求两个数组的和值最接近,怎么编程?

有两个文本文件,每一行是一个单词,写一个Java程序能够找出这两个文本中相同的单词。

有两个文本文件,每一行是一个单词,写一个Java程序能够找出这两个文本中相同的单词。 1.需要考虑所有有可能出现的异常,需要有较好的用户体验,出现异常应该有友好的提示信息而不是java中的Exception; 2.程序尽量简洁高效,要求两个文本中各有10万单词量时,找出相同单词的时间不超过0.5秒; 3.对写的程序要有完整的单元测试代码。 我遍历做的然后把它们相同的单词存到HashSet中了,但是时间上差不多一秒钟左右,超过了0.5s,还有单元测试没有想法,当两个文本文档的单词量达10万量级,我怎么去测试我写的函数返回的结果就是我想要的呢?求指点,谢谢

python程序如何找出两个文本中相同的词。

1 你好 小明 学习 非常 好 2 你好 小红 学习 非常 棒 例如上面两个已经用分词工具处理好的文本,最后希望得到的结果输出是 3(因为这两个文本有三个相同的词)求一个解决这个问题的python程序,或者思路也可以。非常感谢

写一个Java程序能够找出这两个文本中相同的单词,求帮忙看看哪里错了?

``` package union.practice; import java.io.BufferedReader; import java.io.File; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import java.util.HashSet; import java.util.Set; /** * 有两个文本文件,每一行是一个单词,写一个Java程序能够找出这两个文本中相同的单词。 * 1.需要考虑所有有可能出现的异常,需要有较好的用户体验,出现异常应该有友好的提示信息而不是java中的Exception; * 2.程序尽量简洁高效,要求两个文本中各有10万单词量时,找出相同单词的时间不超过0.5秒; 3.对写的程序要有完整的单元测试代码。 */ public class App { // commonStringSet存储最后结果 public static volatile Set<String> commonStringSet = new HashSet<String>(); public static volatile Set<String> setA = new HashSet<String>(); public static volatile Set<String> setB = new HashSet<String>(); /** * 找出两个文本文件中相同的单词 * * @param file1 * 文件1文件名 * @param file2 * 文件2文件名 * @param destination * 相同文本存储的位置 */ public Set<String> findCommonWordsInTwoFiles(String fileA, String fileB) { //开启两个线程,分别读取两个文件的内容存储到他们对应的HashSet,同时比较当前读取到的内容是否存在于另一线程对应的集合中,如果在,添加到公共集合 final String tempFileA = fileA; final String tempFileB = fileB; Thread tA = new Thread(new Runnable() { public void run() { File fA = new File(tempFileA); try { BufferedReader bfA = new BufferedReader(new FileReader(fA)); // 读取文件1中的内容存储于set1中 String temp = null; while ((temp = bfA.readLine()) != null) { synchronized (setA) { setA.add(temp); } if(setB.contains(temp)) synchronized (commonStringSet) { commonStringSet.add(temp); } } bfA.close(); } catch (FileNotFoundException e) { System.out.println("待查找的文件不存在"); } catch (IOException e) { System.out.println("系统读取文件异常"); } } }); tA.start(); Thread tB = new Thread(new Runnable() { public void run() { File fB = new File(tempFileB); try { BufferedReader bfB = new BufferedReader(new FileReader(fB)); // 读取文件1中的内容存储于set1中 String temp = null; while ((temp = bfB.readLine()) != null) { synchronized (setB) { setB.add(temp); } if(setA.contains(temp)) synchronized (commonStringSet) { commonStringSet.add(temp); } } bfB.close(); } catch (FileNotFoundException e) { System.out.println("待查找的文件不存在"); } catch (IOException e) { System.out.println("系统读取文件异常"); } } }); tB.start(); //等待AB线程执行结束后返回 try { tA.join(); tB.join(); } catch (InterruptedException e) { System.out.println("系统不能处理您的请求"); } return commonStringSet; } } ``` 测试的时候拿已知的HashSet结果与函数返回的结果相比较,但是从运行结果来看,并不总是相等的,我想问题应该是出在同步的层面,求解释(测试时数据量比较大,其中一个文件有10万行,一个文件两百行)

如何将两个字符数组里的数字相加得出两组数的和

char a[1000],b[1000] 两个数组里都是数字

怎样产生同时两个随机数

我想做两个随机数的乘法,但不知道怎么才能同时产生两个随机数,求各位帮忙

jsoup如何提取两个相同标签之间的文本

![图片说明](https://img-ask.csdn.net/upload/201605/17/1463499815_586678.png) 如何提取两个<a name = "xxxx"></a>之间的全部文本内容?真心急!!!

java怎么求两个数组的相同元素

如果定义两个数组 int[] a = {1,1,2,3,4,4,5,7,7}; int[] b = {2,5,4,4,4,7,7,7,7}; 它们的相同元素应该是2,4,4,5,7,7, 怎么用代码求出相同元素并放到另外一个数组中

问一个求两组数相似程度的比较方法

如题,这两组数据的对应位置无关,属于统计学的范畴。譬如说,A、B两组数据中,A组数据符合正态分布,那么求B组数据属于A组数据的可能性?这个应该用什么方法呢?

如何将多个txt文本合并在一个文本里面并且完全打乱行序

我现在有几个个txt文件,每个文件里面都是一行一行的数据,单个文件差不多1G, 我现在想把他们合并在一个txt文件中,并且打乱他们的行序,我原本想各个文件先读取几行,放在一个数组里面打乱写入新的文本,接着在读取这些文件接下来的几行,还是合并打乱写入,知道全部读完,但是我不知道怎么去控制这个每次读取那些行

如何用keras对两组数据用相同的网络进行训练并且画在一个acc-loss图?

假如我有A,B两组数据,我想用两个的loss-acc图来对比得出哪组数据更好,所以如何将这两组数据同时进行训练并将结果画在一个acc-loss图?

sqlserver 两个表关联1:n求随机取一条数据的sql语句实现!

现在要补齐tb1中演唱歌曲字段。条件是去tb2中查找相同艺人演唱过的歌曲,随机填充到tb1中的歌曲名字段 一个歌手不止演唱一首歌,所以tb2中是艺人演唱所有歌曲的集合。tb1中同一个歌手可能出现好几次 补齐时候需根据tb1中艺人名称去tb2也就是艺人歌曲汇总表中查找相同艺人演唱的歌曲名称。 需要在艺人名相同情况下随机取tb2中演唱歌曲名去一一补齐tb1中的字段 tb1 tb1 艺人 演唱歌曲名 a null b null c null a null s null d null e null tb2 艺人 演唱歌曲名 a aa a ab b bb b ba b bbb d dd d d2 f ddd c cc 艺人 演唱歌曲名称 a aa (tb1中的艺人名会出现好几次每次在tb2中,只要随机的一条来填充) a ab b bb d dd c cc

C++如何从两个文本文件中读取数据!急急急

例如:从a.txt中读取数据存到数组a, 从b.txt中读取数据存到数组b. 用 freopen("D:\\a.txt", "r", stdin) freopen("D:\\b.txt", "r", stdin) 每次都是数组a读进来了 数组b死活没有数据!!! 求大神帮忙啊!!

C# 如何比较两个元素中的值是否完全相同

第一个数组 string 【】str1 第二个数组 string 【】str2 如何判断两个数组中的值是否完全相等 如str1中存{1,2,3},str2中存{1,2,3} 则是相等的

请教python如何查找两个 EXCEL 中的相同单元格,计算对应值并导出?

![图片说明](https://img-ask.csdn.net/upload/201812/25/1545753249_796773.png) ![图片说明](https://img-ask.csdn.net/upload/201812/25/1545753261_291658.png) 我是一个自学Python的新手,现在想写大致如下的一个小程序。 举个例子,一个表格为水果价目表,包含水果名称和价格。另一个表格为水果销售量,包含水果名称和销售数量。现在想要通过 python 导入两个表格数据,查找同名称的单元格,然后将对应的价格与数量相乘,最后导出一个新的表格,包含水果名称和销售金额。 我的思路是将两个EXCEL表格导入成两个字典,比较key,如果相同,则将value进行相乘,不知可不可行,有没有更好的方法,现在向专家们请教,感谢!

linux下如何实现将两个文本中的数进行相加,然后按照相同的格式输到第三个文件中去

![图片说明](https://img-ask.csdn.net/upload/201702/20/1487576066_858305.png)

java 集合问题找出两个集合中相同的元素并打印出来

把1-100 数随机放入到 数组长度为[97] 并且这些元素不能重复,找出未输入进数组的数!

怎么在一个数组中将数分为两部分,并且相互配对

数组配对数数字的问题,怎么在一个数组中将数分为两部分,并且相互配对,寻找配对后差的绝对值最小的组合?

JAVA中获取两个字符串差异的方法

求助,在编程的过程中碰到这样一个问题,有两个String字符串,然后我需要获取他们之间的差异 String s = {"12345"}; String s1 ={"123645"}; 其中这两个数组的长度可变,s是模板,所有的数组都要和这个数组比较,然后把差异的部分获取出来 所以s1可以是缺了一两个元素的数组,仅仅是单个的字符被替换了,这个可以简单的用字符数组一个一个比较获得,但是如果多一个,或者少一个,这一块我就有点不懂了,如果说只是多一个的话,还行,遇到不一样的元素,然后看他后一个是否一样,如果不一样的话,那么把这个元素和他后面的元素另存为,然后删除,再继续比较,但是少于一个的话,就有点不懂了,请问各位经验丰富的前辈指点指点,谢谢,感激不尽

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

删库了,我们一定要跑路吗?

在工作中,我们误删数据或者数据库,我们一定需要跑路吗?我看未必,程序员一定要学会自救,神不知鬼不觉的将数据找回。 在 mysql 数据库中,我们知道 binlog 日志记录了我们对数据库的所有操作,所以 binlog 日志就是我们自救的利器。 接下来就来开启程序员自救之路。 想要自救成功,binlog 这把利器一定要好,在自己之前,我们一定要确定我们有 binlog 这把利器,以下就是确保有 bi...

再不跳槽,应届毕业生拿的都比我多了!

跳槽几乎是每个人职业生涯的一部分,很多HR说“三年两跳”已经是一个跳槽频繁与否的阈值了,可为什么市面上有很多程序员不到一年就跳槽呢?他们不担心影响履历吗? PayScale之前发布的**《员工最短任期公司排行榜》中,两家码农大厂Amazon和Google**,以1年和1.1年的员工任期中位数分列第二、第四名。 PayScale:员工最短任期公司排行榜 意外的是,任期中位数极小的这两家公司,薪资...

我以为我学懂了数据结构,直到看了这个导图才发现,我错了

数据结构与算法思维导图

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

华为初面+综合面试(Java技术面)附上面试题

华为面试整体流程大致分为笔试,性格测试,面试,综合面试,回学校等结果。笔试来说,华为的难度较中等,选择题难度和网易腾讯差不多。最后的代码题,相比下来就简单很多,一共3道题目,前2题很容易就AC,题目已经记不太清楚,不过难度确实不大。最后一题最后提交的代码过了75%的样例,一直没有发现剩下的25%可能存在什么坑。 笔试部分太久远,我就不怎么回忆了。直接将面试。 面试 如果说腾讯的面试是挥金如土...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

讲一个程序员如何副业月赚三万的真实故事

loonggg读完需要3分钟速读仅需 1 分钟大家好,我是你们的校长。我之前讲过,这年头,只要肯动脑,肯行动,程序员凭借自己的技术,赚钱的方式还是有很多种的。仅仅靠在公司出卖自己的劳动时...

上班一个月,后悔当初着急入职的选择了

最近有个老铁,告诉我说,上班一个月,后悔当初着急入职现在公司了。他之前在美图做手机研发,今年美图那边今年也有一波组织优化调整,他是其中一个,在协商离职后,当时捉急找工作上班,因为有房贷供着,不能没有收入来源。所以匆忙选了一家公司,实际上是一个大型外包公司,主要派遣给其他手机厂商做外包项目。**当时承诺待遇还不错,所以就立马入职去上班了。但是后面入职后,发现薪酬待遇这块并不是HR所说那样,那个HR自...

女程序员,为什么比男程序员少???

昨天看到一档综艺节目,讨论了两个话题:(1)中国学生的数学成绩,平均下来看,会比国外好?为什么?(2)男生的数学成绩,平均下来看,会比女生好?为什么?同时,我又联想到了一个技术圈经常讨...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

外包程序员的幸福生活

今天给你们讲述一个外包程序员的幸福生活。男主是Z哥,不是在外包公司上班的那种,是一名自由职业者,接外包项目自己干。接下来讲的都是真人真事。 先给大家介绍一下男主,Z哥,老程序员,是我十多年前的老同事,技术大牛,当过CTO,也创过业。因为我俩都爱好喝酒、踢球,再加上住的距离不算远,所以一直也断断续续的联系着,我对Z哥的状况也有大概了解。 Z哥几年前创业失败,后来他开始干起了外包,利用自己的技术能...

现代的 “Hello, World”,可不仅仅是几行代码而已

作者 |Charles R. Martin译者 | 弯月,责编 | 夕颜头图 |付费下载自视觉中国出品 | CSDN(ID:CSDNnews)新手...

!大部分程序员只会写3年代码

如果世界上都是这种不思进取的软件公司,那别说大部分程序员只会写 3 年代码,恐怕就没有程序员这种职业。

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

HTTP与HTTPS的区别

面试官问HTTP与HTTPS的区别,我这样回答让他竖起大拇指!

程序员毕业去大公司好还是小公司好?

虽然大公司并不是人人都能进,但我仍建议还未毕业的同学,尽力地通过校招向大公司挤,但凡挤进去,你这一生会容易很多。 大公司哪里好?没能进大公司怎么办?答案都在这里了,记得帮我点赞哦。 目录: 技术氛围 内部晋升与跳槽 啥也没学会,公司倒闭了? 不同的人脉圈,注定会有不同的结果 没能去大厂怎么办? 一、技术氛围 纵观整个程序员技术领域,哪个在行业有所名气的大牛,不是在大厂? 而且众所...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

终于懂了TCP和UDP协议区别

终于懂了TCP和UDP协议区别

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

立即提问
相关内容推荐