Java dna序列根据汉明距离的错误阈值生成对应哈希值 hashcode

问题遇到的现象和发生背景

例如，假设我们处理的是16个字符的DNA序列，其中每个字符只能是A、C、T或G。
给定一个DNA序列 "ACGTGTAC "和一个最多两个字符的错误阈值，我们会考虑另一个DNA序列, 认为另一个DNA序列 "ACCTGTAT "是类似的。考虑到这两个序列的相似性，我们最好为它们生成相同的哈希码，并将它们放在哈希图的同一个桶中。

如果我们使用hashmap的典型方法，这两个文件会产生不同的哈希码，并因此会被放置在哈希姆普的不同桶中。因此，总体目标是最大限度地提高类似对象之间的碰撞对象之间的碰撞最大化，同时使不相似的对象之间的碰撞最小化。

运行: 导入包含10000个独特的16个字符的DNA序列的字符串来生成hashmap。例如: CTAGATGTGTAGATGG 请注意，一个序列中只允许有4个可能的字符（A、C、T、G）。
你可以假设在所有的测试案例中，它总是16个字符的DNA序列。

要如何在不参照之前的序列情况下修改hashCode()方法来达到以上的目的？

以下是对应的java代码，修改hashCode()

public class DNASequence {

    private String sequence;

    public DNASequence(String sequence) {
        this.sequence = sequence;
    }

    public String getSequence(){
        return sequence;
    }

    public String toString() {
        return sequence;
    }

    public int hashCode() {
        //在这里修改生成方法
    }

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
不懂人情世故 2022-10-24 21:55
关注
我提供另一个思路: 找出所有相似的(误差2个字母以内)的序列, 遍历10000个序列,
第一个序列需要和剩下的9999个序列比较, 第二个序列需要和剩下的9998个序列比较, 第三个序列需要和剩下的9997个序列比较,
效率可能有点慢, 但是可以实现你的需求,
但是这个方法比较绝对, 无法实现你说的: "提高类似对象之间的碰撞对象之间的碰撞最大化，同时使不相似的对象之间的碰撞最小化。"

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

java不同对象的hashcode为什么一样 idea java 开发语言
2021-07-19 12:21

回答 5 已采纳万物都是对象，f是对象，h也是对象，f和h里的b也是对象，所有的对象都是独立的，这句话没错，所以，所有的对象都有自己独立的空间，而f里面包含了b，这叫对象的组合，嵌套，所以即使b在f里面，b也有自己独
两道与Java有关的问题（图片文件读入内存；字符串哈希值保存到文本文档） java 有问必答
2022-11-28 14:27

回答 2 已采纳 import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import ja
关于打印出@加哈希值 java 有问必答
2021-03-18 18:14

回答 4 已采纳 test类加一个toString的方法，返回String，具体内容看你自己想要的打印结果。如： public String toString(){ return "myEvent="+my
详解Java虚拟机
2021-10-29 00:24

希昂的学习日记的博客 JAVA虚拟机
谁能解释下java语言字符串的计算hashcode的算法的详细说明具体是什么样的开发语言
2020-05-31 11:37

回答 2 已采纳 Object 的源码定义了这个方法，可以看看。hashCode 主要是跟地址有关。 JVM每 new一个Object,它都会将这个Object丢到一个Hash哈希表中去,这样的话,下次做 Objec
关于HashSet增删的问题，改变哈希值 java
2021-11-05 22:34

回答 1 已采纳首先明确一点：HashSet中找到一个对象首先会根据对象的hashCode方法计算出hash，用这个hash找到一个坐标，再在这个坐标下找equals方法判断相等的对象。你重写了hashCode方法，
Java Swing的getPassword()和getText()报空指针错误 java 有问必答
2021-11-15 16:52

回答 3 已采纳如果你的username.getText() 为null的话，toString()是无法执行的。
jvm基础相关知识
2021-11-07 17:51

u011533553的博客 1、JVM与Java体系结构 1.1、JVM整体架构 ■ HotSpot VM 是目前市面上高性能虚拟机的代表作之一 ■ 它采用解释器与即时编译器并存的架构 ■ 在今天，Java 程序的运行性能早已脱胎换骨，已经达到了可以与 C/...
是不是所有的哈希表集合可以重写equals和hashcode java 有问必答
2021-05-16 17:13

回答 3 已采纳理论上是可以，大部分情况下没必要这么做吧！
想对字符串哈希，但一直错误 c语言哈希算法
2022-05-31 18:02

回答 1 已采纳 #define ll long long // 双Hash方法，不同的Base和MOD，相当于两次单Hash ll Base1 = 29; ll Base2 = 131; ll MOD1 =
使用提交哈希时，出现模块“未知修订”错误
2019-08-08 18:15

回答 1 已采纳 For your most recent hash aca080dccfc2, was that merged to master, or what does that hash correspo
JVM内存与垃圾回收篇
2022-05-31 16:20

。ming。的博客一，JVM与Java体系结构 1，前言作为Java工程师的你曾被伤害过吗？你是否也遇到过这些问题？运行着的线上系统突然卡死，系统无法访问，甚至直接OOM 想解决线上JVM GC问题，但却无从下手新项目上线，对各种...
C#分块加密转JAVA如何实现 c# java 哈希算法
2023-03-20 11:49

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ在Java中可以使用Java自带的MessageDigest类实现哈希算法，如SHA-1算法，可以使用以下代码： import java.security.MessageD
深入理解JAVA虚拟机大全
2020-07-29 21:59

我爱肉肉的博客 JAVA执行流程 Java源码(xxx.java) -> Java编译器 -> (第一次编译生成) 字节码(xxx.class) -> Java虚拟机 (类加载器-> 字节码校验器 -> 翻译字节码和JIT编译器(执行引擎部分，还包含gc等) (第二次...
哈希表和字符串
2020-12-07 16:17

你的boy_Z的博客哈希表和字符串经典算法算法准备数据结构复习 HashTable 线程安全，操作函数使用synchronized关键字修饰，保证线程安全；初始默认容量 11，拓展因子 0.75；最大值，为Integer.MAX_VALUE - 8; 扩容为oldsize<&...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 10月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 10月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 10月24日
展开全部

悬赏问题

¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场部分对应不上
¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？

Java dna序列根据汉明距离的错误阈值生成对应哈希值 hashcode

问题遇到的现象和发生背景

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新