weixin_47375012 2021-03-29 16:45 采纳率: 40%

已采纳

留学狗求大佬帮我看看这个C++哈希的问题怎么解答，需要在linux上跑

这是英文原文，链接: https://pan.baidu.com/s/1obkghFd_C59xibGdI_-Mlw 提取码: r75f

以下是翻译版本问题要求：

描述（85分可交付成果/正确性/ 15分设计）

我们首先提供您对该问题将要做什么的摘要。可交付成果文件的末尾将提供输出格式。您将测试每个哈希具有以下内容的实现：

A）表中的元素总数（N），表的大小（T），负载系数（Lambda = N / T），平均碰撞次数（M = C / N）和总碰撞次数碰撞（C），

B）您将检查另一个给定文件query_words.txt中的每个单词是否在哈希中表格，并根据是否找到该单词打印相应的输出找到了，找到该单词需要进行多少次探查（如果存在）。虽然你是随文件一起提供，我们将使用看不见的测试文件以及另一个文件名，该文件名可能会包含words.txt中所有单词的子集。

为了实现上述目的，您将编写一个名为create_and_test_hash.cc的测试程序。您的程序应像这样从终端运行（终端提示符为％）：

% ./create_and_test_hash <words file name> <query words file name> <flag>

对于二次探测应为“二次”，对于线性探测应为“ linear”，而“ double”应为“ double” 用于双重哈希。

哈希和堆项目例如，您可以在终端上写：

% ./create_and_test_hash words.txt query_words.txt quadratic

您可以使用提供的Makefile来编译和测试您的代码。

对于双哈希，格式将略有不同，即如下：

％./create_and_test_hash words.txt query_words.txt double R

或者，也可以使用：

％./create_and_test_hash words.txt query_words.txt double

这里R是在实现double时应该使用的可选R值在课堂上讨论并在教科书中描述的哈希技术：hash2（x）= R –（x mod R）。如果用户没有输入一个默认的R值，则应在代码中指定一个默认值命令行。

一，使用线性和二次探测进行散列（20分）

修改提供的代码，以进行二次和线性探测，并测试create_and_test_hash。

不要在其中的main（）函数内编写任何功能 create_and_test_hash.cc。在testHashingWrapper（）中编写所有功能该文件中的功能。我们将使用我们自己的main函数，直接调用 testHashingWrapper（）。此包装函数将传递所有命令行参数就像通常在主要功能中一样。

您将打印上面提到的值，然后打印查询的单词，无论它们是找到了，并确定了多少次探查。确切的交付物和输出格式在文件末尾进行了描述。

二。双重哈希（25分）

编写代码以实现double_hashing.h，并使用create_and_test_hash进行测试。这将是二次探测的变体。区别在于功能 FindPos（），现在必须使用其他策略来提供探测。作为第二个哈希函数，请使用在课堂讲义中讨论并在教科书中找到的hash2（x）= R – （x mod R）。我们将使用我们自己的R值测试您的代码。此外，请指定哪个R README.HASH文件中用于测试程序的值。切记不要在main（）函数中包含任何功能 create_and_test_hash.cc。

您将打印当前的R值，上面A部分中提到的值，然后是查询的单词，是否找到它们以及确定该单词需要进行多少次探查。精确的文件的末尾描述了可交付成果和输出格式。

三，拼写检查（40分）

现在，您可以通过使用线性或二次或双精度来实现拼写检查器哈希算法。给定一个文档，您的程序应正确输出所有带有此类标签的拼写单词以及所有拼写错误的单词。对于每个拼写错误的单词您应该提供字典中的候选更正列表，该列表可以由将以下规则之一应用于拼写错误的单词：

a）在任何可能的位置添加一个字符

b）从单词中删除一个字符

c）交换单词中的相邻字符您的程序应从命令行运行，如下所示：

% ./spell_check <document file> <dictionary file>

系统会为您提供一个名为document1_short.txt，document_1.txt的小文档，还有一个字典文件，其中包含大约370k个单词，名为wordsEnglish.txt。例如，您的拼写检查器应更正以下错误。

决定性->决定性（情况A）决策->决策（案例B）乡镇->国家（案例C）

纠正提供的词典文件中不存在的任何单词（即使它是正确的）英文）。

一些提示：1.请注意，我们提供的词典是实际英语词典的子集，只要您的拼写检查是合乎逻辑的，您就可以取得成绩。例如，字母“ i”不在词典中，更正可能是“中”，“如果”甚至是 “你好”。这是可接受的输出。

2.另外，如果将“编辑者”更正为“编辑者”，则可以。（案例B，删除特点）

3.我们建议删除开头和结尾的所有标点符号，对于所有标点符号单词会将字母转换为小写字母（例如，“ Hello！”被替换为“ hello”，在拼写检查之前）。

不要在spell_check.cc的main（）函数内编写任何功能。写该文件中的testSpellingWrapper（）内部的所有功能。我们将使用我们的自己的主要功能，直接调用testSpellingWrapper（）。该包装函数是传递了所有命令行参数，就像通常在main函数中一样。您将打印该单词，无论它是否已经正确拼写（又名找到），以及所有如果在词典中找不到该单词，则可能进行拼写更正。提防解析时在文档中使用标点符号和格式！确切的可交付成果和输出格式如下所述。

（以下某部分是我要递交的文件，我省略翻译）

格式对于线性和二次探测标志（第一部分），格式应如下：

number_of_elements: <int>
size_of_table: <int>
load_factor: <float>
average_collisions: <float>
total_collisions: <int>
<new line>
<word1> Found <probes1>
<word2> Not_Found <probes2>
<word3> Found <probes3>

请包括在表格属性部分和单词列表之间显示的单行（ASCII 10，列为“ <新行>”）。请加下划线在“没有”和“找到”之间。这里显示的单词列表是一个示例，实际输出将取决于query_words.txt中的单词。average_collisions和total_collisions的值将根据所使用的计算机而有所不同。切换机器或寻求帮助时请注意这一点。您的提交将在同一台计算机上评分，因此，只要您的实现对其他所有内容都是正确的，这些值就将保持一致。对于所有标记（线性，二次和双精度），都会发生这种情况。

正确输出的示例（数字不代表实际表）：

number_of_elements: 670
size_of_table: 1560
load_factor: 0.429487
average_collisions: 0.005
total_collisions: 3
hill Found 1
skiny Not_Found 3
baked Found 1

对于双标记（第二部分），格式应如下：

r_value: <int>
<SAME FORMAT AS LINEAR / QUADRATIC>

双散列的输出之间唯一的区别是增加了一行 r_value：<int>。紧接在该行下方的输出应与线性输出相同和二次探查，如上所述。请在“不”之间添加下划线和“找到”。

正确输出的示例（数字不代表实际表）：

number_of_elements: 200
size_of_table: 750
load_factor: 0.266666
average_collisions: 0.0135
total_collisions: 3
hill Found 1
skiny Not_Found 3
baked Found 1

对于拼写检查（第三部分），输出应如下所示。

<word1> is CORRECT
<word2> is CORRECT
<word3> is INCORRECT
*** <word3> -> <alternate word> *** case <TYPE: A, B or C>
*** <word3> -> <alternate word> *** case <TYPE: A, B or C>
<word4> is CORRECT

请确保您的空格，大写字母和换行符正确无误。请在输出中包括***和->。这里显示的单词列表是一个例如，实际输出将取决于文档文件中的单词。可能有每个案例类型有一个以上的结果。

正确输出的示例：（显示的单词不代表实际值输入）

country is CORRECT
likely is CORRECT
climbing is CORRECT
lwa is INCORRECT
*** lwa -> wa *** case B
*** lwa -> la *** case B
*** lwa -> law *** case C
cases is CORRECT

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ProfSnail 2021-03-29 17:29
关注
谢邀，私信沟通一手。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Linux C++后端开发学习路线参考汇总
2021-06-22 19:42

Go和分布式IM的博客 1年）：华中大守门员一、C++基础（3个月）二、计算机网络（1个月）三、操作系统（1个月）四、网络编程（1个月）五、数据结构与[算法]()及[刷题]()（2个月）六、mySQL数据库（7天~15天）七、[项目]()（2个月）总结...
题解 | #使用join查询找出没有分类的电影id以及名称#
2024-05-22 17:02

愤怒的小青春的博客感觉自己总是认不清自己，看到别人拿到大厂offer，自己也会酸，想去大厂，觉得自己读书这么多年，最终。...我问hr提交审批了吗，他说审批中的，不知道这是hr在骗我还是说真的在审批，或许说审批的时候还要排序，
题解 | #查找山东大学或者性别为男生的信息#
2023-11-03 21:09

2301_79125642的博客 #牛客在线求职答疑中心# #晒一晒我的offer# #我的实习求职记录# #焦虑校招# #听劝，这个公司值得去吗# 有无难兄难弟，真的好难，我的学涯。1 众安 base上海，白菜价运营，定岗无轮岗（具体有人爆料）已offer 2 满帮...
题解 | #某乎问答高质量的回答中用户属于各级别的数量#
2024-07-08 21:06

2301_79125642的博客三本+普通四非硕，这个月BOSS上已经投了秋招简历快四百份的小厂了，就一个约面，真的有人要吗，急麻。目前在北京小公司呆了三天了，了解到公司业务差不多是低代码和外包，而济南亚信离学校不远，且消费低，想去。...
51c大模型~合集90
2024-12-15 12:18

whaosoft-143的博客你注意到，有一两个坏人的国籍特别引起你的注意，因为你还提到了其他一些不好的做法，但他们没有提到国籍。
Java学习之路
2019-05-21 11:49

A记录学习路线的博客第一部分是我在参加2018春招时所写，主要记录了我在研究生期间学习Java后端的心路历程。第二部分内容是我参加2019秋季招聘过程中所作，记录了秋招路上所经历的一切。第三部分内容则是我在秋招尘埃落定之后，对之前...
2018 春招总结 & 面经分享 (阿里/腾讯/网易/今日头条/微软)
2018-05-11 16:01

CodingQK的博客最终有幸收到了今日头条（后端研发），网易杭州研究院（C++开发）和腾讯（IEG 后台开发）的offer，当然还是选择投入向往已久的鹅厂的怀抱啦。从三月初开始陆续投出简历，到收到一个接一个的提前批面试...
面试刷题11-25
2019-11-25 03:36

wwxy261的博客大家好，这是一篇超长面经+总结，是对自己上一阶段的梳理，也希望给以后准备找工作/正在找工作的同学们多多少少一点帮助。基本介绍：普通985本+海外渣硕，大二转到CS专业，大三项目交流3+2，19年10月留学毕业，有...
区块链技术
2018-01-10 17:35

老何_低调的博客为了激励大家帮我传话和记账，我决定给第一个听到我喊话并且记录在小本本上的人一些奖励：第一个听到我喊话并记录下来的人，你就凭空得到了1个查克拉，这个查克拉是整个系统对你幸苦记账的报酬，而你记录了这句话...
没有解决我的问题, 去提问

留学狗求大佬帮我看看这个C++哈希的问题怎么解答，需要在linux上跑

2条回答 默认 最新

2条回答默认最新