2 hell o  world hell_o__world 于 2015.05.28 15:44 提问

怎么提高哈希表插入效率? 5C

key 值和 value 都是长整形,key 值可以重复 ,即一个 key值可以有多个 value 值,
各位大牛有没有什么好的想法觉得可以加快插入速度,比如多线程?

2个回答

caozhy
caozhy   Ds   Rxr 2015.05.28 15:53

要提高效率,首先需要做两件事情,一个是算法优化,分析你的算法复杂度,是不是有更优化的算法存在。
比如hash表插入,最理想的算法也必须是logN,当然如果你超过这个,有优化的可能,如果已经是logN就不要折腾了。
然后是代码优化,你首先要分析你的算法的理论最优运行时间,比如说,你插入hash,必须要遍历一次数据,那么如果你想比这个时间还短,就不要费工夫了。
然后找到程序的热点,也就是调用次数最多,耗时最长的地方。对热点优化比盲目乱优化有效地多。另外避免重复优化,优化的代码要放在全局的角度来考虑。
至于多线程能不能提高性能,要看你的瓶颈是不是在cpu上,如果在io上,多线程只会帮倒忙,另外你的计算机要有不止1个处理器。

hell_o__world
hell_o__world 代码优化这一块也不太清楚,不是我负责的。现在就是想看看有没有什么好的想法,拿搜索引擎来说吧,他是怎么实现从海量数据里面提取信息并插入的?
接近 3 年之前 回复
caozhy
caozhy   Ds   Rxr 2015.05.28 17:05

搜索引擎使用的是倒排索引,并且有分布式的架构。另外,搜索引擎编录数据不用考虑数据的完整性和事务的一致性。

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!