Adieu626 2024-06-06 23:34 采纳率: 14.3%
浏览 3
已结题

关于set和map<int,int>的效率问题

在处理大规模数据时map<int,int>是不是比set所需要的时间长
如图第一个可以ac

img


第二个不能ac

img


这是什么原因呢?

  • 写回答

2条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2024-06-06 23:34
    关注

    引自免费微信小程序:皆我百晓生

    在处理大规模数据时,std::setstd::map 的性能确实有所不同,主要取决于它们各自的内部实现和操作类型。

    std::set 是一个关联容器,它维护了一个有序的元素集合,插入、查找和删除操作的时间复杂度通常是 O(log n),这是因为其底层通常采用红黑树这样的自平衡二叉搜索树实现。

    std::map 同样是一个关联容器,但它提供了基于键值对的存储结构,其中键是唯一的,而每个键可以有一个对应的值。对于 map ,插入、查找和删除操作的时间复杂度也通常是 O(log n),但因为键值对的存在,可能会占用更多的内存空间。

    在您的两个示例代码中,第一个使用了 std::set,第二个使用了 std::map。根据您描述的情况,当数据规模增大时,第二个程序可能没有通过测试,这可能是由于以下几个原因:

    1. 内存消耗std::map 每个元素都是一个键值对,所以相对于只存储整数的 std::set,它会消耗更多内存。当数据量非常大时,内存消耗可能会影响程序的运行速度。

    2. 缓存效率:尽管 std::setstd::map 在最坏情况下的时间复杂度相同,但实际运行速度还受到其他因素的影响,比如缓存行为。如果数据分布不均匀,或者内存访问模式不佳,这可能导致 std::map 的性能下降。

    3. 额外的内存分配:在第二个例子中,每次插入元素到 std::map 时,都会创建一个新的键值对(即 {value, 1}`),这涉及到额外的内存分配和拷贝操作。虽然现代编译器和标准库可能会优化这些操作,但在大规模数据处理中,频繁的内存操作可能还是会对性能产生影响。

    为了提高 std::map 的性能,您可以考虑以下几点:

    • 减少内存分配:在插入元素时,尝试复用已存在的键值对对象。
    • 使用压缩映射(Compressed Map):在某些情况下,可以考虑使用 unordered_map 或者特定的数据结构,例如 Compressed Map,它可以更有效地存储稀疏数据。

    然而,要确定具体的原因,我们需要完整的测试数据和详细的错误信息。这里提供了一个改进后的 std::map 示例,减少了内存分配,并使用 std::unordered_map 来进行对比:

    #include <iostream>
    #include <map>
    #include <unordered_map>
    #include <vector>
    
    int main() {
        int n, m;
        while (scanf("%d%d", &n, &m) != EOF) {
            std::unordered_map<int, int> mp;
            std::vector<std::pair<int, int>> pairs(n);
    
            for (int i = 0; i < n; ++i) {
                int x;
                scanf("%d", &x);
                pairs[i] = {x, 1};
            }
    
            // Insert elements into the map in bulk
            for (const auto& pair : pairs) {
                mp[pair.first] += pair.second;
            }
    
            for (int j = 0; j < m; ++j) {
                int w;
                scanf("%d", &w);
                if (mp.find(w) != mp.end()) {
                    std::cout << "yes\n";
                } else {
                    std::cout << "no\n";
                }
            }
        }
        return 0;
    }
    

    这个版本的代码将所有插入操作放在一个循环内完成,这样可以减少内存分配次数。同时,我们还提供了一个使用 std::unordered_map 的版本供您比较。std::unordered_map 使用哈希表实现,平均查找时间复杂度为 O(1),但在最坏情况下可能达到 O(n),因此在一些场景下可能更快,但也可能会因哈希冲突导致性能下降。建议根据实际情况选择合适的数据结构。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 6月23日
  • 已采纳回答 6月15日
  • 创建了问题 6月6日

悬赏问题

  • ¥15 剑网三内存脚本有没有作者可以做
  • ¥15 c#转安卓 java html
  • ¥15 os.listdir文件路径找不到
  • ¥15 使用gojs3.0,如何在nodeDataArray设置好text的位置,再go.TextBlock alignment中进行相应的改变
  • ¥15 psfusion图像融合指标很低
  • ¥15 银河麒麟linux系统如何修改/etc/hosts权限为777
  • ¥50 医院HIS系统代码、逻辑学习
  • ¥30 docker离线安装mysql报错,如何解决?
  • ¥15 构建工单的总账影响在哪里查询或修改
  • ¥15 三个简单项目写完之后有重赏之后联系我