欧拉筛法去重逻辑如何实现？

在使用欧拉筛法（线性筛）求解素数时，如何确保每个合数仅被其最小的质因数筛去一次，从而实现高效的去重逻辑？常见问题是：为何在遍历已筛出的质数列表时，一旦发现当前数能被某个质数整除就立即跳出循环？这一条件判断如何保证每个合数只被标记一次？理解该机制对掌握欧拉筛法的线性时间复杂度至关重要。请结合内层循环中的取模判断（i % primes[j] == 0）解释其去重原理。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

爱宝妈 2025-12-10 09:23

关注

一、欧拉筛法（线性筛）中去重机制的深度解析

在素数筛法的发展历程中，埃拉托斯特尼筛法（埃氏筛）虽简单直观，但其时间复杂度为 O(n log log n)，在处理大规模数据时存在性能瓶颈。而欧拉筛法（又称线性筛）通过巧妙的去重机制，将时间复杂度优化至 O(n)，实现了每个合数仅被其最小质因数筛除一次的目标。本文将从浅入深，系统剖析其核心逻辑。

1. 基本原理与算法结构

欧拉筛法维护一个素数列表 primes[] 和一个布尔数组 is_composite[] 来标记合数。
外层循环遍历从 2 到 n 的每一个整数 i。
内层循环遍历已筛出的素数 primes[j]，并用其去筛除 i * primes[j]。
关键判断条件：if (i % primes[j] == 0) break;


// 欧拉筛法伪代码示例
vector<int> primes;
bool is_composite[MAXN] = {false};

for (int i = 2; i <= n; i++) {
    if (!is_composite[i]) {
        primes.push_back(i);
    }
    for (int j = 0; j < primes.size() && i * primes[j] <= n; j++) {
        is_composite[i * primes[j]] = true;
        if (i % primes[j] == 0) {
            break;
        }
    }
}

2. 核心机制：为何 `i % primes[j] == 0` 时跳出循环？

该条件是欧拉筛实现“每个合数仅被最小质因数筛除一次”的关键所在。我们通过以下分析揭示其数学本质：

设当前数为 i，当前素数为 p_j = primes[j]。
若 i % p_j == 0，说明 p_j 是 i 的一个质因数。
此时对于后续更大的素数 p_{j+1} > p_j，乘积 i * p_{j+1} 的最小质因数仍为 p_j（因为 i 已含 p_j）。
若继续执行，i * p_{j+1} 将被 p_{j+1} 筛去，但 p_{j+1} 并非其最小质因数，导致重复筛除。
因此，一旦 i % p_j == 0，立即跳出，确保每个合数只在其最小质因数作用下被标记。

3. 数学归纳与实例验证

i	primes[j]	i * primes[j]	i % primes[j]	是否break	说明
4	2	8	0	是	8 被 2 筛去，4 含因子 2，后续不再用更大素数筛
5	2	10	1	否	继续
5	3	15	2	否	继续
6	2	12	0	是	12 被 2 筛去，6 含 2，避免用 3 再筛 18（但 18 不在此步）
7	2	14	1	否	继续
7	3	21	1	否
7	5	35	2	否
7	7	49	0	是	7 是质数，49 被 7 筛去
8	2	16	0	是	8 含因子 2，不再用 3 等筛
9	2	18	1	否	继续

4. 流程图展示执行逻辑

graph TD A[开始] --> B{i从2到n} B --> C{is_composite[i]为false?} C -- 是 --> D[加入primes列表] C -- 否 --> E[j=0] D --> E E --> F{j < primes数量且i*primes[j] ≤ n?} F -- 是 --> G[标记i*primes[j]为合数] G --> H{i % primes[j] == 0?} H -- 是 --> I[break] H -- 否 --> J[j++] J --> F F -- 否 --> K[i++] I --> K K --> B B --> L[结束]

5. 时间复杂度分析与去重保证

欧拉筛的线性时间复杂度依赖于两个关键点：

每个合数 x 只被访问一次，即当 i = x / p_min(x) 且 primes[j] = p_min(x) 时被筛去。
由于 break 条件的存在，任何合数不会被其非最小质因数再次尝试筛除。
内层循环对每个 i 的执行次数等于其不同质因数的个数，总和为 O(n)。
该机制本质上是一种“责任分配”：每个合数由其最小质因数“负责”筛除，避免多头管理。
这种设计思想在哈希表冲突解决、动态规划状态转移中也有类似体现。

6. 常见误区与工程实践建议

在实际编码中，开发者常犯以下错误：

忽略 i * primes[j] <= n 的边界检查，导致数组越界。
将 break 条件误写为 i % primes[j] != 0，破坏去重逻辑。
未初始化布尔数组，导致未定义行为。
在多线程环境下共享 primes 列表而未加同步，引发数据竞争。
对大范围筛法未使用位压缩技术，造成内存浪费。

建议在生产环境中结合位图（BitSet）优化空间占用，并预估素数密度以合理分配内存。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

projecteulersolution:我对投影欧拉问题的解决方案
2021-06-25 06:14

在这个名为"projecteulersolution"的项目中，作者分享了他/她对解决投影欧拉问题的方法，主要使用JavaScript语言进行实现。JavaScript是一种广泛用于前端开发，但现在也常被用作后端和命令行工具的多用途编程语言。 ...
为什么大公司都粗暴地用学历筛简历？他们不怕漏掉顶级人才吗？
2021-08-27 18:08

MatheMagician的博客而在语音识别中，也是先用ngram语言模型的得分算出几条基本路径以后，再用RNN模型去重打分；最近用热传导和物质扩散模型做了一把推荐，传导一步，直接对所有的用户算了相似度，直接把集群跑爆了。哎，还是犯了基本...
Presto在腾讯资讯业务中的应用
2021-06-04 00:35

过往记忆的博客数组相邻元素去重，乍看是非常特化的需求，SQL不太可能满足，但后来发现还真的可以实现。不得不说Presto的reduce函数，加上自由度极高的lambda表达式，以及可以承载多个变量的Row类型，使得我们几乎可以在SQL中...
常用的计算机编程英语词汇
2009-12-18 23:32

### 常用的计算机编程英语词汇解析 #### 数据结构（Data Structures） 1. **Dictionaries**：字典是一种关联数组或散列表的数据结构，在这种结构中，键值对是基本存储单元。键用于查找相应的值，使得数据访问非常...
【人工智能】天工开悟系列 1：词源逻辑性约束与算法约束
2025-05-09 09:35

flyair_China的博客中文词源的逻辑性约束植根于其语义优先、意合主导的语言特性，而算法约束则通过统计学习、语义模型和动态优化应对这些特性带来的挑战。二者共同作用，推动中文自然语言处理技术在分词、歧义消解、主题挖掘等任务中的...
基于VB的Delaunay三角剖分实现与应用
2025-11-09 03:50

十三木的博客简介：Delaunay三角剖分是一种重要的几何算法，用于在二维空间中构建最优三角网格，...本文介绍如何在Visual Basic（VB）环境中实现Delaunay三角剖分，涵盖数据结构设计、逐点插入算法、邻接关系维护及优化策略等内容。
万字干货 | 一文揭秘Presto在腾讯资讯业务中的应用
2021-06-03 00:16

turingbooks的博客数组相邻元素去重，乍看是非常特化的需求，SQL不太可能满足，但后来发现还真的可以实现。不得不说Presto的reduce函数，加上自由度极高的lambda表达式，以及可以承载多个变量的Row类型，使得我们几乎可以在SQL中...
自然界的和谐：心智中的数学呈现
2025-01-12 02:53

光子AI的博客 } F -->|是| D[x₀] F -->|否| G[n+1] G --> A Python 源代码以下是使用 Python 实现牛顿迭代法的源代码： import numpy as np def newton_iterate(f, df, x0, tol=1e-5, max_iter=100): x = x0 for _ in range(max...
pat甲级单词pat甲级单词pat甲级单词
2024-06-12 18:09

- **用途**: 在编程中用于组织逻辑结构。 #### 39. **注册(Register)** - **定义**: 记录或存储信息的动作。 - **用途**: 在系统管理或用户认证中常见。 #### 40. **加(Plus)** - **定义**: 数学运算中的加法。 - ...
Rust 练习册：探索倍数之和的数学之美
2025-11-08 23:57

l13406208235的博客本文探讨计算给定范围内特定因子倍数之和的算法问题，结合数学原理与Rust实现。问题源自FizzBuzz变体，要求计算小于上限且是任意因子倍数的数字之和。通过Rust的迭代器和函数式编程特性，给出了简洁优雅的解决方案。...
学习凸包（一）：暴力算法求解完整实现与解析
2025-10-22 04:32

年近半百的博客由于是有向边，$ (p_i, p_j) $ 和 $ (p_j, p_i) $ 被视为两条不同的边，后续需通过规范化手段去重。参数类型含义 points List 输入的二维点集 i , j int 循环变量，表示点的索引 candidates List 存储所有候选边...
C语言经典案例4
2025-12-07 11:47

寒寒豆豆软件公司的博客 # C语言经典案例代码全解析 C语言作为结构化程序设计的核心语言，自1972年由丹尼斯·里奇（Dennis Ritchie）设计实现以来，凭借“高效、灵活、贴近硬件”的特性，成为操作系统内核、嵌入式固件、高性能算法开发的...
C语言经典案例6
2025-12-07 11:50

寒寒豆豆软件公司的博客 `sum`和`len`都是int类型，`sum/len`会执行整数除法（如`10/3=3`），需将`sum`强制转为`float`（`(float)sum / len`），才能得到正确的浮点数结果。必须找到“前驱节点”（`p`），修改其`next`指针：若直接删除当前...
相见恨晚的编程学习词典！谁还不是南极滑冰的那个崽儿？！
2020-10-01 06:22

Thesmophoria的博客 linguistic: 语言学 AI - Platform : 人工智能平台 launch: 发布 launchpad: 控制台 canonical: 权威的，经典的 disambiguation: 消歧义 context: 语境 tokenize: 标记化 numeral system: 计数系统。使用一组数字...
程序员的数学（十八）数学思维的长期修炼与实战复盘：从入门到精通的完整指南
2025-12-25 09:06

星辰邢哥的博客用 “余数 + 逻辑判断” 实现分布式容灾；用 “动态规划 + 指数爆炸” 优化路径规划。刻意练习方法： “一题多解” 训练：用不同数学工具解决同一问题，对比优劣。例：“数组求和”→ 用循环（O (n)）、用高斯...
CCF CSP认证第33次真题解析：从暴力破解到优化思路（含代码详解）
2025-08-24 05:09

herb5的博客本文深度解析CCF CSP认证第33次...通过对比不同解法的代码演进，详细阐述了如何利用数组优化、标准库容器、高斯消元法、队列模拟及树形结构等核心算法技巧实现思维跃迁，助力考生掌握从基础实现到高效满分的实战路径。
2023年12月数据月报
2024-01-06 19:11

@SmartSi的博客开源实践 | 广发证券基于 Apache Kyuubi 构建“提效可控”大数据赋能层基石可视化数据分析平台设计实践写给工程师的 MacBook 商用级大模型知识库部署方案关于编程模式的总结与思考泛社交裂变场景下AB增量科学...
邻接多重表实战：无向图删除边的正确姿势（避坑指南）
2025-10-09 10:28

脸先着地天使的博客针对传统邻接表删除边需操作两次的痛点，详细阐述了邻接多重表通过单一节点共享于两个顶点链表的“去重”设计，并提供了完整的边删除代码实现、指针操作避坑指南及性能优化建议，是掌握这一数据结构的实战指南。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月10日