quartus 综合时只将部分子模块中的乘法器用DSP实现，子模块为相同代码例化

问题遇到的现象和发生背景

quartus prime 21综合时只将部分子模块中的乘法器用DSP实现

操作环境、软件版本等信息

软件版本：Quartus Prime 21.4
在full_mul_level4中例化了多个mul，每个mul中有多个乘法器，但只有u0_mul中的乘法器在综合时用到了DSP，并且综合结果很不正常，full_mul_level4为1024bit的karatsuba大整数乘法器，不应该这么小。可能是什么原因呢。真心请教
代码如下：

(*multstyle="dsp"*)module full_mul_level4(    //384x384 or similar bits
clk,
rstn,
i_a,
i_b,
en0,
en1,
en2,
en3,
en4,
en5,
en6,
o_res
);
parameter A_WIDTH = 1024;
parameter B_WIDTH = 1024;
parameter R_WIDTH = 2048;
parameter DATA_IN_WIDTH = 64;
parameter DATA_OUT_WIDTH = 64; 

input    clk;
input    rstn;
input    [DATA_IN_WIDTH-1:0]    i_a;
input    [DATA_IN_WIDTH-1:0]    i_b;
input    en0;
input    en1;
input    en2;
input    en3;
input    en4;
input    en5;
input    en6;
output    [DATA_OUT_WIDTH-1:0]    o_res;


localparam    WIDTH         = A_WIDTH > B_WIDTH ? A_WIDTH : B_WIDTH;
localparam    WIDTH_ODD    = WIDTH % 2;
localparam    WIDTH_HALF    = (WIDTH - WIDTH_ODD) / 2;
localparam    H_WIDTH        = WIDTH_HALF + WIDTH_ODD;
localparam    L_WIDTH        = WIDTH_HALF;

localparam    F_WIDTH        = H_WIDTH + 1;

wire  [A_WIDTH-1:0] a;
wire  [B_WIDTH-1:0] b;
assign a = {16{i_a}};
assign b = {16{i_b}};

wire    [L_WIDTH-1:0]    a0;
wire    [H_WIDTH-1:0]    a1;
wire    [L_WIDTH-1:0]    b0;
wire    [H_WIDTH-1:0]    b1;

//                a1        a0
//x                b1        b0
//-------------------------
//    a1b1    a1b0+a0b1    a0b0
//    a1b0 + a0b1 = (a0+a1)(b0+b1) - a1b1 - a0b0


assign    {a1, a0} = a;
assign    {b1, b0} = b;

wire    [L_WIDTH*2-1:0]    a0b0_r5;
wire    [H_WIDTH*2-1:0]    a1b1_r5;
full_mul_level3 #(L_WIDTH, L_WIDTH) u0_mul (
    .clk    (clk), 
    .rstn    (rstn),
    .en0    (en0),
    .en1    (en1),
    .en2    (en2),
    .en3    (en3),
    .en4    (en4),
    .a        (a0),
    .b        (b0),
    .res    (a0b0_r5));
    
full_mul_level3 #(H_WIDTH, H_WIDTH) u1_mul (
    .clk    (clk), 
    .rstn    (rstn),
    .en0    (en0),
    .en1    (en1),
    .en2    (en2),
    .en3    (en3),
    .en4    (en4),
    .a        (a1),
    .b        (b1),
    .res    (a1b1_r5));

wire    [F_WIDTH-1:0]    a_fold = a0 + a1;
wire    [F_WIDTH-1:0]    b_fold = b0 + b1;

wire    [F_WIDTH*2-1:0]    temp0_r5;


full_mul_level3 #(F_WIDTH, F_WIDTH) u2_mul (
    .clk    (clk), 
    .rstn    (rstn),
    .en0    (en0),
    .en1    (en1),
    .en2    (en2),
    .en3    (en3),
    .en4    (en4),
    .a        (a_fold),
    .b        (b_fold),
    .res    (temp0_r5));


reg        [L_WIDTH*2-1:0]    a0b0_r6;
reg        [H_WIDTH*2-1:0]    a1b1_r6;
reg        [F_WIDTH*2-1:0]    temp0_r6;

always @(posedge clk)
if(en5) begin
    a0b0_r6 <= a0b0_r5;
    a1b1_r6 <= a1b1_r5;
    temp0_r6 <= temp0_r5;
end
reg        [L_WIDTH*2-1:0]    a0b0_r7;
reg        [H_WIDTH*2-1:0]    a1b1_r7;
reg        [F_WIDTH*2-1:0]    tmp_r7;

always @(posedge clk) begin
    if (en6) begin
        tmp_r7  <= temp0_r6-a0b0_r6-a1b1_r6;
        a0b0_r7 <= a0b0_r6;
        a1b1_r7 <= a1b1_r6;
    end
end
wire    [WIDTH*2-1:0]    r;

assign r = {{a1b1_r7, {(L_WIDTH){1'b0}}} + tmp_r7, {(L_WIDTH){1'b0}}} + a0b0_r7;

reg        [R_WIDTH-1:0]    res;
always @(posedge clk)
if(en6)
    res <= r[R_WIDTH-1:0];
assign o_res = res[DATA_OUT_WIDTH-1:0];
endmodule

编译流程从上到下

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
老皮芽子 2023-04-19 15:35
关注
assign a = {16{i_a}}; assign b = {16{i_b}}; assign {a1, a0} = a; assign {b1, b0} = b; wire [F_WIDTH-1:0] a_fold = a0 + a1; wire [F_WIDTH-1:0] b_fold = b0 + b1; //这样拼接赋值时 a0=a1,b0=b1,a_fold=2*a0,b_fold=2*b0 //最终 a0b0_r5=a1b1_r5//temp0_r5 = 4*a0b0_r5 //u1_mul 和 u2_mul 就被优化掉了
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

单片机与DSP中的FIR带通滤波器的FPGA实现
2020-11-09 17:41

通过Signal Compiler模块，可以将设计转换为硬件描述语言，如VHDL或Verilog，以便在Quartus II中进行综合和实现，最终生成可在FPGA上运行的硬件配置。【FIR带通滤波器设计】在设计16阶FIR带通滤波器时，选择了...
单片机与DSP中的一种基于NiosⅡ的可重构DSP系统设计
2020-12-06 12:32

在本设计中，FPGA用于实现硬件加速器，如复数乘法器、整数乘法器和浮点乘法器，这些模块可以通过Matlab、DSP Builder或VHDL等工具进行设计，然后集成到NiosⅡ处理器的指令系统中，形成可重构的硬件资源。【DSP ...
深入理解FPGA电子系统设计——基于Quartus Prime与VHDL的Altera FPGA设计【1.4】
2025-02-18 20:33

BinaryStarXin的博客 5. 基本运算符VHDL定义了丰富的运算符，...1）算术运算符（见表2-5）乘方运算的左边可以是整数或实数，右边必须是整数，且只有左边为实数时，其右边才可以为负数。乘方运算只有在操作数是常数或2的乘方时，才能被综合。
深入理解FPGA电子系统设计——基于Quartus Prime与VHDL的Altera FPGA设计【1.0】
2025-02-17 22:50

BinaryStarXin的博客后期生产的高性能的FPGA芯片都是在此结构的基础上添加了其他的功能模块构成的，如图1-7所示，Cyclone IV系列中添加了嵌入式乘法器、锁相环等。图1-8为高性能的Stratix IV GX系列芯片的部分架构图，其LAB结构有所...
计算机组成原理课程设计：阵列乘法器系统设计与实现
2025-09-06 23:27

loretta bu的博客在计算机科学与技术的发展历程中，计算机组成原理作为核心基础课程，其实践环节尤为重要。课程设计旨在通过动手实践...本课程设计将以阵列乘法器为核心，围绕其结构设计、逻辑实现、仿真验证与性能优化展开系统性研究。
模糊控制器中高速除法器的FPGA设计.pdf
2021-07-13 15:24

例如，在通用的CPU和DSP中，除法通常是以子程序的形式由ALU或乘法器实现。但在数字信号处理、图像处理等领域，对于高速数字信号处理应用的要求较高，此时如果仅依靠软件实现除法运算，其速度将无法满足需求，因此...
FIR数字滤波器设计及其FPGA实现
2020-08-31 09:53

乘累加模块是关键，它由多个MultiplyAdd子模块组成，每个子模块进行乘法和加法运算，以实现系数与输入信号的累加。在MATLAB/Simulink环境中完成仿真验证后，通过Signal Compiler将模型转换为VHDL代码，这是FPGA可...
DSP Builder7.2 参考手册 (PDF)
2018-10-25 21:30

综上所述，DSP Builder 7.2 提供了一系列强大的工具和组件，覆盖了从底层硬件设计到高层算法实现的各个方面，极大地提高了工程师们在进行DSP系统开发时的工作效率和质量。无论是对于初学者还是经验丰富的专业人士来...
FPGA 7 ，FPGA开发环境搭建，Altrea开发环境搭建，Quartus几个版本之间的区别，以Quartus/ModelSim/Visio/NotePad++软件的安装与应用
2024-08-22 13:35

北城笑笑的博客 ⭐我们知道 FPGA 的应用领域非常广泛，包括但不限于，汽车驾驶、通信领域、视频图像处理、IC原型验证、医疗设备、数字信号...这里我们以Altera（已被Intel收购）的开发板为例，来分享记录，如何搭建 FPGA 开发环境。
自适应陷波器FPGA实现详解：消除特定频率干扰信号的原理与实战，附Quartus源码与Mode...
2025-11-02 10:43

✚1922638的博客 • 采用符号-误差 LMS（Sign-Error LMS）简化乘法，将 μ·e(n) 量化为 3-bit 移位，节省 4 个硬核乘法器。• 零点深度由系数位宽决定：24-bit 系数理论深度 −150 dB，实际受限于 16-bit 信号路径，实测 −65 dB。...
ALTERA EP4CE115核心板硬件手册
2024-03-06 15:30

4. **编程实现**：使用Quartus II等工具编写HDL代码并进行仿真验证。 5. **测试验证**：对最终设计进行功能测试和性能评估。 ##### 4.2 PCB设计注意事项 - **布局布线**：合理安排高速信号线的走向，减少干扰。 - *...
QUartus_II_进行设计的练习手册
2018-08-18 16:32

Quartus II是一款由Altera公司（现为英特尔旗下子公司）开发的可编程逻辑设备（PLD）设计软件，它为FPGA和CPLD设计提供了一整套解决方案。这款软件广泛应用于电子设计自动化（EDA），特别是针对Altera FPGA和CPLD...
深入Quartus软件中FPGA设计：数字秒表与时钟电路
2025-07-30 09:24

Javen Fang的博客 FPGA（Field-Programmable Gate Array，现场可编程门阵列）是...相比传统的固定逻辑电路，FPGA提供了更高的灵活性和可重配置性，这使得它们在快速原型开发、特定应用集成电路（ASIC）的替代品以及教学中变得极为流行。
FPGA实现的自适应陷波器：有效消除特定频率干扰信号的原理、实现及其quartus源码与mod...
2025-11-30 09:56

qq__27699885的博客 • 采用符号-误差 LMS（Sign-Error LMS）简化乘法，将 μ·e(n) 量化为 3-bit 移位，节省 4 个硬核乘法器。• 零点深度由系数位宽决定：24-bit 系数理论深度 −150 dB，实际受限于 16-bit 信号路径，实测 −65 dB。...
自适应陷波器FPGA实现：高效消除特定频率干扰信号的算法与仿真分析，包含Quartus源码与M...
2025-11-08 18:30

2503_94171280的博客整个系统围绕两个核心并行处理通道构建（代码中以u1和u2实例标识），分别处理正交分量或双路输入信号。数控振荡器（NCO）：用于生成高精度、可调频率的正弦与余弦参考信号。自适应权重更新单元：基于误差信号实时...
Verilog实现128点FFT核心模块设计
2025-08-24 18:59

己见明的博客控制逻辑在数字信号处理的硬件实现中承担着至关重要的角色。它负责管理整个FFT（快速傅里叶变换）过程中的各个操作的执行顺序和时序，确保运算单元、存储资源以及输入输出之间的正确交互。对于128点FFT核而言，控制...
基于FPGA的高性能浮点运算器设计与实现
2025-09-05 19:52

weixin_42601702的博客 IEEE 754标准还定义了若干特殊值，用于处理异常运算和边界情况：指数字段尾数字段含义全为1全为0±无穷大（±∞）全为1非全为0全为0全为0±0全为0非全为0非规格化数无穷大（Infinity）：表示溢出或除以零等结果，如...
一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列）
2024-07-06 02:15

光子AI的博客在人工智能和深度学习领域，...在这篇文章中，我们将深入探讨三种主要的硬件加速技术：GPU（图形处理器）、ASIC（专用集成电路）和FPGA（现场可编程门阵列）。这些技术各有特点，都在神经网络加速领域发挥着重要作用。
32位CPU设计与Quartus实现教程完整版
2025-08-19 06:09

Paula-柒月拾的博客通过Verilog硬件描述语言实现模块化编程，定义CPU的控制逻辑和数据路径，并使用Quartus工具进行综合、仿真、编程和调试。源代码文件”cpu1.1”和”cpu”展示了CPU的设计原理和通信方式。同时，本项目也涵盖了计算机...
FPGA实现信号发生器
2016-08-24 16:10

在设计过程中，开发人员通常使用硬件描述语言（HDL，如VHDL或Verilog）编写逻辑设计，然后使用相应的软件工具（如Xilinx的Vivado或Intel的Quartus II）进行编译和仿真。一旦设计验证无误，就可以将配置数据下载到...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月19日

quartus 综合时只将部分子模块中的乘法器用DSP实现，子模块为相同代码例化

问题遇到的现象和发生背景

操作环境、软件版本等信息

2条回答 默认 最新

问题事件

2条回答默认最新