如何用tensorrt实现两个维度大小不同的张量点乘mul

请问有人知道怎么用tensorrt的api实现两个维度大小不同的张量点乘吗，比如a.shape=[64, 1, 1], b.shape=[64, 240, 320], 维度顺序是(C,H,W), a×b的shape是[64, 240, 320], 如何用tensorrt的api计算a×b，也就是pytorch里的torch.mul

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

Wali_yiwa59418 2023-04-18 00:42

关注

在TensorRT中，可以使用plugin来自定义计算算法，实现两个维度大小不同的张量的点乘操作。具体流程如下：

实现一个自定义的TensorRT插件，可以继承IPluginV2接口。在实现该插件时，需要定义插件输入和输出的数据格式（data format），以及插件需要的配置。
在插件的实现中，可以直接获取输入和输出tensor的指针，然后利用循环遍历的方式计算点乘操作。

下面是一个实现的例子：

#include "NvInfer.h"
#include <cstdio>

using namespace nvinfer1;

class MultiplyPlugin : public IPluginV2
{
public:
    MultiplyPlugin() {}
    MultiplyPlugin(const void* data, size_t length)
    {
        const char *d = reinterpret_cast<const char*>(data), *a = d;
        mInputDims.nbDims = read<int>(d);
        for (int i = 0; i < mInputDims.nbDims; ++i)
            mInputDims.d[i] = read<int>(d);
        mOutputDims.nbDims = read<int>(d);
        for (int i = 0; i < mOutputDims.nbDims; ++i)
            mOutputDims.d[i] = read<int>(d);
        assert(d == a + length);
    }
    ~MultiplyPlugin() {}

    int getNbOutputs() const override { return 1; }
    Dims getOutputDimensions(int index, const Dims* inputs, int nbInputDims) override { return mOutputDims; }
    bool supportsFormat(DataType type, PluginFormat format) const override { return (type == DataType::kFLOAT && format == PluginFormat::kLINEAR); }
    void configureWithFormat(const Dims* inputs, int nbInputs, const Dims* outputs, int nbOutputs, DataType type, PluginFormat format, int maxBatchSize) override
    {
        mDataType = type;
    }
    int initialize() override { return 0; }
    void terminate() override {}
    size_t getWorkspaceSize(int maxBatchSize) const override { return 0; }
    int enqueue(int batchSize, const void* const* inputs, void** outputs, void* workspace, cudaStream_t stream) override
    {
        const float* input = reinterpret_cast<const float*>(inputs[0]);
        const float* weight = reinterpret_cast<const float*>(inputs[1]);
        float* output = reinterpret_cast<float*>(outputs[0]);
        const int inputSize = mInputDims.d[0];
        const int outputSize = mOutputDims.d[0] * mOutputDims.d[1] * mOutputDims.d[2];
        for (int n = 0; n < batchSize; ++n)
        {
            for (int c = 0; c < mOutputDims.d[0]; ++c)
            {
                for (int h = 0; h < mOutputDims.d[1]; ++h)
                {
                    for (int w = 0; w < mOutputDims.d[2]; ++w)
                    {
                        const int inputIndex = (n * inputSize) + c;
                        const int weightIndex = (n * outputSize) + (c * mOutputDims.d[1] * mOutputDims.d[2]) + (h * mOutputDims.d[2]) + w;
                        output[weightIndex] = input[inputIndex] * weight[weightIndex];
                    }
                }
            }
        }
        return 0;
    }
    size_t getSerializationSize() const override
    {
        return sizeof(int)*(1 + mInputDims.nbDims + mOutputDims.nbDims);
    }
    void serialize(void* buffer) const override
    {
        char *d = reinterpret_cast<char*>(buffer), *a = d;
        write(d, mInputDims.nbDims);
        for (int i = 0; i < mInputDims.nbDims; ++i)
            write(d, mInputDims.d[i]);
        write(d, mOutputDims.nbDims);
        for (int i = 0; i < mOutputDims.nbDims; ++i)
            write(d, mOutputDims.d[i]);
        assert(d == a + getSerializationSize());
    }
    void destroy() override { delete this; }
    const char* getPluginType() const override { return "MultiplyPlugin"; }
    const char* getPluginVersion() const override { return "1.0"; }
    void setPluginNamespace(const char* pluginNamespace) override { mNameSpace = pluginNamespace; }
    const char* getPluginNamespace() const override { return mNameSpace.c_str(); }

private:
    template<typename _T>
    static void write(char*& buffer, const _T& val)
    {
        *reinterpret_cast<_T*>(buffer) = val;
        buffer += sizeof(_T);
    }
    template<typename _T>
    static _T read(const char*& buffer)
    {
        _T val = *reinterpret_cast<const _T*>(buffer);
        buffer += sizeof(_T);
        return val;
    }

    DataType mDataType = DataType::kFLOAT;
    Dims mInputDims, mOutputDims;
    std::string mNameSpace;
};

class MultiplyPluginCreator : public IPluginCreator
{
public:
    MultiplyPluginCreator()
    {
        mPluginAttributes.emplace_back(PluginField("in_depth", nullptr, PluginFieldType::kINT32, 1));
        mPluginAttributes.emplace_back(PluginField("in_height", nullptr, PluginFieldType::kINT32, 1));
        mPluginAttributes.emplace_back(PluginField("in_width", nullptr, PluginFieldType::kINT32, 1));
        mPluginAttributes.emplace_back(PluginField("out_depth", nullptr, PluginFieldType::kINT32, 1));
        mPluginAttributes.emplace_back(PluginField("out_height", nullptr, PluginFieldType::kINT32, 1));
        mPluginAttributes.emplace_back(PluginField("out_width", nullptr, PluginFieldType::kINT32, 1));
    }
    ~MultiplyPluginCreator() {}

    const char* getPluginName() const override { return "MultiplyPlugin"; }
    const char* getPluginVersion() const override { return "1.0"; }

    const PluginFieldCollection* getFieldNames() override { return &mPluginAttributes; }
    IPluginV2* createPlugin(const char* name, const PluginFieldCollection* fc) override
    {
        const PluginField* fields = fc->fields;
        int inDepth = 1, inHeight = 1, inWidth = 1;
        int outDepth = 1, outHeight = 1, outWidth = 1;
        for (int i = 0; i < fc->nbFields; ++i)
        {
            if (!strcmp(fields[i].name, "in_depth"))
                inDepth = *(int*)fields[i].data;
            if (!strcmp(fields[i].name, "in_height"))
                inHeight = *(int*)fields[i].data;
            if (!strcmp(fields[i].name, "in_width"))
                inWidth = *(int*)fields[i].data;
            if (!strcmp(fields[i].name, "out_depth"))
                outDepth = *(int*)fields[i].data;
            if (!strcmp(fields[i].name, "out_height"))
                outHeight = *(int*)fields[i].data;
            if (!strcmp(fields[i].name, "out_width"))
                outWidth = *(int*)fields[i].data;
        }
        Dims inputDims = Dims3(inDepth, inHeight, inWidth);
        Dims outputDims = Dims3(outDepth, outHeight, outWidth);
        MultiplyPlugin* plugin = new MultiplyPlugin();
        plugin->setPluginNamespace(mNamespace.c_str());
        plugin->initialize();
        plugin->configureWithFormat(&inputDims, 1, &outputDims, 1, DataType::kFLOAT, PluginFormat::kLINEAR, 1);
        return plugin;
    }
    IPluginV2* deserializePlugin(const char* name, const void* serialData, size_t serialLength) override
    {
        MultiplyPlugin* plugin = new MultiplyPlugin(serialData, serialLength);
        plugin->setPluginNamespace(mNamespace.c_str());
        return plugin;
    }
    void setPluginNamespace(const char* libNamespace) override { mNamespace = libNamespace; }
    const char* getPluginNamespace() const override { return mNamespace.c_str(); }

private:
    std::string mNamespace;
    static PluginFieldCollection mPluginAttributes;
};

PluginFieldCollection MultiplyPluginCreator::mPluginAttributes;

extern "C" IPluginCreator& getPluginCreator()
{
    static MultiplyPluginCreator pluginCreator;
    return pluginCreator;
}

在上述代码中，自定义了一个名为MultiplyPlugin的插件，其中实现了自定义的点乘计算操作。该插件包含两个输入参数和一个输出参数，分别是输入张量、权重张量和输出张量。

接下来，可以在TensorRT中使用该自定义插件来实现两个维度大小不同的张量点乘。

// 创建Engine
IBuilder* builder = createInferBuilder(gLogger);
INetworkDefinition* network = builder->createNetworkV2(0U);
ITensor* a = network->addInput("a", DataType::kFLOAT, Dims3(1, 1, 64));
ITensor* b = network->addInput("b", DataType::kFLOAT, Dims3(320, 240, 64));
ITensor* ab[] = {a, b};
auto plugin = network->addPluginV2(ab, 2, createPlugin("MultiplyPlugin", pluginFactory));
ITensor* output = plugin->getOutput(0);
network->markOutput(*output);

在创建Engine时，需要调用createPlugin函数来实例化自定义插件，并将两个输入张量作为参数添加到插件中。创建Engine后，就可以像其他TensorRT网络一样使用了。

以上就是利用TensorRT的API实现两个大小不同张量点乘的步骤。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

如何用tensorrt实现两个维度大小不同的张量点乘mul c++ python 深度学习
2023-04-17 21:42

回答 2 已采纳在TensorRT中，可以使用plugin来自定义计算算法，实现两个维度大小不同的张量的点乘操作。具体流程如下：实现一个自定义的TensorRT插件，可以继承IPluginV2接口。在实现该插件时，
编写一个Java程序，分别用点乘和叉乘的方法计算两个矩阵的乘法以及特征值? 开发语言
2020-06-11 17:21

回答 1 已采纳 https://blog.csdn.net/weixin_45268427/article/details/106822204
matlab多个矩阵相点乘 matlab
2023-04-17 19:47

回答 10 已采纳基于Monster 组和GPT的调写：用循环来实现n个矩阵的点乘或相加。以下是一个例子：点乘： % 假设有n个矩阵存储在cell数组A中 n = length(A); result = A{1};
[TensorFlow系列-12]：TensorFlow基础 - 张量线性运算（点乘、叉乘）
2021-08-12 16:47

文火冰糖的硅基工坊的博客 ... 目录第1章 Tensor运算概述 1.1 概述 1.3 “in place“运算：不支持 ...1.4Tensor的广播机制: 不同维度的张量运算 1.5 环境准备 1.6 张量的线性代数运算第2章向量的点乘：tf.multiply(x, y） ...
Matlab点乘与矩阵乘法问题的辨析 matlab
2021-10-23 21:36

回答 1 已采纳除也需要点除即./ Z = sin(sqrt(X.^2+Y.^2))./(sqrt(X.^2+Y.^2)); % XY都要大写有帮助望采纳呢
matlab求矩阵A与矩阵B的的点乘与叉乘结果。 matlab
2021-10-08 10:03

回答 1 已采纳对的，你把A、B都转化成double然后计算 A = uint8([27,23,100; 255, 250,128; 223, 128, 234]); B = int8([27,23,100; 99,
定义一个向量类Vector，有以下成员 c#
2021-11-20 09:58

回答 2 已采纳 using System; using System.Collections.Generic; namespace ConsoleApp2 { class Vector {
两个向量的点乘和叉乘怎么算_向量的点乘和叉乘
2021-03-07 10:36

神神九十九的博客向量的点乘和叉乘2019-12-09 15:46:24文/董月点乘，也叫...点乘：点乘的结果是一个实数a·b=|a|·|b|·cos叉乘：叉乘的结果是一个向量几何意义点乘的几何意义可以用来表征或计算两个向量之间的夹角，以及在b向量在...
matlab多个矩阵相加 matlab
2023-04-17 19:44

回答 2 已采纳该回答引用GPT:在matlab中，可以通过使用for循环来实现多个矩阵点乘或相加。首先，需要将所有的矩阵存储在一个cell数组中，然后在循环中一个一个进行点乘或相加。举个例子，假设有3个矩阵A、B和
python中矩阵与其逆相乘并不是单位矩阵 python 有问必答
2022-03-29 19:32

回答 2 已采纳你这个其实近似是单位矩阵了，因为e-17近似为0，之所以出现这个现象，主要原因的话，应该是数据精度的问题，用decimal试一下。望点一下下采纳
求这段MATLAB代码的意思 matlab
2022-05-04 13:26

回答 1 已采纳 o = [y.*(s == 1) y.*(s == -1)]; 吗？ y.*(s == 1) 这里面， (s == 1) 为一个逻辑型，里面等于 1 的值为 1，否则为 0；比如，s = [1 0
matlab两个矩阵点乘叉乘,矩阵点乘和叉乘
2021-04-22 12:11

鞠腾辉的博客来源：https://blog.csdn.net/u013066730/article/details/57462299/下面为matlab中的点乘和叉乘矩阵叉乘矩阵的乘法就是矩阵a的第一行乘以矩阵b的第一列，各个元素对应相乘然后求和作为第一元素的值。矩阵只有当左边...
啊阿斯顿11111cc c++
2023-04-15 11:36

回答 1 已采纳 #include<bits/stdc++.h> using namespace std; const int N = 205; struct Point { int x, y;
两个向量的点乘和叉乘怎么算_数学基础 —— 向量运算：点乘和叉乘
2021-03-07 10:36

weixin_39751327的博客点乘反映着两个向量的“相似度”，两个向量越“相似”，它们的点乘越大。向量的叉乘：a∧ba∧b= |a| * |b| * sinθ向量积被定义为：模长：(在这里θ表示两向量之间的夹角(共起点的前提下)(0° ≤ θ ≤ 180°)，...
[PyTroch系列-12]：PyTorch基础 - 张量线性运算（点乘、叉乘）
2021-08-06 23:21

文火冰糖的硅基工坊的博客本文网址： ...这些操作运算中大多是对数组中每个元素执行相同的函数运算，并获得每个元素函数运算的结果序列，这些序列生成一个新的同维度的数组。 https://www.runoob.com/numpy/numpy-linear-algebra..
两个向量的点乘和叉乘怎么算_点乘（内积）和叉乘（外积、向量积）
2020-12-20 09:05

weixin_39922868的博客转自原创出处：...向量的点乘,也叫向量的内积、数量积，对两个向量执行点乘运算，就是对这两个向量对应位一一相乘之后求和的操作，点乘的结果是一个标量。点乘公式对于向量a和向量b： a和...
两个向量的点乘和叉乘怎么算_Unity游戏开发——向量运算（点乘和叉乘）
2020-12-20 09:05

weixin_39705018的博客说实话，因为向量的运算在平时开发中不是经常使用，我也总弄混这两种运算的含义，所以这次好好区分一下，也给有同样困扰的朋友一点小小的帮助。因为我们主要研究的是游戏开发中的3D世界向量，所以下面的介绍会以几何...
关于torch中张量维度不同时，进行乘法运算的操作
2021-03-30 20:20

行走的笔记的博客广播之前学习NumPy时，在NumPy中，形状不同的数组...首先定义两个张量，x的形状是[1,2,1]，y的形状是[1,2,2]。当x与y相乘时，由于x.size(2)不等于y.size(2)，x会被扩展为[1,2,2]形状，然后再与张量y进行乘法运算。.
Torch张量对应点乘、相乘
2019-03-30 20:25

壹零捌的博客 1.张量点乘， z = x.mul(y) ,维度相同 2.张量相乘， z = x.mm(y) , (m,n) x (n,p)
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月17日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

如何用tensorrt实现两个维度大小不同的张量点乘mul

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新