x64环境下，把内嵌汇编的汇编单独放在.asm文件中

void GDIRender::YUV_TO_RGB24(unsigned char *puc_y, int stride_y,
unsigned char *puc_u, unsigned char *puc_v, int stride_uv,
unsigned char *puc_out, int width_y, int height_y,int stride_out) {

int y, horiz_count;
unsigned char *puc_out_remembered;

if (height_y < 0) 
{
    /* we are flipping our output upside-down */
    height_y  = -height_y;
    puc_y     += (height_y   - 1) * stride_y ;
    puc_u     += (height_y/2 - 1) * stride_uv;
    puc_v     += (height_y/2 - 1) * stride_uv;
    stride_y  = -stride_y;
    stride_uv = -stride_uv;
}
horiz_count = -(width_y >> 3);

for (y=0; y<height_y; y++) {

    if (y == height_y-1) {
        /* this is the last output line - we need to be careful not to overrun the end of this line */
        unsigned char temp_buff[3*MAXIMUM_Y_WIDTH+1];
        puc_out_remembered = puc_out;
        puc_out = temp_buff; /* write the RGB to a temporary store */
    }

    _asm {
        push eax
        push ebx
        push ecx
        push edx
        push edi

        mov eax, puc_out       
        mov ebx, puc_y       
        mov ecx, puc_u       
        mov edx, puc_v
        mov edi, horiz_count

    horiz_loop:

        movd mm2, [ecx]
        pxor mm7, mm7

        movd mm3, [edx]
        punpcklbw mm2, mm7       ; mm2 = __u3__u2__u1__u0

        movq mm0, [ebx]          ; mm0 = y7y6y5y4y3y2y1y0  
        punpcklbw mm3, mm7       ; mm3 = __v3__v2__v1__v0

        movq mm1, mmw_0x00ff     ; mm1 = 00ff00ff00ff00ff 

        psubusb mm0, mmb_0x10    ; mm0 -= 16

        psubw mm2, mmw_0x0080    ; mm2 -= 128
        pand mm1, mm0            ; mm1 = __y6__y4__y2__y0

        psubw mm3, mmw_0x0080    ; mm3 -= 128
        psllw mm1, 3             ; mm1 *= 8

        psrlw mm0, 8             ; mm0 = __y7__y5__y3__y1
        psllw mm2, 3             ; mm2 *= 8

        pmulhw mm1, mmw_mult_Y   ; mm1 *= luma coeff 
        psllw mm0, 3             ; mm0 *= 8

        psllw mm3, 3             ; mm3 *= 8
        movq mm5, mm3            ; mm5 = mm3 = v

        pmulhw mm5, mmw_mult_V_R ; mm5 = red chroma
        movq mm4, mm2            ; mm4 = mm2 = u

        pmulhw mm0, mmw_mult_Y   ; mm0 *= luma coeff 
        movq mm7, mm1            ; even luma part

        pmulhw mm2, mmw_mult_U_G ; mm2 *= u green coeff 
        paddsw mm7, mm5          ; mm7 = luma + chroma    __r6__r4__r2__r0

        pmulhw mm3, mmw_mult_V_G ; mm3 *= v green coeff  
        packuswb mm7, mm7        ; mm7 = r6r4r2r0r6r4r2r0

        pmulhw mm4, mmw_mult_U_B ; mm4 = blue chroma
        paddsw mm5, mm0          ; mm5 = luma + chroma    __r7__r5__r3__r1

        packuswb mm5, mm5        ; mm6 = r7r5r3r1r7r5r3r1
        paddsw mm2, mm3          ; mm2 = green chroma

        movq mm3, mm1            ; mm3 = __y6__y4__y2__y0
        movq mm6, mm1            ; mm6 = __y6__y4__y2__y0

        paddsw mm3, mm4          ; mm3 = luma + chroma    __b6__b4__b2__b0
        paddsw mm6, mm2          ; mm6 = luma + chroma    __g6__g4__g2__g0

        punpcklbw mm7, mm5       ; mm7 = r7r6r5r4r3r2r1r0
        paddsw mm2, mm0          ; odd luma part plus chroma part    __g7__g5__g3__g1

        packuswb mm6, mm6        ; mm2 = g6g4g2g0g6g4g2g0
        packuswb mm2, mm2        ; mm2 = g7g5g3g1g7g5g3g1

        packuswb mm3, mm3        ; mm3 = b6b4b2b0b6b4b2b0
        paddsw mm4, mm0          ; odd luma part plus chroma part    __b7__b5__b3__b1

        packuswb mm4, mm4        ; mm4 = b7b5b3b1b7b5b3b1
        punpcklbw mm6, mm2       ; mm6 = g7g6g5g4g3g2g1g0

        punpcklbw mm3, mm4       ; mm3 = b7b6b5b4b3b2b1b0

        /* 32-bit shuffle.... */
        pxor mm0, mm0            ; is this needed?

        movq mm1, mm6            ; mm1 = g7g6g5g4g3g2g1g0
        punpcklbw mm1, mm0       ; mm1 = __g3__g2__g1__g0

        movq mm0, mm3            ; mm0 = b7b6b5b4b3b2b1b0
        punpcklbw mm0, mm7       ; mm0 = r3b3r2b2r1b1r0b0

        movq mm2, mm0            ; mm2 = r3b3r2b2r1b1r0b0

        punpcklbw mm0, mm1       ; mm0 = __r1g1b1__r0g0b0
        punpckhbw mm2, mm1       ; mm2 = __r3g3b3__r2g2b2

        /* 24-bit shuffle and save... */
        movd   [eax], mm0        ; eax[0] = __r0g0b0
        psrlq mm0, 32            ; mm0 = __r1g1b1

        movd  3[eax], mm0        ; eax[3] = __r1g1b1

        movd  6[eax], mm2        ; eax[6] = __r2g2b2


        psrlq mm2, 32            ; mm2 = __r3g3b3

        movd  9[eax], mm2        ; eax[9] = __r3g3b3

        /* 32-bit shuffle.... */
        pxor mm0, mm0            ; is this needed?

        movq mm1, mm6            ; mm1 = g7g6g5g4g3g2g1g0
        punpckhbw mm1, mm0       ; mm1 = __g7__g6__g5__g4

        movq mm0, mm3            ; mm0 = b7b6b5b4b3b2b1b0
        punpckhbw mm0, mm7       ; mm0 = r7b7r6b6r5b5r4b4

        movq mm2, mm0            ; mm2 = r7b7r6b6r5b5r4b4

        punpcklbw mm0, mm1       ; mm0 = __r5g5b5__r4g4b4
        punpckhbw mm2, mm1       ; mm2 = __r7g7b7__r6g6b6

        /* 24-bit shuffle and save... */
        movd 12[eax], mm0        ; eax[12] = __r4g4b4
        psrlq mm0, 32            ; mm0 = __r5g5b5

        movd 15[eax], mm0        ; eax[15] = __r5g5b5
        add ebx, 8               ; puc_y   += 8;

        movd 18[eax], mm2        ; eax[18] = __r6g6b6
        psrlq mm2, 32            ; mm2 = __r7g7b7

        add ecx, 4               ; puc_u   += 4;
        add edx, 4               ; puc_v   += 4;

        movd 21[eax], mm2        ; eax[21] = __r7g7b7
        add eax, 24              ; puc_out += 24

        inc edi
        jne horiz_loop          

        pop edi 
        pop edx 
        pop ecx
        pop ebx 
        pop eax

        emms

    }

    if (y == height_y-1) {
        /* last line of output - we have used the temp_buff and need to copy... */
        int x = 3 * width_y;                  /* interation counter */
        unsigned char *ps = puc_out;                /* source pointer (temporary line store) */
        unsigned char *pd = puc_out_remembered;     /* dest pointer       */
        while (x--) *(pd++) = *(ps++);        /* copy the line      */
    }

    puc_y   += stride_y;
    if (y%2) {
        puc_u   += stride_uv;
        puc_v   += stride_uv;
    }
    puc_out += stride_out; 
}

}

上面是视频解码的视频格式转换的代码，由于x64不支持内嵌汇编，在网上也找了关于移植的文件，我的没有任何汇编基础，还请会的帮我转下汇编，就是把内嵌汇编这段单独挡在一个文件（.asm）中，然后能编译通过，我用的环境是vs2010的x64 ，请知道帮下忙，谢谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2016-01-18 21:20
关注
http://bbs.pediy.com/archive/index.php?t-182669.html

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

指针数组赋值，vs15弹出strlen.asm文件 c++ c语言
2022-02-15 09:02

回答 1 已采纳你的输入部分有问题，导致最后的的brr返回为空，puts()输出空字符串报错。我没太看得懂你do while 循环部分是在做什么？getchar每次只能接收一个字符，但是看你的意思应该是接收一个字符串
VS x64汇编与C++ 代码互用 c++ c语言
2023-03-19 22:56

回答 3 已采纳参考GPT和自己的思路：在cpp文件里使用asm汇编文件里的变量，需要使用extern关键字声明该变量，示例代码如下：在asm汇编文件: GLOBAL myVariable ; 声明变量
Visual C++中内嵌汇编的问题 c++
2016-01-26 09:25

回答 5 已采纳 ``` 21: Swap2(a, b); 0040107B lea ecx,[ebp-8] 0040107E push ecx 00
__asm__ __volatile__内嵌汇编用法简述
2021-01-19 22:55

　__asm__ __volatile__内嵌汇编用法简述在阅读C/C++原码时经常会遇到内联汇编的情况，下面简要介绍下__asm__ __volatile__内嵌汇编用法。因为我们华清远见教学平台是ARM体系结构的，所以下面的示例都是用ARM汇编。...
汇编语言：想要运行asm文件，发现在debug里没办法打开masm 其他
2023-04-18 20:40

回答 1 已采纳你这个dosbox哪里来的d盘，这里的c盘是虚拟的，不是你电脑上的c盘你得把你的文件拷贝到dosbox的虚拟盘的路径上，才能访问。
c内嵌汇编不能使用fs寄存器
2016-12-15 05:52

回答 1 已采纳 http://blog.csdn.net/yypony/article/details/17633323
为什么在x86上可以运行的内嵌汇编代码在x64上不能运行？会报错。 c++ 有问必答
2021-12-26 13:10

回答 1 已采纳 https://www.cnblogs.com/kuangke/p/6155368.html
ASm_Gcc.rar_内嵌汇编
2022-09-24 13:53

AT&T汇编语言与GCC内嵌汇编简介,学习汇编者是很好的资料
我写了个扫雷程序，调试总提示没有memset.asm，百度了下也没有结果，你们知道吗 c语言
2022-01-16 22:16

回答 1 已采纳修改如下，供参考： #define _CRT_SECURE_NO_WARNINGS 1 #define ROW 11//控制棋盘的行 #define COL 11//控制棋盘的列 #include &
eclipse开发C/C++，如何产生汇编代码文件？ c++ c语言 eclipse
2019-09-17 11:33

回答 1 已采纳这个和eclipse没有关系,要看你用的什么编译器,不同编译器可以通过命令行调用，有对应的选项可以输出汇编这是gcc的方法：https://www.cnblogs.com/fengkang10
汇编INT指令各参数的用法。
2020-04-29 20:17

回答 1 已采纳 https://www.cnblogs.com/ht-beyond/articles/3905742.html，您看一下
EDA/PLD中的__asm__ __volatile__内嵌汇编用法简述
2020-11-12 07:41

　__asm__ __volatile__内嵌汇编用法简述在阅读C/C++原码时经常会遇到内联汇编的情况，下面简要介绍下__asm__ __volatile__内嵌汇编用法。因为我们华清远见教学平台是ARM体系结构的，所以下面的示例都是用ARM汇编。...
C语言中内嵌汇编asm语法
2020-12-06 21:54

凳子花❀的博客这篇文章写得炒鸡详细而且很全面，易于理解，建议新手查看 C语言中内嵌汇编asm语法下面这两篇文章作为补充来看 C语言内嵌汇编：asm volatile C语言ASM汇编内嵌语法
【软件开发底层知识修炼】十二 C/C++语言中内嵌汇编语言（asm）
2018-12-13 22:33

杨柳_的博客我们本文主要介绍C语言中的内嵌汇编，C++语言也是一样的规则。首先要知道以下内容 x86汇编的两种语法：intel语法和AT&amp;T语法 x86汇编一直存在两种不同的语法，在intel的官方文档中...
ARM64基础11:GCC内嵌汇编补充
2021-09-06 18:16

科学边界的博客 volatile:基础内嵌汇编中，通常不需要； inline:内敛，asm代码会尽可能小；汇编代码块： GCC编译器把内嵌汇编当成一个字符串； GCC编译器不会去解析和分析内嵌汇编；多条汇编指令，需要使用“\n\t”换行
没有解决我的问题, 去提问

悬赏问题

¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥15 一道python难题3
¥15 用matlab 设计一个不动点迭代法求解非线性方程组的代码
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler
¥15 oracle集群安装出bug
¥15 关于#python#的问题：自动化测试

x64环境下，把内嵌汇编的汇编单独放在.asm文件中

1条回答 默认 最新

悬赏问题

1条回答默认最新