Compiler Explorer

Source code

vmovdqa xmm4, xmmword ptr [rip + .LCPI0_0] # xmm4 = <u,u,u,u,0,4,8,12,u,u,u,u,u,u,u,u>
        vpshufb xmm5, xmm3, xmm4
        vpshufb xmm4, xmm2, xmm4
        vpunpckldq      xmm4, xmm4, xmm5        # xmm4 = xmm4[0],xmm5[0],xmm4[1],xmm5[1]
        vmovdqa xmm5, xmmword ptr [rip + .LCPI0_1] # xmm5 = <0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u>
        vpshufb xmm6, xmm1, xmm5
        vpshufb xmm5, xmm0, xmm5
        vpunpckldq      xmm5, xmm5, xmm6        # xmm5 = xmm5[0],xmm6[0],xmm5[1],xmm6[1]
        vpblendd        xmm8, xmm5, xmm4, 12            # xmm8 = xmm5[0,1],xmm4[2,3]
        vmovdqa xmm5, xmmword ptr [rip + .LCPI0_2] # xmm5 = <u,u,u,u,1,5,9,13,u,u,u,u,u,u,u,u>
        vpshufb xmm6, xmm3, xmm5
        vpshufb xmm5, xmm2, xmm5
        vpunpckldq      xmm5, xmm5, xmm6        # xmm5 = xmm5[0],xmm6[0],xmm5[1],xmm6[1]
        vmovdqa xmm6, xmmword ptr [rip + .LCPI0_3] # xmm6 = <1,5,9,13,u,u,u,u,u,u,u,u,u,u,u,u>
        vpshufb xmm7, xmm1, xmm6
        vpshufb xmm6, xmm0, xmm6
        vpunpckldq      xmm6, xmm6, xmm7        # xmm6 = xmm6[0],xmm7[0],xmm6[1],xmm7[1]
        vpblendd        xmm5, xmm6, xmm5, 12            # xmm5 = xmm6[0,1],xmm5[2,3]
        vmovdqa xmm6, xmmword ptr [rip + .LCPI0_4] # xmm6 = <u,u,u,u,2,6,10,14,u,u,u,u,u,u,u,u>
        vpshufb xmm7, xmm3, xmm6
        vpshufb xmm6, xmm2, xmm6
        vpunpckldq      xmm6, xmm6, xmm7        # xmm6 = xmm6[0],xmm7[0],xmm6[1],xmm7[1]
        vmovdqa xmm7, xmmword ptr [rip + .LCPI0_5] # xmm7 = <2,6,10,14,u,u,u,u,u,u,u,u,u,u,u,u>
        vpshufb xmm4, xmm1, xmm7
        vpshufb xmm7, xmm0, xmm7
        vpunpckldq      xmm4, xmm7, xmm4        # xmm4 = xmm7[0],xmm4[0],xmm7[1],xmm4[1]
        vpblendd        xmm4, xmm4, xmm6, 12            # xmm4 = xmm4[0,1],xmm6[2,3]
        vmovdqa xmm6, xmmword ptr [rip + .LCPI0_6] # xmm6 = <u,u,u,u,3,7,11,15,u,u,u,u,u,u,u,u>
        vpshufb xmm3, xmm3, xmm6
        vpshufb xmm2, xmm2, xmm6
        vpunpckldq      xmm2, xmm2, xmm3        # xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
        vmovdqa xmm3, xmmword ptr [rip + .LCPI0_7] # xmm3 = <3,7,11,15,u,u,u,u,u,u,u,u,u,u,u,u>
        vpshufb xmm1, xmm1, xmm3
        vpshufb xmm0, xmm0, xmm3
        vpunpckldq      xmm0, xmm0, xmm1        # xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
        vpblendd        xmm0, xmm0, xmm2, 12            # xmm0 = xmm0[0,1],xmm2[2,3]