Compiler Explorer

Source code

vinserti128     ymm4, ymm0, xmm12, 1
        vinserti128     ymm5, ymm0, xmm13, 1
        vpbroadcastq    ymm8, xmm8
        vpbroadcastq    ymm7, xmm7
        vblendps        xmm9, xmm6, xmm0, 12 # xmm9 = xmm6[0,1],mem[2,3]
        vblendps        xmm6, xmm6, xmm2, 12 # xmm6 = xmm6[0,1],mem[2,3]
        vpermpd ymm10, ymm12, 196 # ymm10 = mem[0,1,0,3]
        vpermpd ymm11, ymm13, 196 # ymm11 = mem[0,1,0,3]
        vpermq  ymm12, ymm3, 236                # ymm12 = ymm3[0,3,2,3]
        vpblendd        ymm12, ymm12, ymm2, 48          # ymm12 = ymm12[0,1,2,3],ymm2[4,5],ymm12[6,7]
        vpblendd        ymm5, ymm12, ymm5, 192          # ymm5 = ymm12[0,1,2,3,4,5],ymm5[6,7]
        vpermq  ymm12, ymm1, 236                # ymm12 = ymm1[0,3,2,3]
        vpblendd        ymm12, ymm12, ymm0, 48          # ymm12 = ymm12[0,1,2,3],ymm0[4,5],ymm12[6,7]
        vpblendd        ymm4, ymm12, ymm4, 192          # ymm4 = ymm12[0,1,2,3,4,5],ymm4[6,7]
        vpblendd        ymm3, ymm3, ymm2, 240           # ymm3 = ymm3[0,1,2,3],ymm2[4,5,6,7]
        vpalignr        ymm2, ymm2, ymm3, 8             # ymm2 = ymm3[8,9,10,11,12,13,14,15],ymm2[0,1,2,3,4,5,6,7],ymm3[24,25,26,27,28,29,30,31],ymm2[16,17,18,19,20,21,22,23]
        vpblendd        ymm2, ymm2, ymm7, 192           # ymm2 = ymm2[0,1,2,3,4,5],ymm7[6,7]
        vpblendd        ymm1, ymm1, ymm0, 240           # ymm1 = ymm1[0,1,2,3],ymm0[4,5,6,7]
        vpalignr        ymm0, ymm0, ymm1, 8             # ymm0 = ymm1[8,9,10,11,12,13,14,15],ymm0[0,1,2,3,4,5,6,7],ymm1[24,25,26,27,28,29,30,31],ymm0[16,17,18,19,20,21,22,23]
        vpblendd        ymm0, ymm0, ymm8, 192           # ymm0 = ymm0[0,1,2,3,4,5],ymm8[6,7]
        vblendps        ymm1, ymm6, ymm11, 240          # ymm1 = ymm6[0,1,2,3],ymm11[4,5,6,7]
        vblendps        ymm3, ymm9, ymm10, 240          # ymm3 = ymm9[0,1,2,3],ymm10[4,5,6,7]