Compiler Explorer

Source code

vpxor ymm3, ymm3, ymm3
        vpxor ymm6, ymm6, ymm6
        vpxor ymm5, ymm5, ymm5
        vpxor ymm7, ymm7, ymm7
        vpxor ymm8, ymm8, ymm8
        vpxor ymm9, ymm9, ymm9
        vpxor ymm10, ymm10, ymm10
        vpxor ymm11, ymm11, ymm11
        vinserti128     ymm0, ymm0, xmm0, 1
        vpermq  ymm1, ymm11, 236                # ymm1 = ymm11[0,3,2,3]
        vpblendd        ymm1, ymm1, ymm10, 48           # ymm1 = ymm1[0,1,2,3],ymm10[4,5],ymm1[6,7]
        vpblendd        ymm13, ymm1, ymm0, 192          # ymm13 = ymm1[0,1,2,3,4,5],ymm0[6,7]
        vinserti128     ymm1, ymm0, xmm0, 1
        vpermq  ymm2, ymm9, 236                 # ymm2 = ymm9[0,3,2,3]
        vpblendd        ymm2, ymm2, ymm8, 48            # ymm2 = ymm2[0,1,2,3],ymm8[4,5],ymm2[6,7]
        vpblendd        ymm14, ymm2, ymm1, 192          # ymm14 = ymm2[0,1,2,3,4,5],ymm1[6,7]
        vinserti128     ymm2, ymm0, xmm0, 1
        vpermq  ymm4, ymm7, 236                 # ymm4 = ymm7[0,3,2,3]
        vpblendd        ymm4, ymm4, ymm5, 48            # ymm4 = ymm4[0,1,2,3],ymm5[4,5],ymm4[6,7]
        vpblendd        ymm15, ymm4, ymm2, 192          # ymm15 = ymm4[0,1,2,3,4,5],ymm2[6,7]
        vinserti128     ymm4, ymm0, xmm0, 1
        vpermq  ymm12, ymm6, 236                # ymm12 = ymm6[0,3,2,3]
        vpblendd        ymm12, ymm12, ymm3, 48          # ymm12 = ymm12[0,1,2,3],ymm3[4,5],ymm12[6,7]
        vpblendd        ymm4, ymm12, ymm4, 192          # ymm4 = ymm12[0,1,2,3,4,5],ymm4[6,7]
        vpblendd        ymm6, ymm6, ymm3, 240           # ymm6 = ymm6[0,1,2,3],ymm3[4,5,6,7]
        vpalignr        ymm3, ymm3, ymm6, 8             # ymm3 = ymm6[8,9,10,11,12,13,14,15],ymm3[0,1,2,3,4,5,6,7],ymm6[24,25,26,27,28,29,30,31],ymm3[16,17,18,19,20,21,22,23]
        vbroadcastsd ymm6, xmm6
        vpblendd        ymm3, ymm3, ymm6, 192           # ymm3 = ymm3[0,1,2,3,4,5],ymm6[6,7]
        vpblendd        ymm6, ymm11, ymm10, 240         # ymm6 = ymm11[0,1,2,3],ymm10[4,5,6,7]
        vpalignr        ymm6, ymm10, ymm6, 8            # ymm6 = ymm6[8,9,10,11,12,13,14,15],ymm10[0,1,2,3,4,5,6,7],ymm6[24,25,26,27,28,29,30,31],ymm10[16,17,18,19,20,21,22,23]
        vbroadcastsd ymm10, xmm10
        vpblendd        ymm6, ymm6, ymm10, 192          # ymm6 = ymm6[0,1,2,3,4,5],ymm10[6,7]
        vpblendd        ymm9, ymm9, ymm8, 240           # ymm9 = ymm9[0,1,2,3],ymm8[4,5,6,7]
        vpalignr        ymm8, ymm8, ymm9, 8             # ymm8 = ymm9[8,9,10,11,12,13,14,15],ymm8[0,1,2,3,4,5,6,7],ymm9[24,25,26,27,28,29,30,31],ymm8[16,17,18,19,20,21,22,23]
        vbroadcastsd ymm9, xmm9
        vpblendd        ymm8, ymm8, ymm9, 192           # ymm8 = ymm8[0,1,2,3,4,5],ymm9[6,7]
        vpblendd        ymm7, ymm7, ymm5, 240           # ymm7 = ymm7[0,1,2,3],ymm5[4,5,6,7]
        vpalignr        ymm5, ymm5, ymm7, 8             # ymm5 = ymm7[8,9,10,11,12,13,14,15],ymm5[0,1,2,3,4,5,6,7],ymm7[24,25,26,27,28,29,30,31],ymm5[16,17,18,19,20,21,22,23]
        vbroadcastsd ymm7, xmm7
        vpblendd        ymm5, ymm5, ymm7, 192           # ymm5 = ymm5[0,1,2,3,4,5],ymm7[6,7]
        vpxor xmm7, xmm7, xmm7
        vblendps        xmm7, xmm7, xmm7, 12 # xmm7 = xmm7[0,1],mem[2,3]
        vpermpd ymm9, ymm9, 196 # ymm9 = mem[0,1,0,3]
        vblendps        ymm7, ymm7, ymm9, 240           # ymm7 = ymm7[0,1,2,3],ymm9[4,5,6,7]
        vpxor xmm0, xmm0, xmm0
        vblendps        xmm0, xmm0, xmm0, 12 # xmm0 = xmm0[0,1],mem[2,3]
        vpermpd ymm9, ymm9, 196 # ymm9 = mem[0,1,0,3]
        vblendps        ymm0, ymm0, ymm9, 240           # ymm0 = ymm0[0,1,2,3],ymm9[4,5,6,7]
        vpxor xmm1, xmm1, xmm1
        vblendps        xmm1, xmm1, xmm1, 12 # xmm1 = xmm1[0,1],mem[2,3]
        vpermpd ymm9, ymm9, 196 # ymm9 = mem[0,1,0,3]
        vblendps        ymm1, ymm1, ymm9, 240           # ymm1 = ymm1[0,1,2,3],ymm9[4,5,6,7]
        vpxor xmm2, xmm2, xmm2
        vblendps        xmm2, xmm2, xmm2, 12 # xmm2 = xmm2[0,1],mem[2,3]
        vpermpd ymm9, ymm9, 196 # ymm9 = mem[0,1,0,3]
        vblendps        ymm2, ymm2, ymm9, 240           # ymm2 = ymm2[0,1,2,3],ymm9[4,5,6,7]