Compiler Explorer

Source code

vbroadcastsd    ymm9, xmm9
        vbroadcastsd    ymm10, xmm10
        vbroadcastsd    ymm11, xmm11
        vmovlhps        xmm8, xmm0, xmm1                # xmm8 = xmm0[0],xmm1[0]
        vunpcklpd       ymm12, ymm5, ymm2       # ymm12 = ymm5[0],ymm2[0],ymm5[2],ymm2[2]
        vpermpd ymm12, ymm12, 196               # ymm12 = ymm12[0,1,0,3]
        vblendps        ymm8, ymm8, ymm12, 240          # ymm8 = ymm8[0,1,2,3],ymm12[4,5,6,7]
        vmovlhps        xmm12, xmm7, xmm6               # xmm12 = xmm7[0],xmm6[0]
        vunpcklpd       ymm13, ymm3, ymm15      # ymm13 = ymm3[0],ymm15[0],ymm3[2],ymm15[2]
        vpermpd ymm13, ymm13, 196               # ymm13 = ymm13[0,1,0,3]
        vblendps        ymm12, ymm12, ymm13, 240        # ymm12 = ymm12[0,1,2,3],ymm13[4,5,6,7]
        vbroadcastsd    ymm13, xmm13
        vunpckhpd       xmm0, xmm0, xmm1        # xmm0 = xmm0[1],xmm1[1]
        vunpckhpd       ymm10, ymm10, ymm2      # ymm10 = ymm10[1],ymm2[1],ymm10[3],ymm2[3]
        vblendps        ymm8, ymm0, ymm10, 240          # ymm8 = ymm0[0,1,2,3],ymm10[4,5,6,7]
        vunpckhpd       xmm6, xmm7, xmm6        # xmm6 = xmm7[1],xmm6[1]
        vunpckhpd       ymm9, ymm9, ymm15       # ymm9 = ymm9[1],ymm15[1],ymm9[3],ymm15[3]
        vblendps        ymm9, ymm6, ymm9, 240           # ymm9 = ymm6[0,1,2,3],ymm9[4,5,6,7]
        vunpcklpd       ymm6, ymm5, ymm13       # ymm6 = ymm5[0],ymm13[0],ymm5[2],ymm13[2]
        vmovlhps        xmm10, xmm4, xmm7               # xmm10 = xmm4[0],xmm7[0]
        vblendps        ymm10, ymm10, ymm6, 240         # ymm10 = ymm10[0,1,2,3],ymm6[4,5,6,7]
        vunpcklpd       ymm6, ymm3, ymm11       # ymm6 = ymm3[0],ymm11[0],ymm3[2],ymm11[2]
        vmovlhps        xmm11, xmm0, xmm1               # xmm11 = xmm0[0],xmm1[0]
        vblendps        ymm11, ymm11, ymm6, 240         # ymm11 = ymm11[0,1,2,3],ymm6[4,5,6,7]
        vunpckhpd       xmm4, xmm4, xmm7        # xmm4 = xmm4[1],xmm7[1]
        vunpckhpd       ymm5, ymm5, ymm6        # ymm5 = ymm5[1],ymm6[1],ymm5[3],ymm6[3]
        vpermpd ymm5, ymm5, 100                 # ymm5 = ymm5[0,1,2,1]
        vblendps        ymm4, ymm4, ymm5, 240           # ymm4 = ymm4[0,1,2,3],ymm5[4,5,6,7]
        vunpckhpd       xmm0, xmm0, xmm1        # xmm0 = xmm0[1],xmm1[1]
        vunpckhpd       ymm3, ymm3, ymm14       # ymm3 = ymm3[1],ymm14[1],ymm3[3],ymm14[3]
        vpermpd ymm3, ymm3, 100                 # ymm3 = ymm3[0,1,2,1]
        vblendps        ymm0, ymm0, ymm3, 240           # ymm0 = ymm0[0,1,2,3],ymm3[4,5,6,7]
        vmovlhps        xmm3, xmm7, xmm1                # xmm3 = xmm7[0],xmm1[0]
        vunpcklpd       ymm2, ymm2, ymm6        # ymm2 = ymm2[0],ymm6[0],ymm2[2],ymm6[2]
        vpermpd ymm2, ymm2, 196                 # ymm2 = ymm2[0,1,0,3]
        vblendps        ymm2, ymm3, ymm2, 240           # ymm2 = ymm3[0,1,2,3],ymm2[4,5,6,7]
        vunpcklpd       ymm13, ymm15, ymm14     # ymm13 = ymm15[0],ymm14[0],ymm15[2],ymm14[2]
        vpermpd ymm13, ymm13, 196               # ymm13 = ymm13[0,1,0,3]
        vmovlhps        xmm15, xmm3, xmm5               # xmm15 = xmm3[0],xmm5[0]
        vblendps        ymm13, ymm15, ymm13, 240        # ymm13 = ymm15[0,1,2,3],ymm13[4,5,6,7]
        vbroadcastsd    ymm15, xmm15
        vunpckhpd       ymm6, ymm15, ymm6       # ymm6 = ymm15[1],ymm6[1],ymm15[3],ymm6[3]
        vunpckhpd       xmm1, xmm7, xmm1        # xmm1 = xmm7[1],xmm1[1]
        vblendps        ymm1, ymm1, ymm6, 240           # ymm1 = ymm1[0,1,2,3],ymm6[4,5,6,7]
        vbroadcastsd    ymm6, xmm6
        vunpckhpd       ymm6, ymm6, ymm14       # ymm6 = ymm6[1],ymm14[1],ymm6[3],ymm14[3]
        vunpckhpd       xmm3, xmm3, xmm5        # xmm3 = xmm3[1],xmm5[1]
        vblendps        ymm3, ymm3, ymm6, 240           # ymm3 = ymm3[0,1,2,3],ymm6[4,5,6,7]