Compiler Explorer

Source code

vmovaps xmm4, xmmword ptr [rip + .LCPI0_0] # xmm4 = <0,6,4,u>
        vblendps        ymm8, ymm3, ymm5, 48            # ymm8 = ymm3[0,1,2,3],ymm5[4,5],ymm3[6,7]
        vpermps ymm4, ymm4, ymm8
        vperm2f128      ymm9, ymm7, ymm6, 32    # ymm9 = ymm7[0,1],ymm6[0,1]
        vpermilps       ymm10, ymm9, 164        # ymm10 = ymm9[0,1,2,2,4,5,6,6]
        vpermilps       ymm11, ymm6, 170        # ymm11 = ymm6[2,2,2,2,6,6,6,6]
        vblendps        ymm10, ymm10, ymm11, 34         # ymm10 = ymm10[0],ymm11[1],ymm10[2,3,4],ymm11[5],ymm10[6,7]
        vblendps        ymm4, ymm4, ymm10, 56           # ymm4 = ymm4[0,1,2],ymm10[3,4,5],ymm4[6,7]
        vblendps        ymm10, ymm0, ymm1, 48           # ymm10 = ymm0[0,1,2,3],ymm1[4,5],ymm0[6,7]
        vbroadcastsd    ymm11, qword ptr [rip + .LCPI0_1] # ymm11 = [8589934596,8589934596,8589934596,8589934596]
        vpermps ymm11, ymm11, ymm10
        vblendps        ymm4, ymm4, ymm11, 192          # ymm4 = ymm4[0,1,2,3,4,5],ymm11[6,7]
        vmovaps xmm11, xmmword ptr [rip + .LCPI0_2] # xmm11 = <1,7,5,u>
        vpermps ymm8, ymm11, ymm8
        vpermilps       ymm9, ymm9, 229         # ymm9 = ymm9[1,1,2,3,5,5,6,7]
        vpermilps       ymm11, ymm6, 238        # ymm11 = ymm6[2,3,2,3,6,7,6,7]
        vblendps        ymm9, ymm9, ymm11, 34           # ymm9 = ymm9[0],ymm11[1],ymm9[2,3,4],ymm11[5],ymm9[6,7]
        vblendps        ymm8, ymm8, ymm9, 56            # ymm8 = ymm8[0,1,2],ymm9[3,4,5],ymm8[6,7]
        vbroadcastsd    ymm9, qword ptr [rip + .LCPI0_3] # ymm9 = [12884901893,12884901893,12884901893,12884901893]
        vpermps ymm9, ymm9, ymm10
        vblendps        ymm8, ymm8, ymm9, 192           # ymm8 = ymm8[0,1,2,3,4,5],ymm9[6,7]
        vblendps        ymm9, ymm7, ymm6, 204           # ymm9 = ymm7[0,1],ymm6[2,3],ymm7[4,5],ymm6[6,7]
        vpermilps       ymm9, ymm9, 226         # ymm9 = ymm9[2,0,2,3,6,4,6,7]
        vpermpd ymm9, ymm9, 200                 # ymm9 = ymm9[0,2,0,3]
        vpermilps       ymm10, ymm3, 238        # ymm10 = ymm3[2,3,2,3,6,7,6,7]
        vpermilps       ymm11, ymm5, 224        # ymm11 = ymm5[0,0,2,3,4,4,6,7]
        vblendps        ymm10, ymm11, ymm10, 17         # ymm10 = ymm10[0],ymm11[1,2,3],ymm10[4],ymm11[5,6,7]
        vpermpd ymm10, ymm10, 236               # ymm10 = ymm10[0,3,2,3]
        vblendps        ymm9, ymm10, ymm9, 24           # ymm9 = ymm10[0,1,2],ymm9[3,4],ymm10[5,6,7]
        vpermilps       ymm10, ymm0, 0          # ymm10 = ymm0[0,0,0,0,4,4,4,4]
        vpermilps       ymm11, ymm1, 224        # ymm11 = ymm1[0,0,2,3,4,4,6,7]
        vblendps        ymm10, ymm11, ymm10, 136        # ymm10 = ymm11[0,1,2],ymm10[3],ymm11[4,5,6],ymm10[7]
        vpermpd ymm10, ymm10, 196               # ymm10 = ymm10[0,1,0,3]
        vblendps        ymm9, ymm9, ymm10, 224          # ymm9 = ymm9[0,1,2,3,4],ymm10[5,6,7]
        vpermilps       ymm10, ymm6, 255        # ymm10 = ymm6[3,3,3,3,7,7,7,7]
        vblendps        ymm10, ymm10, ymm7, 34          # ymm10 = ymm10[0],ymm7[1],ymm10[2,3,4],ymm7[5],ymm10[6,7]
        vpermpd ymm10, ymm10, 200               # ymm10 = ymm10[0,2,0,3]
        vpermilps       ymm11, ymm3, 255        # ymm11 = ymm3[3,3,3,3,7,7,7,7]
        vpermilps       ymm12, ymm5, 244        # ymm12 = ymm5[0,1,3,3,4,5,7,7]
        vblendps        ymm11, ymm12, ymm11, 17         # ymm11 = ymm11[0],ymm12[1,2,3],ymm11[4],ymm12[5,6,7]
        vpermpd ymm11, ymm11, 236               # ymm11 = ymm11[0,3,2,3]
        vblendps        ymm10, ymm11, ymm10, 24         # ymm10 = ymm11[0,1,2],ymm10[3,4],ymm11[5,6,7]
        vpermilps       ymm11, ymm0, 68         # ymm11 = ymm0[0,1,0,1,4,5,4,5]
        vpermilps       ymm12, ymm1, 244        # ymm12 = ymm1[0,1,3,3,4,5,7,7]
        vblendps        ymm11, ymm12, ymm11, 136        # ymm11 = ymm12[0,1,2],ymm11[3],ymm12[4,5,6],ymm11[7]
        vpermpd ymm11, ymm11, 196               # ymm11 = ymm11[0,1,0,3]
        vblendps        ymm10, ymm10, ymm11, 224        # ymm10 = ymm10[0,1,2,3,4],ymm11[5,6,7]
        vblendps        ymm6, ymm7, ymm6, 240           # ymm6 = ymm7[0,1,2,3],ymm6[4,5,6,7]
        vblendps        ymm7, ymm6, ymm2, 204           # ymm7 = ymm6[0,1],ymm2[2,3],ymm6[4,5],ymm2[6,7]
        vpermilps       ymm7, ymm7, 132         # ymm7 = ymm7[0,1,0,2,4,5,4,6]
        vmovaps xmm11, xmmword ptr [rip + .LCPI0_4] # xmm11 = <4,2,u,u>
        vblendps        ymm3, ymm5, ymm3, 48            # ymm3 = ymm5[0,1,2,3],ymm3[4,5],ymm5[6,7]
        vpermps ymm5, ymm11, ymm3
        vblendps        ymm5, ymm7, ymm5, 3             # ymm5 = ymm5[0,1],ymm7[2,3,4,5,6,7]
        vblendps        ymm0, ymm0, ymm1, 12            # ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5,6,7]
        vbroadcastf128  ymm1, xmmword ptr [rip + .LCPI0_5] # ymm1 = [0,2,0,6,0,2,0,6]
                                        # ymm1 = mem[0,1,0,1]
        vpermps ymm1, ymm1, ymm0
        vblendps        ymm1, ymm5, ymm1, 224           # ymm1 = ymm5[0,1,2,3,4],ymm1[5,6,7]
        vpermilps       ymm5, ymm6, 85          # ymm5 = ymm6[1,1,1,1,5,5,5,5]
        vblendps        ymm2, ymm5, ymm2, 136           # ymm2 = ymm5[0,1,2],ymm2[3],ymm5[4,5,6],ymm2[7]
        vmovaps xmm5, xmmword ptr [rip + .LCPI0_6] # xmm5 = <5,3,u,u>
        vpermps ymm3, ymm5, ymm3
        vblendps        ymm2, ymm2, ymm3, 3             # ymm2 = ymm3[0,1],ymm2[2,3,4,5,6,7]
        vbroadcastf128  ymm3, xmmword ptr [rip + .LCPI0_7] # ymm3 = [0,3,1,7,0,3,1,7]
                                        # ymm3 = mem[0,1,0,1]
        vpermps ymm0, ymm3, ymm0
        vblendps        ymm0, ymm2, ymm0, 224           # ymm0 = ymm2[0,1,2,3,4],ymm0[5,6,7]