Compiler Explorer

Source code

vpshuflw        ymm4, ymm1, 232                 # ymm4 = ymm1[0,2,2,3,4,5,6,7,8,10,10,11,12,13,14,15]
        vpshufhw        ymm4, ymm4, 232                 # ymm4 = ymm4[0,1,2,3,4,6,6,7,8,9,10,11,12,14,14,15]
        vpshuflw        ymm5, ymm0, 232                 # ymm5 = ymm0[0,2,2,3,4,5,6,7,8,10,10,11,12,13,14,15]
        vpshufhw        ymm5, ymm5, 232                 # ymm5 = ymm5[0,1,2,3,4,6,6,7,8,9,10,11,12,14,14,15]
        vshufps ymm4, ymm5, ymm4, 136           # ymm4 = ymm5[0,2],ymm4[0,2],ymm5[4,6],ymm4[4,6]
        vpermpd ymm4, ymm4, 216                 # ymm4 = ymm4[0,2,1,3]
        vpshuflw        ymm5, ymm3, 232                 # ymm5 = ymm3[0,2,2,3,4,5,6,7,8,10,10,11,12,13,14,15]
        vpshufhw        ymm5, ymm5, 232                 # ymm5 = ymm5[0,1,2,3,4,6,6,7,8,9,10,11,12,14,14,15]
        vpshuflw        ymm6, ymm2, 232                 # ymm6 = ymm2[0,2,2,3,4,5,6,7,8,10,10,11,12,13,14,15]
        vpshufhw        ymm6, ymm6, 232                 # ymm6 = ymm6[0,1,2,3,4,6,6,7,8,9,10,11,12,14,14,15]
        vshufps ymm5, ymm6, ymm5, 136           # ymm5 = ymm6[0,2],ymm5[0,2],ymm6[4,6],ymm5[4,6]
        vpermpd ymm5, ymm5, 216                 # ymm5 = ymm5[0,2,1,3]
        vmovdqa ymm6, ymmword ptr [rip + .LCPI0_0] # ymm6 = <u,u,u,u,u,u,u,u,2,3,6,7,10,11,14,15,u,u,u,u,u,u,u,u,18,19,22,23,26,27,30,31>
        vpshufb ymm1, ymm1, ymm6
        vmovdqa ymm7, ymmword ptr [rip + .LCPI0_1] # ymm7 = <2,3,6,7,10,11,14,15,u,u,u,u,u,u,u,u,18,19,22,23,26,27,30,31,u,u,u,u,u,u,u,u>
        vpshufb ymm0, ymm0, ymm7
        vpblendd        ymm0, ymm0, ymm1, 204           # ymm0 = ymm0[0,1],ymm1[2,3],ymm0[4,5],ymm1[6,7]
        vpermq  ymm0, ymm0, 216                 # ymm0 = ymm0[0,2,1,3]
        vpshufb ymm1, ymm3, ymm6
        vpshufb ymm2, ymm2, ymm7
        vpblendd        ymm1, ymm2, ymm1, 204           # ymm1 = ymm2[0,1],ymm1[2,3],ymm2[4,5],ymm1[6,7]
        vpermq  ymm1, ymm1, 216                 # ymm1 = ymm1[0,2,1,3]