Compiler Explorer

Source code

vmovdqa ymm4, ymmword ptr [rip + .LCPI0_0] # ymm4 = <255,255,u,u,0,0,255,255,u,u,0,0,255,255,u,u,0,0,255,255,u,u,0,0,255,255,u,u,0,0,255,255>
        vpblendvb       ymm4, ymm3, ymm2, ymm4
        vpermq  ymm5, ymm4, 78                  # ymm5 = ymm4[2,3,0,1]
        vpblendw        ymm4, ymm4, ymm5, 146           # ymm4 = ymm4[0],ymm5[1],ymm4[2,3],ymm5[4],ymm4[5,6],ymm5[7],ymm4[8],ymm5[9],ymm4[10,11],ymm5[12],ymm4[13,14],ymm5[15]
        vpshufb ymm4, ymm4, ymmword ptr [rip + .LCPI0_1] # ymm4 = ymm4[0,1,6,7,12,13,2,3,4,5,14,15,8,9,10,11,16,17,22,23,28,29,18,19,20,21,30,31,24,25,26,27]
        vpblendw        xmm5, xmm0, xmm1, 36            # xmm5 = xmm0[0,1],xmm1[2],xmm0[3,4],xmm1[5],xmm0[6,7]
        vpshufb xmm5, xmm5, xmmword ptr [rip + .LCPI0_2] # xmm5 = xmm5[u,u,u,u,u,u,2,3,8,9,14,15,4,5,10,11]
        vinserti128     ymm5, ymm0, xmm5, 1
        vpblendw        ymm5, ymm5, ymm4, 7             # ymm5 = ymm4[0,1,2],ymm5[3,4,5,6,7],ymm4[8,9,10],ymm5[11,12,13,14,15]
        vpshufhw        xmm4, xmm4, 198                 # xmm4 = xmm4[0,1,2,3,6,5,4,7]
        vpblendd        ymm4, ymm4, ymm5, 240           # ymm4 = ymm4[0,1,2,3],ymm5[4,5,6,7]
        vmovdqa ymm5, ymmword ptr [rip + .LCPI0_3] # ymm5 = <255,255,0,0,u,u,255,255,0,0,u,u,255,255,0,0,u,u,255,255,0,0,u,u,255,255,0,0,u,u,255,255>
        vpblendvb       ymm5, ymm2, ymm3, ymm5
        vpermq  ymm6, ymm5, 78                  # ymm6 = ymm5[2,3,0,1]
        vpblendw        ymm5, ymm5, ymm6, 36            # ymm5 = ymm5[0,1],ymm6[2],ymm5[3,4],ymm6[5],ymm5[6,7,8,9],ymm6[10],ymm5[11,12],ymm6[13],ymm5[14,15]
        vpshufb ymm5, ymm5, ymmword ptr [rip + .LCPI0_4] # ymm5 = ymm5[2,3,8,9,14,15,4,5,12,13,10,11,0,1,6,7,18,19,24,25,30,31,20,21,28,29,26,27,16,17,22,23]
        vpblendw        xmm6, xmm1, xmm0, 36            # xmm6 = xmm1[0,1],xmm0[2],xmm1[3,4],xmm0[5],xmm1[6,7]
        vpshufb xmm6, xmm6, xmmword ptr [rip + .LCPI0_5] # xmm6 = xmm6[u,u,u,u,u,u,4,5,10,11,0,1,6,7,12,13]
        vinserti128     ymm6, ymm0, xmm6, 1
        vpblendw        ymm6, ymm6, ymm5, 7             # ymm6 = ymm5[0,1,2],ymm6[3,4,5,6,7],ymm5[8,9,10],ymm6[11,12,13,14,15]
        vpshufhw        xmm5, xmm5, 57                  # xmm5 = xmm5[0,1,2,3,5,6,7,4]
        vpblendd        ymm5, ymm5, ymm6, 240           # ymm5 = ymm5[0,1,2,3],ymm6[4,5,6,7]
        vmovdqa ymm6, ymmword ptr [rip + .LCPI0_6] # ymm6 = <u,u,255,255,0,0,u,u,255,255,0,0,u,u,255,255,0,0,u,u,255,255,0,0,u,u,255,255,0,0,u,u>
        vpblendvb       ymm2, ymm2, ymm3, ymm6
        vextracti128    xmm3, ymm2, 1
        vpblendw        ymm2, ymm2, ymm3, 73            # ymm2 = ymm3[0],ymm2[1,2],ymm3[3],ymm2[4,5],ymm3[6],ymm2[7],ymm3[8],ymm2[9,10],ymm3[11],ymm2[12,13],ymm3[14],ymm2[15]
        vpshufb ymm2, ymm2, ymmword ptr [rip + .LCPI0_7] # ymm2 = ymm2[4,5,10,11,0,1,6,7,12,13,2,3,8,9,14,15,20,21,26,27,u,u,u,u,u,u,u,u,u,u,u,u]
        vpblendw        xmm0, xmm0, xmm1, 146           # xmm0 = xmm0[0],xmm1[1],xmm0[2,3],xmm1[4],xmm0[5,6],xmm1[7]
        vpshufb xmm0, xmm0, xmmword ptr [rip + .LCPI0_8] # xmm0 = xmm0[u,u,u,u,0,1,6,7,12,13,2,3,8,9,14,15]
        vinserti128     ymm0, ymm0, xmm0, 1
        vpblendd        ymm0, ymm2, ymm0, 224           # ymm0 = ymm2[0,1,2,3,4],ymm0[5,6,7]