VPEXPANDB - Packed EXPAND Byte

VPEXPANDB xmm1{k1}{z}, xmm2/m128    (V5+VBMI2+VL
__m128i _mm_mask_expand_epi8(__m128i s, __mmask16 k, __m128i a)
__m128i _mm_maskz_expand_epi8(__mmask16 k, __m128i a)
__m128i _mm_mask_expandloadu_epi8(__m128i s, __mmask16 k, void* p)
__m128i _mm_maskz_expandloadu_epi8(__mmask16 k, void* p)

②の対応するビットが立っている③の要素に①の要素を下位からひとつずつ取って格納する
②の対応するビットが立っていない③の要素は、{z}指定がある場合(_maskz_の場合)は0クリア、そうでなければそのまま(sの値が使われる
VPEXPANDB ymm1{k1}{z}, ymm2/m256    (V5+VBMI2+VL
__m256i _mm256_mask_expand_epi8(__m256i s, __mmask32 k, __m256i a)
__m256i _mm256_maskz_expand_epi8(__mmask32 k, __m256i a)
__m256i _mm256_mask_expandloadu_epi8(__m256i s, __mmask32 k, void* p)
__m256i _mm256_maskz_expandloadu_epi8(__mmask32 k, void* p)

②の対応するビットが立っている③の要素に①の要素を下位からひとつずつ取って格納する
②の対応するビットが立っていない③の要素は、{z}指定がある場合(_maskz_の場合)は0クリア、そうでなければそのまま(sの値が使われる
VPEXPANDB zmm1{k1}{z}, zmm2/m512    (V5+VBMI2
__m512i _mm512_mask_expand_epi8(__m512i s, __mmask64 k, __m512i a)
__m512i _mm512_maskz_expand_epi8(__mmask64 k, __m512i a)
__m512i _mm512_mask_expandloadu_epi8(__m512i s, __mmask64 k, void* p)
__m512i _mm512_maskz_expandloadu_epi8(__mmask64 k, void* p)
②の対応するビットが立っている③の要素に①の要素を下位からひとつずつ取って格納する
②の対応するビットが立っていない③の要素は、{z}指定がある場合(_maskz_の場合)は0クリア、そうでなければそのまま(sの値が使われる

x86/x64 SIMD命令一覧表  フィードバック