VMOVDQA32 - MOVe DoubleQword Aligned 32
VMOVDQU32 - MOVe DoubleQword Unaligned 32

VMOVDQA32 xmm1{k1}{z}, xmm2/m128    (V5+VL    要16バイト境界  void*型も要16バイト境界
__m128i _mm_mask_load_epi32(__m128i s, __mmask8 k, void* p)
__m128i _mm_maskz_load_epi32(__mmask8 k, void* p)
__m128i _mm_mask_mov_epi32(__m128i s, __mmask8 k, __m128i a)
__m128i _mm_maskz_mov_epi32(__mmask8 k, __m128i a)

VMOVDQU32 xmm1{k1}{z}, xmm2/m128    (V5+VL    境界不問
__m128i _mm_mask_loadu_epi32(__m128i s, __mmask8 k, void* p)
__m128i _mm_maskz_loadu_epi32(__mmask8 k, void* p)


VMOVDQA32 xmm2/m128{k1}{z}, xmm1    (V5+VL    要16バイト境界  void*型も要16バイト境界
void _mm_mask_store_epi32(void* p, __mmask8 k, __m128i a)
VMOVDQU32 xmm2/m128{k1}{z}, xmm1    (V5+VL    境界不問
void _mm_mask_storeu_epi32(void* p, __mmask8 k, __m128i a)

VMOVDQA32 ymm1{k1}{z}, ymm2/m256    (V5+VL    要32バイト境界  void*型も要32バイト境界
__m256i _mm256_mask_load_epi32(__m256i s, __mmask8 k, void* p)
__m256i _mm256_maskz_load_epi32(__mmask8 k, void* p)
__m256i _mm256_mask_mov_epi32(__m256i s, __mmask8 k, __m256i a)
__m256i _mm256_maskz_mov_epi32(__mmask8 k, __m256i a)

VMOVDQU32 ymm1{k1}{z}, ymm2/m256    (V5+VL    境界不問
__m256i _mm256_mask_loadu_epi32(__m256i s, __mmask8 k, void* p)
__m256i _mm256_maskz_loadu_epi32(__mmask8 k, void* p)


VMOVDQA32 ymm2/m256{k1}{z}, ymm1    (V5+VL    要32バイト境界  void*型も要32バイト境界
void _mm256_mask_store_epi32(void* p, __mmask8 k, __m256i a)
VMOVDQU32 ymm2/m256{k1}{z}, ymm1    (V5+VL    境界不問
void _mm256_mask_storeu_epi32(void* p, __mmask8 k, __m256i a)

VMOVDQA32 zmm1{k1}{z}, zmm2/m512    (V5    要64バイト境界  void*型も要64バイト境界
__m512i _mm512_load_si512(__m512i s, void* p)
__m512i _mm512_mask_load_epi32(__m512i s, __mmask16 k, void* p)
__m512i _mm512_maskz_load_epi32(__mmask16 k, void* p)
__m512i _mm512_mask_mov_epi32(__m512i s, __mmask16 k, __m512i a)
__m512i _mm512_maskz_mov_epi32(__mmask16 k, __m512i a)

VMOVDQU32 zmm1{k1}{z}, zmm2/m512    (V5    境界不問
__m512i _mm512_loadu_si512(__m512i s, void* p)
__m512i _mm512_mask_loadu_epi32(__m512i s, __mmask16 k, void* p)
__m512i _mm512_maskz_loadu_epi32(__mmask16 k, void* p)


VMOVDQA32 zmm2/m512{k1}{z}, zmm1    (V5    要64バイト境界  void*型も要64バイト境界
void _mm512_store_si512(void* p, __m512i a)
void _mm512_mask_store_epi32(void* p, __mmask16 k, __m512i a)

VMOVDQU32 zmm2/m512{k1}{z}, zmm1    (V5    境界不問
void _mm512_storeu_si512(void* p, __m512i a)
void _mm512_mask_storeu_epi32(void* p, __mmask16 k, __m512i a)



x86/x64 SIMD命令一覧表  フィードバック