PMULHRSW - Packed MULtiply High Round Scale Word

PMULHRSW xmm1, xmm2/m128    (SS3
__m128i _mm_mulhrs_epi16(__m128i a, __m128i b)

各WORDについて符号付きで①*②を行い積の符号付き32ビットの上位18ビットを抽出し1を加えたあと18ビットの中央の16ビットを抽出し③にセット
VPMULHRSW xmm1, xmm2, xmm3/m128    (V1
__m128i _mm_mulhrs_epi16(__m128i a, __m128i b)
VPMULHRSW xmm1{k1}{z}, xmm2, xmm3/m128    (V5+BW+VL
__m128i _mm_mask_mulhrs_epi16(__m128i s, __mmask8 k, __m128i a, __m128i b)
__m128i _mm_maskz_mulhrs_epi16(__mmask8 k, __m128i a, __m128i b)

各WORDについて符号付きで①*②を行い積の符号付き32ビットの上位18ビットを抽出し1を加えたあと18ビットの中央の16ビットを抽出し③にセット
VPMULHRSW ymm1, ymm2, ymm3/m256    (V2
__m256i _mm256_mulhrs_epi16(__m256i a, __m256i b)
VPMULHRSW ymm1{k1}{z}, ymm2, ymm3/m256    (V5+BW+VL
__m256i _mm256_mask_mulhrs_epi16(__m256i s, __mmask16 k, __m256i a, __m256i b)
__m256i _mm256_maskz_mulhrs_epi16(__mmask16 k, __m256i a, __m256i b)

各WORDについて符号付きで①*②を行い積の符号付き32ビットの上位18ビットを抽出し1を加えたあと18ビットの中央の16ビットを抽出し③にセット
VPMULHRSW zmm1{k1}{z}, zmm2, zmm3/m512    (V5+BW
__m512i _mm512_mulhrs_epi16(__m512i a, __m512i b)
__m512i _mm512_mask_mulhrs_epi16(__m512i s, __mmask32 k, __m512i a, __m512i b)
__m512i _mm512_maskz_mulhrs_epi16(__mmask32 k, __m512i a, __m512i b)

各WORDについて符号付きで①*②を行い積の符号付き32ビットの上位18ビットを抽出し1を加えたあと18ビットの中央の16ビットを抽出し③にセット

要するに
①*②/32768を計算し結果を四捨五入したものを③にセット
ただし結果が負で端数が0.5ちょうどのときは0方向に丸められる
①②が両方とも-32768のとき桁あふれする

x86/x64 SIMD命令一覧表  フィードバック