static void sse4_1_test (void) { union { __m128i x[NUM / 2]; unsigned long long ll[NUM]; unsigned short s[NUM * 4]; } dst, src; int i; for (i = 0; i < NUM; i++) { src.s[(i % 2) + (i / 2) * 8] = i * i; if ((i % 2)) src.s[(i % 2) + (i / 2) * 8] |= 0x8000; } for (i = 0; i < NUM; i += 2) dst.x [i / 2] = _mm_cvtepu16_epi64 (src.x [i / 2]); for (i = 0; i < NUM; i++) if (src.s[(i % 2) + (i / 2) * 8] != dst.ll[i]) abort (); }
__m128i test_mm_cvtepu16_epi64(__m128i a) { // CHECK-LABEL: test_mm_cvtepu16_epi64 // CHECK: call <2 x i64> @llvm.x86.sse41.pmovzxwq(<8 x i16> {{.*}}) // CHECK-ASM: pmovzxwq %xmm{{.*}}, %xmm{{.*}} return _mm_cvtepu16_epi64(a); }
__m128i test_mm_cvtepu16_epi64(__m128i a) { // CHECK-LABEL: test_mm_cvtepu16_epi64 // CHECK: shufflevector <8 x i16> {{.*}}, <8 x i16> {{.*}}, <2 x i32> <i32 0, i32 1> // CHECK: zext <2 x i16> {{.*}} to <2 x i64> return _mm_cvtepu16_epi64(a); }