static void sse4_1_test (void) { union { __m128i x[NUM / 2]; unsigned long long ll[NUM]; unsigned char c[NUM * 8]; } dst, src; int i; for (i = 0; i < NUM; i++) { src.c[(i % 2) + (i / 2) * 16] = i * i; if ((i % 2)) src.c[(i % 2) + (i / 2) * 16] |= 0x80; } for (i = 0; i < NUM; i += 2) dst.x [i / 2] = _mm_cvtepu8_epi64 (src.x [i / 2]); for (i = 0; i < NUM; i++) if (src.c[(i % 2) + (i / 2) * 16] != dst.ll[i]) abort (); }
__m128i test_mm_cvtepu8_epi64(__m128i a) { // CHECK-LABEL: test_mm_cvtepu8_epi64 // CHECK: call <2 x i64> @llvm.x86.sse41.pmovzxbq(<16 x i8> {{.*}}) // CHECK-ASM: pmovzxbq %xmm{{.*}}, %xmm{{.*}} return _mm_cvtepu8_epi64(a); }
__m128i test_mm_cvtepu8_epi64(__m128i a) { // CHECK-LABEL: test_mm_cvtepu8_epi64 // CHECK: shufflevector <16 x i8> {{.*}}, <16 x i8> {{.*}}, <2 x i32> <i32 0, i32 1> // CHECK: zext <2 x i8> {{.*}} to <2 x i64> return _mm_cvtepu8_epi64(a); }