static inline A0_n atan(const A0_n a0_n) { // 4.5 cycles/element SSE4.2 g++-4.8 const A0 a0 = a0_n; A0 x = kernel_atan(a0); return nt2::b_xor(x, nt2::bitofsign(a0)); }
static inline A0_n atan(const A0_n a0_n) { const A0 a0 = {a0_n}; const A0 x = {kernel_atan(a0)}; return b_xor(x, bitofsign(a0)); }
static inline A0 atan(const A0& a0) { A0 x = kernel_atan(a0); return b_xor(x, bitofsign(a0)); }