musl/internal/libm.h

*f504f610SAugustin Cavalier#ifndef _LIBM_H
*f504f610SAugustin Cavalier#define _LIBM_H
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#include <stdint.h>
*f504f610SAugustin Cavalier#include <float.h>
*f504f610SAugustin Cavalier#include <math.h>
*f504f610SAugustin Cavalier#include <endian.h>
*f504f610SAugustin Cavalier#include <features.h>
*f504f610SAugustin Cavalier#include "fp_arch.h"
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
*f504f610SAugustin Cavalier#elif LDBL_MANT_DIG == 64 && LDBL_MAX_EXP == 16384 && __BYTE_ORDER == __LITTLE_ENDIAN
*f504f610SAugustin Cavalierunion ldshape {
*f504f610SAugustin Cavalier	long double f;
*f504f610SAugustin Cavalier	struct {
*f504f610SAugustin Cavalier		uint64_t m;
*f504f610SAugustin Cavalier		uint16_t se;
*f504f610SAugustin Cavalier	} i;
*f504f610SAugustin Cavalier};
*f504f610SAugustin Cavalier#elif LDBL_MANT_DIG == 64 && LDBL_MAX_EXP == 16384 && __BYTE_ORDER == __BIG_ENDIAN
*f504f610SAugustin Cavalier/* This is the m68k variant of 80-bit long double, and this definition only works
*f504f610SAugustin Cavalier * on archs where the alignment requirement of uint64_t is <= 4. */
*f504f610SAugustin Cavalierunion ldshape {
*f504f610SAugustin Cavalier	long double f;
*f504f610SAugustin Cavalier	struct {
*f504f610SAugustin Cavalier		uint16_t se;
*f504f610SAugustin Cavalier		uint16_t pad;
*f504f610SAugustin Cavalier		uint64_t m;
*f504f610SAugustin Cavalier	} i;
*f504f610SAugustin Cavalier};
*f504f610SAugustin Cavalier#elif LDBL_MANT_DIG == 113 && LDBL_MAX_EXP == 16384 && __BYTE_ORDER == __LITTLE_ENDIAN
*f504f610SAugustin Cavalierunion ldshape {
*f504f610SAugustin Cavalier	long double f;
*f504f610SAugustin Cavalier	struct {
*f504f610SAugustin Cavalier		uint64_t lo;
*f504f610SAugustin Cavalier		uint32_t mid;
*f504f610SAugustin Cavalier		uint16_t top;
*f504f610SAugustin Cavalier		uint16_t se;
*f504f610SAugustin Cavalier	} i;
*f504f610SAugustin Cavalier	struct {
*f504f610SAugustin Cavalier		uint64_t lo;
*f504f610SAugustin Cavalier		uint64_t hi;
*f504f610SAugustin Cavalier	} i2;
*f504f610SAugustin Cavalier};
*f504f610SAugustin Cavalier#elif LDBL_MANT_DIG == 113 && LDBL_MAX_EXP == 16384 && __BYTE_ORDER == __BIG_ENDIAN
*f504f610SAugustin Cavalierunion ldshape {
*f504f610SAugustin Cavalier	long double f;
*f504f610SAugustin Cavalier	struct {
*f504f610SAugustin Cavalier		uint16_t se;
*f504f610SAugustin Cavalier		uint16_t top;
*f504f610SAugustin Cavalier		uint32_t mid;
*f504f610SAugustin Cavalier		uint64_t lo;
*f504f610SAugustin Cavalier	} i;
*f504f610SAugustin Cavalier	struct {
*f504f610SAugustin Cavalier		uint64_t hi;
*f504f610SAugustin Cavalier		uint64_t lo;
*f504f610SAugustin Cavalier	} i2;
*f504f610SAugustin Cavalier};
*f504f610SAugustin Cavalier#else
*f504f610SAugustin Cavalier#error Unsupported long double representation
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier/* Support non-nearest rounding mode.  */
*f504f610SAugustin Cavalier#define WANT_ROUNDING 1
*f504f610SAugustin Cavalier/* Support signaling NaNs.  */
*f504f610SAugustin Cavalier#define WANT_SNAN 0
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#if WANT_SNAN
*f504f610SAugustin Cavalier#error SNaN is unsupported
*f504f610SAugustin Cavalier#else
*f504f610SAugustin Cavalier#define issignalingf_inline(x) 0
*f504f610SAugustin Cavalier#define issignaling_inline(x) 0
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#ifndef TOINT_INTRINSICS
*f504f610SAugustin Cavalier#define TOINT_INTRINSICS 0
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#if TOINT_INTRINSICS
*f504f610SAugustin Cavalier/* Round x to nearest int in all rounding modes, ties have to be rounded
*f504f610SAugustin Cavalier   consistently with converttoint so the results match.  If the result
*f504f610SAugustin Cavalier   would be outside of [-2^31, 2^31-1] then the semantics is unspecified.  */
*f504f610SAugustin Cavalierstatic double_t roundtoint(double_t);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier/* Convert x to nearest int in all rounding modes, ties have to be rounded
*f504f610SAugustin Cavalier   consistently with roundtoint.  If the result is not representible in an
*f504f610SAugustin Cavalier   int32_t then the semantics is unspecified.  */
*f504f610SAugustin Cavalierstatic int32_t converttoint(double_t);
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier/* Helps static branch prediction so hot path can be better optimized.  */
*f504f610SAugustin Cavalier#ifdef __GNUC__
*f504f610SAugustin Cavalier#define predict_true(x) __builtin_expect(!!(x), 1)
*f504f610SAugustin Cavalier#define predict_false(x) __builtin_expect(x, 0)
*f504f610SAugustin Cavalier#else
*f504f610SAugustin Cavalier#define predict_true(x) (x)
*f504f610SAugustin Cavalier#define predict_false(x) (x)
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier/* Evaluate an expression as the specified type. With standard excess
*f504f610SAugustin Cavalier   precision handling a type cast or assignment is enough (with
*f504f610SAugustin Cavalier   -ffloat-store an assignment is required, in old compilers argument
*f504f610SAugustin Cavalier   passing and return statement may not drop excess precision).  */
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierstatic inline float eval_as_float(float x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	float y = x;
*f504f610SAugustin Cavalier	return y;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierstatic inline double eval_as_double(double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	double y = x;
*f504f610SAugustin Cavalier	return y;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier/* fp_barrier returns its input, but limits code transformations
*f504f610SAugustin Cavalier   as if it had a side-effect (e.g. observable io) and returned
*f504f610SAugustin Cavalier   an arbitrary value.  */
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#ifndef fp_barrierf
*f504f610SAugustin Cavalier#define fp_barrierf fp_barrierf
*f504f610SAugustin Cavalierstatic inline float fp_barrierf(float x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	volatile float y = x;
*f504f610SAugustin Cavalier	return y;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#ifndef fp_barrier
*f504f610SAugustin Cavalier#define fp_barrier fp_barrier
*f504f610SAugustin Cavalierstatic inline double fp_barrier(double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	volatile double y = x;
*f504f610SAugustin Cavalier	return y;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#ifndef fp_barrierl
*f504f610SAugustin Cavalier#define fp_barrierl fp_barrierl
*f504f610SAugustin Cavalierstatic inline long double fp_barrierl(long double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	volatile long double y = x;
*f504f610SAugustin Cavalier	return y;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier/* fp_force_eval ensures that the input value is computed when that's
*f504f610SAugustin Cavalier   otherwise unused.  To prevent the constant folding of the input
*f504f610SAugustin Cavalier   expression, an additional fp_barrier may be needed or a compilation
*f504f610SAugustin Cavalier   mode that does so (e.g. -frounding-math in gcc). Then it can be
*f504f610SAugustin Cavalier   used to evaluate an expression for its fenv side-effects only.   */
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#ifndef fp_force_evalf
*f504f610SAugustin Cavalier#define fp_force_evalf fp_force_evalf
*f504f610SAugustin Cavalierstatic inline void fp_force_evalf(float x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	volatile float y;
*f504f610SAugustin Cavalier	y = x;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#ifndef fp_force_eval
*f504f610SAugustin Cavalier#define fp_force_eval fp_force_eval
*f504f610SAugustin Cavalierstatic inline void fp_force_eval(double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	volatile double y;
*f504f610SAugustin Cavalier	y = x;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#ifndef fp_force_evall
*f504f610SAugustin Cavalier#define fp_force_evall fp_force_evall
*f504f610SAugustin Cavalierstatic inline void fp_force_evall(long double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	volatile long double y;
*f504f610SAugustin Cavalier	y = x;
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#endif
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define FORCE_EVAL(x) do {                        \
*f504f610SAugustin Cavalier	if (sizeof(x) == sizeof(float)) {         \
*f504f610SAugustin Cavalier		fp_force_evalf(x);                \
*f504f610SAugustin Cavalier	} else if (sizeof(x) == sizeof(double)) { \
*f504f610SAugustin Cavalier		fp_force_eval(x);                 \
*f504f610SAugustin Cavalier	} else {                                  \
*f504f610SAugustin Cavalier		fp_force_evall(x);                \
*f504f610SAugustin Cavalier	}                                         \
*f504f610SAugustin Cavalier} while(0)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define asuint(f) ((union{float _f; uint32_t _i;}){f})._i
*f504f610SAugustin Cavalier#define asfloat(i) ((union{uint32_t _i; float _f;}){i})._f
*f504f610SAugustin Cavalier#define asuint64(f) ((union{double _f; uint64_t _i;}){f})._i
*f504f610SAugustin Cavalier#define asdouble(i) ((union{uint64_t _i; double _f;}){i})._f
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define EXTRACT_WORDS(hi,lo,d)                    \
*f504f610SAugustin Cavalierdo {                                              \
*f504f610SAugustin Cavalier  uint64_t __u = asuint64(d);                     \
*f504f610SAugustin Cavalier  (hi) = __u >> 32;                               \
*f504f610SAugustin Cavalier  (lo) = (uint32_t)__u;                           \
*f504f610SAugustin Cavalier} while (0)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define GET_HIGH_WORD(hi,d)                       \
*f504f610SAugustin Cavalierdo {                                              \
*f504f610SAugustin Cavalier  (hi) = asuint64(d) >> 32;                       \
*f504f610SAugustin Cavalier} while (0)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define GET_LOW_WORD(lo,d)                        \
*f504f610SAugustin Cavalierdo {                                              \
*f504f610SAugustin Cavalier  (lo) = (uint32_t)asuint64(d);                   \
*f504f610SAugustin Cavalier} while (0)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define INSERT_WORDS(d,hi,lo)                     \
*f504f610SAugustin Cavalierdo {                                              \
*f504f610SAugustin Cavalier  (d) = asdouble(((uint64_t)(hi)<<32) | (uint32_t)(lo)); \
*f504f610SAugustin Cavalier} while (0)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define SET_HIGH_WORD(d,hi)                       \
*f504f610SAugustin Cavalier  INSERT_WORDS(d, hi, (uint32_t)asuint64(d))
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define SET_LOW_WORD(d,lo)                        \
*f504f610SAugustin Cavalier  INSERT_WORDS(d, asuint64(d)>>32, lo)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define GET_FLOAT_WORD(w,d)                       \
*f504f610SAugustin Cavalierdo {                                              \
*f504f610SAugustin Cavalier  (w) = asuint(d);                                \
*f504f610SAugustin Cavalier} while (0)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#define SET_FLOAT_WORD(d,w)                       \
*f504f610SAugustin Cavalierdo {                                              \
*f504f610SAugustin Cavalier  (d) = asfloat(w);                               \
*f504f610SAugustin Cavalier} while (0)
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierhidden int    __rem_pio2_large(double*,double*,int,int,int);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierhidden int    __rem_pio2(double,double*);
*f504f610SAugustin Cavalierhidden double __sin(double,double,int);
*f504f610SAugustin Cavalierhidden double __cos(double,double);
*f504f610SAugustin Cavalierhidden double __tan(double,double,int);
*f504f610SAugustin Cavalierhidden double __expo2(double);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierhidden int    __rem_pio2f(float,double*);
*f504f610SAugustin Cavalierhidden float  __sindf(double);
*f504f610SAugustin Cavalierhidden float  __cosdf(double);
*f504f610SAugustin Cavalierhidden float  __tandf(double,int);
*f504f610SAugustin Cavalierhidden float  __expo2f(float);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierhidden int __rem_pio2l(long double, long double *);
*f504f610SAugustin Cavalierhidden long double __sinl(long double, long double, int);
*f504f610SAugustin Cavalierhidden long double __cosl(long double, long double);
*f504f610SAugustin Cavalierhidden long double __tanl(long double, long double, int);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierhidden long double __polevll(long double, const long double *, int);
*f504f610SAugustin Cavalierhidden long double __p1evll(long double, const long double *, int);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierextern int __signgam;
*f504f610SAugustin Cavalierhidden double __lgamma_r(double, int *);
*f504f610SAugustin Cavalierhidden float __lgammaf_r(float, int *);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier/* error handling functions */
*f504f610SAugustin Cavalierhidden float __math_xflowf(uint32_t, float);
*f504f610SAugustin Cavalierhidden float __math_uflowf(uint32_t);
*f504f610SAugustin Cavalierhidden float __math_oflowf(uint32_t);
*f504f610SAugustin Cavalierhidden float __math_divzerof(uint32_t);
*f504f610SAugustin Cavalierhidden float __math_invalidf(float);
*f504f610SAugustin Cavalierhidden double __math_xflow(uint32_t, double);
*f504f610SAugustin Cavalierhidden double __math_uflow(uint32_t);
*f504f610SAugustin Cavalierhidden double __math_oflow(uint32_t);
*f504f610SAugustin Cavalierhidden double __math_divzero(uint32_t);
*f504f610SAugustin Cavalierhidden double __math_invalid(double);
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#endif