musl/math/expl.c

*f504f610SAugustin Cavalier/* origin: OpenBSD /usr/src/lib/libm/src/ld80/e_expl.c */
*f504f610SAugustin Cavalier/*
*f504f610SAugustin Cavalier * Copyright (c) 2008 Stephen L. Moshier <steve@moshier.net>
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * Permission to use, copy, modify, and distribute this software for any
*f504f610SAugustin Cavalier * purpose with or without fee is hereby granted, provided that the above
*f504f610SAugustin Cavalier * copyright notice and this permission notice appear in all copies.
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
*f504f610SAugustin Cavalier * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
*f504f610SAugustin Cavalier * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
*f504f610SAugustin Cavalier * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
*f504f610SAugustin Cavalier * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
*f504f610SAugustin Cavalier * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
*f504f610SAugustin Cavalier * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
*f504f610SAugustin Cavalier */
*f504f610SAugustin Cavalier/*
*f504f610SAugustin Cavalier *      Exponential function, long double precision
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * SYNOPSIS:
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * long double x, y, expl();
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * y = expl( x );
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * DESCRIPTION:
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * Returns e (2.71828...) raised to the x power.
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * Range reduction is accomplished by separating the argument
*f504f610SAugustin Cavalier * into an integer k and fraction f such that
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *     x    k  f
*f504f610SAugustin Cavalier *    e  = 2  e.
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * A Pade' form of degree 5/6 is used to approximate exp(f) - 1
*f504f610SAugustin Cavalier * in the basic range [-0.5 ln 2, 0.5 ln 2].
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * ACCURACY:
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *                      Relative error:
*f504f610SAugustin Cavalier * arithmetic   domain     # trials      peak         rms
*f504f610SAugustin Cavalier *    IEEE      +-10000     50000       1.12e-19    2.81e-20
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * Error amplification in the exponential function can be
*f504f610SAugustin Cavalier * a serious matter.  The error propagation involves
*f504f610SAugustin Cavalier * exp( X(1+delta) ) = exp(X) ( 1 + X*delta + ... ),
*f504f610SAugustin Cavalier * which shows that a 1 lsb error in representing X produces
*f504f610SAugustin Cavalier * a relative error of X times 1 lsb in the function.
*f504f610SAugustin Cavalier * While the routine gives an accurate result for arguments
*f504f610SAugustin Cavalier * that are exactly represented by a long double precision
*f504f610SAugustin Cavalier * computer number, the result contains amplified roundoff
*f504f610SAugustin Cavalier * error for large arguments not exactly represented.
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier * ERROR MESSAGES:
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier *   message         condition      value returned
*f504f610SAugustin Cavalier * exp underflow    x < MINLOG         0.0
*f504f610SAugustin Cavalier * exp overflow     x > MAXLOG         MAXNUM
*f504f610SAugustin Cavalier *
*f504f610SAugustin Cavalier */
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#include "libm.h"
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier#if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
*f504f610SAugustin Cavalierlong double expl(long double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	return exp(x);
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#elif LDBL_MANT_DIG == 64 && LDBL_MAX_EXP == 16384
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierstatic const long double P[3] = {
*f504f610SAugustin Cavalier 1.2617719307481059087798E-4L,
*f504f610SAugustin Cavalier 3.0299440770744196129956E-2L,
*f504f610SAugustin Cavalier 9.9999999999999999991025E-1L,
*f504f610SAugustin Cavalier};
*f504f610SAugustin Cavalierstatic const long double Q[4] = {
*f504f610SAugustin Cavalier 3.0019850513866445504159E-6L,
*f504f610SAugustin Cavalier 2.5244834034968410419224E-3L,
*f504f610SAugustin Cavalier 2.2726554820815502876593E-1L,
*f504f610SAugustin Cavalier 2.0000000000000000000897E0L,
*f504f610SAugustin Cavalier};
*f504f610SAugustin Cavalierstatic const long double
*f504f610SAugustin CavalierLN2HI = 6.9314575195312500000000E-1L,
*f504f610SAugustin CavalierLN2LO = 1.4286068203094172321215E-6L,
*f504f610SAugustin CavalierLOG2E = 1.4426950408889634073599E0L;
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalierlong double expl(long double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	long double px, xx;
*f504f610SAugustin Cavalier	int k;
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier	if (isnan(x))
*f504f610SAugustin Cavalier		return x;
*f504f610SAugustin Cavalier	if (x > 11356.5234062941439488L) /* x > ln(2^16384 - 0.5) */
*f504f610SAugustin Cavalier		return x * 0x1p16383L;
*f504f610SAugustin Cavalier	if (x < -11399.4985314888605581L) /* x < ln(2^-16446) */
*f504f610SAugustin Cavalier		return -0x1p-16445L/x;
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier	/* Express e**x = e**f 2**k
*f504f610SAugustin Cavalier	 *   = e**(f + k ln(2))
*f504f610SAugustin Cavalier	 */
*f504f610SAugustin Cavalier	px = floorl(LOG2E * x + 0.5);
*f504f610SAugustin Cavalier	k = px;
*f504f610SAugustin Cavalier	x -= px * LN2HI;
*f504f610SAugustin Cavalier	x -= px * LN2LO;
*f504f610SAugustin Cavalier
*f504f610SAugustin Cavalier	/* rational approximation of the fractional part:
*f504f610SAugustin Cavalier	 * e**x =  1 + 2x P(x**2)/(Q(x**2) - x P(x**2))
*f504f610SAugustin Cavalier	 */
*f504f610SAugustin Cavalier	xx = x * x;
*f504f610SAugustin Cavalier	px = x * __polevll(xx, P, 2);
*f504f610SAugustin Cavalier	x = px/(__polevll(xx, Q, 3) - px);
*f504f610SAugustin Cavalier	x = 1.0 + 2.0 * x;
*f504f610SAugustin Cavalier	return scalbnl(x, k);
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#elif LDBL_MANT_DIG == 113 && LDBL_MAX_EXP == 16384
*f504f610SAugustin Cavalier// TODO: broken implementation to make things compile
*f504f610SAugustin Cavalierlong double expl(long double x)
*f504f610SAugustin Cavalier{
*f504f610SAugustin Cavalier	return exp(x);
*f504f610SAugustin Cavalier}
*f504f610SAugustin Cavalier#endif