libs/mapm/mapm_fft.c

*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/*
*59d799daSIngo Weinhold *  M_APM  -  mapm_fft.c
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *  This FFT (Fast Fourier Transform) is from Takuya OOURA
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *  Copyright(C) 1996-1999 Takuya OOURA
*59d799daSIngo Weinhold *  email: ooura@mmm.t.u-tokyo.ac.jp
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *  See full FFT documentation below ...  (MCR)
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *  This software is provided "as is" without express or implied warranty.
*59d799daSIngo Weinhold */
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/*
*59d799daSIngo Weinhold *      $Id: mapm_fft.c,v 1.15 2007/12/03 01:37:42 mike Exp $
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      This file contains the FFT based FAST MULTIPLICATION function
*59d799daSIngo Weinhold *      as well as its support functions.
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      $Log: mapm_fft.c,v $
*59d799daSIngo Weinhold *      Revision 1.15  2007/12/03 01:37:42  mike
*59d799daSIngo Weinhold *      no changes
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.14  2003/07/28 19:39:01  mike
*59d799daSIngo Weinhold *      change 16 bit constant
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.13  2003/07/21 20:11:55  mike
*59d799daSIngo Weinhold *      Modify error messages to be in a consistent format.
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.12  2003/05/01 21:55:36  mike
*59d799daSIngo Weinhold *      remove math.h
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.11  2003/03/31 22:10:09  mike
*59d799daSIngo Weinhold *      call generic error handling function
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.10  2002/11/03 22:11:48  mike
*59d799daSIngo Weinhold *      Updated function parameters to use the modern style
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.9  2001/07/16 19:16:15  mike
*59d799daSIngo Weinhold *      add function M_free_all_fft
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.8  2000/08/01 22:23:24  mike
*59d799daSIngo Weinhold *      use sizeof(int) from function call to stop
*59d799daSIngo Weinhold *      some compilers from complaining.
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.7  2000/07/30 22:39:21  mike
*59d799daSIngo Weinhold *      lower 16 bit malloc size
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.6  2000/07/10 22:54:26  mike
*59d799daSIngo Weinhold *      malloc the local data arrays
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.5  2000/07/10 00:09:02  mike
*59d799daSIngo Weinhold *      use local static arrays for smaller numbers
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.4  2000/07/08 18:24:23  mike
*59d799daSIngo Weinhold *      minor optimization tweak
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.3  2000/07/08 17:52:49  mike
*59d799daSIngo Weinhold *      do the FFT in base 10000 instead of MAPM numbers base 100
*59d799daSIngo Weinhold *      this runs faster and uses 1/2 the RAM
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.2  2000/07/06 21:04:34  mike
*59d799daSIngo Weinhold *      added more comments
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *      Revision 1.1  2000/07/06 20:42:05  mike
*59d799daSIngo Weinhold *      Initial revision
*59d799daSIngo Weinhold */
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold#include "m_apm_lc.h"
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold#ifndef MM_PI_2
*59d799daSIngo Weinhold#define MM_PI_2      1.570796326794896619231321691639751442098584699687
*59d799daSIngo Weinhold#endif
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold#ifndef WR5000       /* cos(MM_PI_2*0.5000) */
*59d799daSIngo Weinhold#define WR5000       0.707106781186547524400844362104849039284835937688
*59d799daSIngo Weinhold#endif
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold#ifndef RDFT_LOOP_DIV     /* control of the RDFT's speed & tolerance */
*59d799daSIngo Weinhold#define RDFT_LOOP_DIV 64
*59d799daSIngo Weinhold#endif
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdextern void   M_fast_mul_fft(UCHAR *, UCHAR *, UCHAR *, int);
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdextern void   M_rdft(int, int, double *);
*59d799daSIngo Weinholdextern void   M_bitrv2(int, double *);
*59d799daSIngo Weinholdextern void   M_cftfsub(int, double *);
*59d799daSIngo Weinholdextern void   M_cftbsub(int, double *);
*59d799daSIngo Weinholdextern void   M_rftfsub(int, double *);
*59d799daSIngo Weinholdextern void   M_rftbsub(int, double *);
*59d799daSIngo Weinholdextern void   M_cft1st(int, double *);
*59d799daSIngo Weinholdextern void   M_cftmdl(int, int, double *);
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdstatic double *M_aa_array, *M_bb_array;
*59d799daSIngo Weinholdstatic int    M_size = -1;
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdstatic char   *M_fft_error_msg = "\'M_fast_mul_fft\', Out of memory";
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/****************************************************************************/
*59d799daSIngo Weinholdvoid	M_free_all_fft()
*59d799daSIngo Weinhold{
*59d799daSIngo Weinholdif (M_size > 0)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   MAPM_FREE(M_aa_array);
*59d799daSIngo Weinhold   MAPM_FREE(M_bb_array);
*59d799daSIngo Weinhold   M_size = -1;
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold/****************************************************************************/
*59d799daSIngo Weinhold/*
*59d799daSIngo Weinhold *      multiply 'uu' by 'vv' with nbytes each
*59d799daSIngo Weinhold *      yielding a 2*nbytes result in 'ww'.
*59d799daSIngo Weinhold *      each byte contains a base 100 'digit',
*59d799daSIngo Weinhold *      i.e.: range from 0-99.
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *             MSB              LSB
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *   uu,vv     [0] [1] [2] ... [N-1]
*59d799daSIngo Weinhold *   ww        [0] [1] [2] ... [2N-1]
*59d799daSIngo Weinhold */
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid	M_fast_mul_fft(UCHAR *ww, UCHAR *uu, UCHAR *vv, int nbytes)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinholdint             mflag, i, j, nn2, nn;
*59d799daSIngo Weinholddouble          carry, nnr, dtemp, *a, *b;
*59d799daSIngo WeinholdUCHAR           *w0;
*59d799daSIngo Weinholdunsigned long   ul;
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdif (M_size < 0)                  /* if first time in, setup working arrays */
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   if (M_get_sizeof_int() == 2)  /* if still using 16 bit compilers */
*59d799daSIngo Weinhold     M_size = 516;
*59d799daSIngo Weinhold   else
*59d799daSIngo Weinhold     M_size = 8200;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold   M_aa_array = (double *)MAPM_MALLOC(M_size * sizeof(double));
*59d799daSIngo Weinhold   M_bb_array = (double *)MAPM_MALLOC(M_size * sizeof(double));
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold   if ((M_aa_array == NULL) || (M_bb_array == NULL))
*59d799daSIngo Weinhold     {
*59d799daSIngo Weinhold      /* fatal, this does not return */
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold      M_apm_log_error_msg(M_APM_FATAL, M_fft_error_msg);
*59d799daSIngo Weinhold     }
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdnn  = nbytes;
*59d799daSIngo Weinholdnn2 = nbytes >> 1;
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdif (nn > M_size)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   mflag = TRUE;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold   a = (double *)MAPM_MALLOC((nn + 8) * sizeof(double));
*59d799daSIngo Weinhold   b = (double *)MAPM_MALLOC((nn + 8) * sizeof(double));
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold   if ((a == NULL) || (b == NULL))
*59d799daSIngo Weinhold     {
*59d799daSIngo Weinhold      /* fatal, this does not return */
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold      M_apm_log_error_msg(M_APM_FATAL, M_fft_error_msg);
*59d799daSIngo Weinhold     }
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinholdelse
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   mflag = FALSE;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold   a = M_aa_array;
*59d799daSIngo Weinhold   b = M_bb_array;
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/*
*59d799daSIngo Weinhold *   convert normal base 100 MAPM numbers to base 10000
*59d799daSIngo Weinhold *   for the FFT operation.
*59d799daSIngo Weinhold */
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdi = 0;
*59d799daSIngo Weinholdfor (j=0; j < nn2; j++)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   a[j] = (double)((int)uu[i] * 100 + uu[i+1]);
*59d799daSIngo Weinhold   b[j] = (double)((int)vv[i] * 100 + vv[i+1]);
*59d799daSIngo Weinhold   i += 2;
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/* zero fill the second half of the arrays */
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdfor (j=nn2; j < nn; j++)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   a[j] = 0.0;
*59d799daSIngo Weinhold   b[j] = 0.0;
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/* perform the forward Fourier transforms for both numbers */
*59d799daSIngo Weinhold
*59d799daSIngo WeinholdM_rdft(nn, 1, a);
*59d799daSIngo WeinholdM_rdft(nn, 1, b);
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/* perform the convolution ... */
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdb[0] *= a[0];
*59d799daSIngo Weinholdb[1] *= a[1];
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdfor (j=3; j <= nn; j += 2)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   dtemp  = b[j-1];
*59d799daSIngo Weinhold   b[j-1] = dtemp * a[j-1] - b[j] * a[j];
*59d799daSIngo Weinhold   b[j]   = dtemp * a[j] + b[j] * a[j-1];
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/* perform the inverse transform on the result */
*59d799daSIngo Weinhold
*59d799daSIngo WeinholdM_rdft(nn, -1, b);
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/* perform a final pass to release all the carries */
*59d799daSIngo Weinhold/* we are still in base 10000 at this point        */
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdcarry = 0.0;
*59d799daSIngo Weinholdj     = nn;
*59d799daSIngo Weinholdnnr   = 2.0 / (double)nn;
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdwhile (1)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   dtemp = b[--j] * nnr + carry + 0.5;
*59d799daSIngo Weinhold   ul    = (unsigned long)(dtemp * 1.0E-4);
*59d799daSIngo Weinhold   carry = (double)ul;
*59d799daSIngo Weinhold   b[j]  = dtemp - carry * 10000.0;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold   if (j == 0)
*59d799daSIngo Weinhold     break;
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/* copy result to our destination after converting back to base 100 */
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdw0 = ww;
*59d799daSIngo WeinholdM_get_div_rem((int)ul, w0, (w0 + 1));
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdfor (j=0; j <= (nn - 2); j++)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   w0 += 2;
*59d799daSIngo Weinhold   M_get_div_rem((int)b[j], w0, (w0 + 1));
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdif (mflag)
*59d799daSIngo Weinhold  {
*59d799daSIngo Weinhold   MAPM_FREE(b);
*59d799daSIngo Weinhold   MAPM_FREE(a);
*59d799daSIngo Weinhold  }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold/****************************************************************************/
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/*
*59d799daSIngo Weinhold *    The following info is from Takuya OOURA's documentation :
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *    NOTE : MAPM only uses the 'RDFT' function (as well as the
*59d799daSIngo Weinhold *           functions RDFT calls). All the code from here down
*59d799daSIngo Weinhold *           in this file is from Takuya OOURA. The only change I
*59d799daSIngo Weinhold *           made was to add 'M_' in front of all the functions
*59d799daSIngo Weinhold *           I used. This was to guard against any possible
*59d799daSIngo Weinhold *           name collisions in the future.
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *    MCR  06 July 2000
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *    General Purpose FFT (Fast Fourier/Cosine/Sine Transform) Package
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *    Description:
*59d799daSIngo Weinhold *        A package to calculate Discrete Fourier/Cosine/Sine Transforms of
*59d799daSIngo Weinhold *        1-dimensional sequences of length 2^N.
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *        fft4g_h.c  : FFT Package in C       - Simple Version I   (radix 4,2)
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *        rdft: Real Discrete Fourier Transform
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *    Method:
*59d799daSIngo Weinhold *        -------- rdft --------
*59d799daSIngo Weinhold *        A method with a following butterfly operation appended to "cdft".
*59d799daSIngo Weinhold *        In forward transform :
*59d799daSIngo Weinhold *            A[k] = sum_j=0^n-1 a[j]*W(n)^(j*k), 0<=k<=n/2,
*59d799daSIngo Weinhold *                W(n) = exp(2*pi*i/n),
*59d799daSIngo Weinhold *        this routine makes an array x[] :
*59d799daSIngo Weinhold *            x[j] = a[2*j] + i*a[2*j+1], 0<=j<n/2
*59d799daSIngo Weinhold *        and calls "cdft" of length n/2 :
*59d799daSIngo Weinhold *            X[k] = sum_j=0^n/2-1 x[j] * W(n/2)^(j*k), 0<=k<n.
*59d799daSIngo Weinhold *        The result A[k] are :
*59d799daSIngo Weinhold *            A[k]     = X[k]     - (1+i*W(n)^k)/2 * (X[k]-conjg(X[n/2-k])),
*59d799daSIngo Weinhold *            A[n/2-k] = X[n/2-k] +
*59d799daSIngo Weinhold *                            conjg((1+i*W(n)^k)/2 * (X[k]-conjg(X[n/2-k]))),
*59d799daSIngo Weinhold *                0<=k<=n/2
*59d799daSIngo Weinhold *            (notes: conjg() is a complex conjugate, X[n/2]=X[0]).
*59d799daSIngo Weinhold *        ----------------------
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *    Reference:
*59d799daSIngo Weinhold *        * Masatake MORI, Makoto NATORI, Tatuo TORII: Suchikeisan,
*59d799daSIngo Weinhold *          Iwanamikouzajyouhoukagaku18, Iwanami, 1982 (Japanese)
*59d799daSIngo Weinhold *        * Henri J. Nussbaumer: Fast Fourier Transform and Convolution
*59d799daSIngo Weinhold *          Algorithms, Springer Verlag, 1982
*59d799daSIngo Weinhold *        * C. S. Burrus, Notes on the FFT (with large FFT paper list)
*59d799daSIngo Weinhold *          http://www-dsp.rice.edu/research/fft/fftnote.asc
*59d799daSIngo Weinhold *
*59d799daSIngo Weinhold *    Copyright:
*59d799daSIngo Weinhold *        Copyright(C) 1996-1999 Takuya OOURA
*59d799daSIngo Weinhold *        email: ooura@mmm.t.u-tokyo.ac.jp
*59d799daSIngo Weinhold *        download: http://momonga.t.u-tokyo.ac.jp/~ooura/fft.html
*59d799daSIngo Weinhold *        You may use, copy, modify this code for any purpose and
*59d799daSIngo Weinhold *        without fee. You may distribute this ORIGINAL package.
*59d799daSIngo Weinhold */
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold/*
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdfunctions
*59d799daSIngo Weinhold    rdft: Real Discrete Fourier Transform
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdfunction prototypes
*59d799daSIngo Weinhold    void rdft(int, int, double *);
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold-------- Real DFT / Inverse of Real DFT --------
*59d799daSIngo Weinhold    [definition]
*59d799daSIngo Weinhold        <case1> RDFT
*59d799daSIngo Weinhold            R[k] = sum_j=0^n-1 a[j]*cos(2*pi*j*k/n), 0<=k<=n/2
*59d799daSIngo Weinhold            I[k] = sum_j=0^n-1 a[j]*sin(2*pi*j*k/n), 0<k<n/2
*59d799daSIngo Weinhold        <case2> IRDFT (excluding scale)
*59d799daSIngo Weinhold            a[k] = (R[0] + R[n/2]*cos(pi*k))/2 +
*59d799daSIngo Weinhold                   sum_j=1^n/2-1 R[j]*cos(2*pi*j*k/n) +
*59d799daSIngo Weinhold                   sum_j=1^n/2-1 I[j]*sin(2*pi*j*k/n), 0<=k<n
*59d799daSIngo Weinhold    [usage]
*59d799daSIngo Weinhold        <case1>
*59d799daSIngo Weinhold            rdft(n, 1, a);
*59d799daSIngo Weinhold        <case2>
*59d799daSIngo Weinhold            rdft(n, -1, a);
*59d799daSIngo Weinhold    [parameters]
*59d799daSIngo Weinhold        n              :data length (int)
*59d799daSIngo Weinhold                        n >= 2, n = power of 2
*59d799daSIngo Weinhold        a[0...n-1]     :input/output data (double *)
*59d799daSIngo Weinhold                        <case1>
*59d799daSIngo Weinhold                            output data
*59d799daSIngo Weinhold                                a[2*k] = R[k], 0<=k<n/2
*59d799daSIngo Weinhold                                a[2*k+1] = I[k], 0<k<n/2
*59d799daSIngo Weinhold                                a[1] = R[n/2]
*59d799daSIngo Weinhold                        <case2>
*59d799daSIngo Weinhold                            input data
*59d799daSIngo Weinhold                                a[2*j] = R[j], 0<=j<n/2
*59d799daSIngo Weinhold                                a[2*j+1] = I[j], 0<j<n/2
*59d799daSIngo Weinhold                                a[1] = R[n/2]
*59d799daSIngo Weinhold    [remark]
*59d799daSIngo Weinhold        Inverse of
*59d799daSIngo Weinhold            rdft(n, 1, a);
*59d799daSIngo Weinhold        is
*59d799daSIngo Weinhold            rdft(n, -1, a);
*59d799daSIngo Weinhold            for (j = 0; j <= n - 1; j++) {
*59d799daSIngo Weinhold                a[j] *= 2.0 / n;
*59d799daSIngo Weinhold            }
*59d799daSIngo Weinhold*/
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid	M_rdft(int n, int isgn, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    double xi;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    if (isgn >= 0) {
*59d799daSIngo Weinhold        if (n > 4) {
*59d799daSIngo Weinhold            M_bitrv2(n, a);
*59d799daSIngo Weinhold            M_cftfsub(n, a);
*59d799daSIngo Weinhold            M_rftfsub(n, a);
*59d799daSIngo Weinhold        } else if (n == 4) {
*59d799daSIngo Weinhold            M_cftfsub(n, a);
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        xi = a[0] - a[1];
*59d799daSIngo Weinhold        a[0] += a[1];
*59d799daSIngo Weinhold        a[1] = xi;
*59d799daSIngo Weinhold    } else {
*59d799daSIngo Weinhold        a[1] = 0.5 * (a[0] - a[1]);
*59d799daSIngo Weinhold        a[0] -= a[1];
*59d799daSIngo Weinhold        if (n > 4) {
*59d799daSIngo Weinhold            M_rftbsub(n, a);
*59d799daSIngo Weinhold            M_bitrv2(n, a);
*59d799daSIngo Weinhold            M_cftbsub(n, a);
*59d799daSIngo Weinhold        } else if (n == 4) {
*59d799daSIngo Weinhold            M_cftfsub(n, a);
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid    M_bitrv2(int n, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    int j0, k0, j1, k1, l, m, i, j, k;
*59d799daSIngo Weinhold    double xr, xi, yr, yi;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    l = n >> 2;
*59d799daSIngo Weinhold    m = 2;
*59d799daSIngo Weinhold    while (m < l) {
*59d799daSIngo Weinhold        l >>= 1;
*59d799daSIngo Weinhold        m <<= 1;
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold    if (m == l) {
*59d799daSIngo Weinhold        j0 = 0;
*59d799daSIngo Weinhold        for (k0 = 0; k0 < m; k0 += 2) {
*59d799daSIngo Weinhold            k = k0;
*59d799daSIngo Weinhold            for (j = j0; j < j0 + k0; j += 2) {
*59d799daSIngo Weinhold                xr = a[j];
*59d799daSIngo Weinhold                xi = a[j + 1];
*59d799daSIngo Weinhold                yr = a[k];
*59d799daSIngo Weinhold                yi = a[k + 1];
*59d799daSIngo Weinhold                a[j] = yr;
*59d799daSIngo Weinhold                a[j + 1] = yi;
*59d799daSIngo Weinhold                a[k] = xr;
*59d799daSIngo Weinhold                a[k + 1] = xi;
*59d799daSIngo Weinhold                j1 = j + m;
*59d799daSIngo Weinhold                k1 = k + 2 * m;
*59d799daSIngo Weinhold                xr = a[j1];
*59d799daSIngo Weinhold                xi = a[j1 + 1];
*59d799daSIngo Weinhold                yr = a[k1];
*59d799daSIngo Weinhold                yi = a[k1 + 1];
*59d799daSIngo Weinhold                a[j1] = yr;
*59d799daSIngo Weinhold                a[j1 + 1] = yi;
*59d799daSIngo Weinhold                a[k1] = xr;
*59d799daSIngo Weinhold                a[k1 + 1] = xi;
*59d799daSIngo Weinhold                j1 += m;
*59d799daSIngo Weinhold                k1 -= m;
*59d799daSIngo Weinhold                xr = a[j1];
*59d799daSIngo Weinhold                xi = a[j1 + 1];
*59d799daSIngo Weinhold                yr = a[k1];
*59d799daSIngo Weinhold                yi = a[k1 + 1];
*59d799daSIngo Weinhold                a[j1] = yr;
*59d799daSIngo Weinhold                a[j1 + 1] = yi;
*59d799daSIngo Weinhold                a[k1] = xr;
*59d799daSIngo Weinhold                a[k1 + 1] = xi;
*59d799daSIngo Weinhold                j1 += m;
*59d799daSIngo Weinhold                k1 += 2 * m;
*59d799daSIngo Weinhold                xr = a[j1];
*59d799daSIngo Weinhold                xi = a[j1 + 1];
*59d799daSIngo Weinhold                yr = a[k1];
*59d799daSIngo Weinhold                yi = a[k1 + 1];
*59d799daSIngo Weinhold                a[j1] = yr;
*59d799daSIngo Weinhold                a[j1 + 1] = yi;
*59d799daSIngo Weinhold                a[k1] = xr;
*59d799daSIngo Weinhold                a[k1 + 1] = xi;
*59d799daSIngo Weinhold                for (i = n >> 1; i > (k ^= i); i >>= 1);
*59d799daSIngo Weinhold            }
*59d799daSIngo Weinhold            j1 = j0 + k0 + m;
*59d799daSIngo Weinhold            k1 = j1 + m;
*59d799daSIngo Weinhold            xr = a[j1];
*59d799daSIngo Weinhold            xi = a[j1 + 1];
*59d799daSIngo Weinhold            yr = a[k1];
*59d799daSIngo Weinhold            yi = a[k1 + 1];
*59d799daSIngo Weinhold            a[j1] = yr;
*59d799daSIngo Weinhold            a[j1 + 1] = yi;
*59d799daSIngo Weinhold            a[k1] = xr;
*59d799daSIngo Weinhold            a[k1 + 1] = xi;
*59d799daSIngo Weinhold            for (i = n >> 1; i > (j0 ^= i); i >>= 1);
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    } else {
*59d799daSIngo Weinhold        j0 = 0;
*59d799daSIngo Weinhold        for (k0 = 2; k0 < m; k0 += 2) {
*59d799daSIngo Weinhold            for (i = n >> 1; i > (j0 ^= i); i >>= 1);
*59d799daSIngo Weinhold            k = k0;
*59d799daSIngo Weinhold            for (j = j0; j < j0 + k0; j += 2) {
*59d799daSIngo Weinhold                xr = a[j];
*59d799daSIngo Weinhold                xi = a[j + 1];
*59d799daSIngo Weinhold                yr = a[k];
*59d799daSIngo Weinhold                yi = a[k + 1];
*59d799daSIngo Weinhold                a[j] = yr;
*59d799daSIngo Weinhold                a[j + 1] = yi;
*59d799daSIngo Weinhold                a[k] = xr;
*59d799daSIngo Weinhold                a[k + 1] = xi;
*59d799daSIngo Weinhold                j1 = j + m;
*59d799daSIngo Weinhold                k1 = k + m;
*59d799daSIngo Weinhold                xr = a[j1];
*59d799daSIngo Weinhold                xi = a[j1 + 1];
*59d799daSIngo Weinhold                yr = a[k1];
*59d799daSIngo Weinhold                yi = a[k1 + 1];
*59d799daSIngo Weinhold                a[j1] = yr;
*59d799daSIngo Weinhold                a[j1 + 1] = yi;
*59d799daSIngo Weinhold                a[k1] = xr;
*59d799daSIngo Weinhold                a[k1 + 1] = xi;
*59d799daSIngo Weinhold                for (i = n >> 1; i > (k ^= i); i >>= 1);
*59d799daSIngo Weinhold            }
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid    M_cftfsub(int n, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    int j, j1, j2, j3, l;
*59d799daSIngo Weinhold    double x0r, x0i, x1r, x1i, x2r, x2i, x3r, x3i;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    l = 2;
*59d799daSIngo Weinhold    if (n > 8) {
*59d799daSIngo Weinhold        M_cft1st(n, a);
*59d799daSIngo Weinhold        l = 8;
*59d799daSIngo Weinhold        while ((l << 2) < n) {
*59d799daSIngo Weinhold            M_cftmdl(n, l, a);
*59d799daSIngo Weinhold            l <<= 2;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold    if ((l << 2) == n) {
*59d799daSIngo Weinhold        for (j = 0; j < l; j += 2) {
*59d799daSIngo Weinhold            j1 = j + l;
*59d799daSIngo Weinhold            j2 = j1 + l;
*59d799daSIngo Weinhold            j3 = j2 + l;
*59d799daSIngo Weinhold            x0r = a[j] + a[j1];
*59d799daSIngo Weinhold            x0i = a[j + 1] + a[j1 + 1];
*59d799daSIngo Weinhold            x1r = a[j] - a[j1];
*59d799daSIngo Weinhold            x1i = a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold            x2r = a[j2] + a[j3];
*59d799daSIngo Weinhold            x2i = a[j2 + 1] + a[j3 + 1];
*59d799daSIngo Weinhold            x3r = a[j2] - a[j3];
*59d799daSIngo Weinhold            x3i = a[j2 + 1] - a[j3 + 1];
*59d799daSIngo Weinhold            a[j] = x0r + x2r;
*59d799daSIngo Weinhold            a[j + 1] = x0i + x2i;
*59d799daSIngo Weinhold            a[j2] = x0r - x2r;
*59d799daSIngo Weinhold            a[j2 + 1] = x0i - x2i;
*59d799daSIngo Weinhold            a[j1] = x1r - x3i;
*59d799daSIngo Weinhold            a[j1 + 1] = x1i + x3r;
*59d799daSIngo Weinhold            a[j3] = x1r + x3i;
*59d799daSIngo Weinhold            a[j3 + 1] = x1i - x3r;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    } else {
*59d799daSIngo Weinhold        for (j = 0; j < l; j += 2) {
*59d799daSIngo Weinhold            j1 = j + l;
*59d799daSIngo Weinhold            x0r = a[j] - a[j1];
*59d799daSIngo Weinhold            x0i = a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold            a[j] += a[j1];
*59d799daSIngo Weinhold            a[j + 1] += a[j1 + 1];
*59d799daSIngo Weinhold            a[j1] = x0r;
*59d799daSIngo Weinhold            a[j1 + 1] = x0i;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid 	M_cftbsub(int n, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    int j, j1, j2, j3, l;
*59d799daSIngo Weinhold    double x0r, x0i, x1r, x1i, x2r, x2i, x3r, x3i;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    l = 2;
*59d799daSIngo Weinhold    if (n > 8) {
*59d799daSIngo Weinhold        M_cft1st(n, a);
*59d799daSIngo Weinhold        l = 8;
*59d799daSIngo Weinhold        while ((l << 2) < n) {
*59d799daSIngo Weinhold            M_cftmdl(n, l, a);
*59d799daSIngo Weinhold            l <<= 2;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold    if ((l << 2) == n) {
*59d799daSIngo Weinhold        for (j = 0; j < l; j += 2) {
*59d799daSIngo Weinhold            j1 = j + l;
*59d799daSIngo Weinhold            j2 = j1 + l;
*59d799daSIngo Weinhold            j3 = j2 + l;
*59d799daSIngo Weinhold            x0r = a[j] + a[j1];
*59d799daSIngo Weinhold            x0i = -a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold            x1r = a[j] - a[j1];
*59d799daSIngo Weinhold            x1i = -a[j + 1] + a[j1 + 1];
*59d799daSIngo Weinhold            x2r = a[j2] + a[j3];
*59d799daSIngo Weinhold            x2i = a[j2 + 1] + a[j3 + 1];
*59d799daSIngo Weinhold            x3r = a[j2] - a[j3];
*59d799daSIngo Weinhold            x3i = a[j2 + 1] - a[j3 + 1];
*59d799daSIngo Weinhold            a[j] = x0r + x2r;
*59d799daSIngo Weinhold            a[j + 1] = x0i - x2i;
*59d799daSIngo Weinhold            a[j2] = x0r - x2r;
*59d799daSIngo Weinhold            a[j2 + 1] = x0i + x2i;
*59d799daSIngo Weinhold            a[j1] = x1r - x3i;
*59d799daSIngo Weinhold            a[j1 + 1] = x1i - x3r;
*59d799daSIngo Weinhold            a[j3] = x1r + x3i;
*59d799daSIngo Weinhold            a[j3 + 1] = x1i + x3r;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    } else {
*59d799daSIngo Weinhold        for (j = 0; j < l; j += 2) {
*59d799daSIngo Weinhold            j1 = j + l;
*59d799daSIngo Weinhold            x0r = a[j] - a[j1];
*59d799daSIngo Weinhold            x0i = -a[j + 1] + a[j1 + 1];
*59d799daSIngo Weinhold            a[j] += a[j1];
*59d799daSIngo Weinhold            a[j + 1] = -a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold            a[j1] = x0r;
*59d799daSIngo Weinhold            a[j1 + 1] = x0i;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid 	M_cft1st(int n, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    int j, kj, kr;
*59d799daSIngo Weinhold    double ew, wn4r, wk1r, wk1i, wk2r, wk2i, wk3r, wk3i;
*59d799daSIngo Weinhold    double x0r, x0i, x1r, x1i, x2r, x2i, x3r, x3i;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    x0r = a[0] + a[2];
*59d799daSIngo Weinhold    x0i = a[1] + a[3];
*59d799daSIngo Weinhold    x1r = a[0] - a[2];
*59d799daSIngo Weinhold    x1i = a[1] - a[3];
*59d799daSIngo Weinhold    x2r = a[4] + a[6];
*59d799daSIngo Weinhold    x2i = a[5] + a[7];
*59d799daSIngo Weinhold    x3r = a[4] - a[6];
*59d799daSIngo Weinhold    x3i = a[5] - a[7];
*59d799daSIngo Weinhold    a[0] = x0r + x2r;
*59d799daSIngo Weinhold    a[1] = x0i + x2i;
*59d799daSIngo Weinhold    a[4] = x0r - x2r;
*59d799daSIngo Weinhold    a[5] = x0i - x2i;
*59d799daSIngo Weinhold    a[2] = x1r - x3i;
*59d799daSIngo Weinhold    a[3] = x1i + x3r;
*59d799daSIngo Weinhold    a[6] = x1r + x3i;
*59d799daSIngo Weinhold    a[7] = x1i - x3r;
*59d799daSIngo Weinhold    wn4r = WR5000;
*59d799daSIngo Weinhold    x0r = a[8] + a[10];
*59d799daSIngo Weinhold    x0i = a[9] + a[11];
*59d799daSIngo Weinhold    x1r = a[8] - a[10];
*59d799daSIngo Weinhold    x1i = a[9] - a[11];
*59d799daSIngo Weinhold    x2r = a[12] + a[14];
*59d799daSIngo Weinhold    x2i = a[13] + a[15];
*59d799daSIngo Weinhold    x3r = a[12] - a[14];
*59d799daSIngo Weinhold    x3i = a[13] - a[15];
*59d799daSIngo Weinhold    a[8] = x0r + x2r;
*59d799daSIngo Weinhold    a[9] = x0i + x2i;
*59d799daSIngo Weinhold    a[12] = x2i - x0i;
*59d799daSIngo Weinhold    a[13] = x0r - x2r;
*59d799daSIngo Weinhold    x0r = x1r - x3i;
*59d799daSIngo Weinhold    x0i = x1i + x3r;
*59d799daSIngo Weinhold    a[10] = wn4r * (x0r - x0i);
*59d799daSIngo Weinhold    a[11] = wn4r * (x0r + x0i);
*59d799daSIngo Weinhold    x0r = x3i + x1r;
*59d799daSIngo Weinhold    x0i = x3r - x1i;
*59d799daSIngo Weinhold    a[14] = wn4r * (x0i - x0r);
*59d799daSIngo Weinhold    a[15] = wn4r * (x0i + x0r);
*59d799daSIngo Weinhold    ew = MM_PI_2 / n;
*59d799daSIngo Weinhold    kr = 0;
*59d799daSIngo Weinhold    for (j = 16; j < n; j += 16) {
*59d799daSIngo Weinhold        for (kj = n >> 2; kj > (kr ^= kj); kj >>= 1);
*59d799daSIngo Weinhold        wk1r = cos(ew * kr);
*59d799daSIngo Weinhold        wk1i = sin(ew * kr);
*59d799daSIngo Weinhold        wk2r = 1 - 2 * wk1i * wk1i;
*59d799daSIngo Weinhold        wk2i = 2 * wk1i * wk1r;
*59d799daSIngo Weinhold        wk3r = wk1r - 2 * wk2i * wk1i;
*59d799daSIngo Weinhold        wk3i = 2 * wk2i * wk1r - wk1i;
*59d799daSIngo Weinhold        x0r = a[j] + a[j + 2];
*59d799daSIngo Weinhold        x0i = a[j + 1] + a[j + 3];
*59d799daSIngo Weinhold        x1r = a[j] - a[j + 2];
*59d799daSIngo Weinhold        x1i = a[j + 1] - a[j + 3];
*59d799daSIngo Weinhold        x2r = a[j + 4] + a[j + 6];
*59d799daSIngo Weinhold        x2i = a[j + 5] + a[j + 7];
*59d799daSIngo Weinhold        x3r = a[j + 4] - a[j + 6];
*59d799daSIngo Weinhold        x3i = a[j + 5] - a[j + 7];
*59d799daSIngo Weinhold        a[j] = x0r + x2r;
*59d799daSIngo Weinhold        a[j + 1] = x0i + x2i;
*59d799daSIngo Weinhold        x0r -= x2r;
*59d799daSIngo Weinhold        x0i -= x2i;
*59d799daSIngo Weinhold        a[j + 4] = wk2r * x0r - wk2i * x0i;
*59d799daSIngo Weinhold        a[j + 5] = wk2r * x0i + wk2i * x0r;
*59d799daSIngo Weinhold        x0r = x1r - x3i;
*59d799daSIngo Weinhold        x0i = x1i + x3r;
*59d799daSIngo Weinhold        a[j + 2] = wk1r * x0r - wk1i * x0i;
*59d799daSIngo Weinhold        a[j + 3] = wk1r * x0i + wk1i * x0r;
*59d799daSIngo Weinhold        x0r = x1r + x3i;
*59d799daSIngo Weinhold        x0i = x1i - x3r;
*59d799daSIngo Weinhold        a[j + 6] = wk3r * x0r - wk3i * x0i;
*59d799daSIngo Weinhold        a[j + 7] = wk3r * x0i + wk3i * x0r;
*59d799daSIngo Weinhold        x0r = wn4r * (wk1r - wk1i);
*59d799daSIngo Weinhold        wk1i = wn4r * (wk1r + wk1i);
*59d799daSIngo Weinhold        wk1r = x0r;
*59d799daSIngo Weinhold        wk3r = wk1r - 2 * wk2r * wk1i;
*59d799daSIngo Weinhold        wk3i = 2 * wk2r * wk1r - wk1i;
*59d799daSIngo Weinhold        x0r = a[j + 8] + a[j + 10];
*59d799daSIngo Weinhold        x0i = a[j + 9] + a[j + 11];
*59d799daSIngo Weinhold        x1r = a[j + 8] - a[j + 10];
*59d799daSIngo Weinhold        x1i = a[j + 9] - a[j + 11];
*59d799daSIngo Weinhold        x2r = a[j + 12] + a[j + 14];
*59d799daSIngo Weinhold        x2i = a[j + 13] + a[j + 15];
*59d799daSIngo Weinhold        x3r = a[j + 12] - a[j + 14];
*59d799daSIngo Weinhold        x3i = a[j + 13] - a[j + 15];
*59d799daSIngo Weinhold        a[j + 8] = x0r + x2r;
*59d799daSIngo Weinhold        a[j + 9] = x0i + x2i;
*59d799daSIngo Weinhold        x0r -= x2r;
*59d799daSIngo Weinhold        x0i -= x2i;
*59d799daSIngo Weinhold        a[j + 12] = -wk2i * x0r - wk2r * x0i;
*59d799daSIngo Weinhold        a[j + 13] = -wk2i * x0i + wk2r * x0r;
*59d799daSIngo Weinhold        x0r = x1r - x3i;
*59d799daSIngo Weinhold        x0i = x1i + x3r;
*59d799daSIngo Weinhold        a[j + 10] = wk1r * x0r - wk1i * x0i;
*59d799daSIngo Weinhold        a[j + 11] = wk1r * x0i + wk1i * x0r;
*59d799daSIngo Weinhold        x0r = x1r + x3i;
*59d799daSIngo Weinhold        x0i = x1i - x3r;
*59d799daSIngo Weinhold        a[j + 14] = wk3r * x0r - wk3i * x0i;
*59d799daSIngo Weinhold        a[j + 15] = wk3r * x0i + wk3i * x0r;
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid 	M_cftmdl(int n, int l, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    int j, j1, j2, j3, k, kj, kr, m, m2;
*59d799daSIngo Weinhold    double ew, wn4r, wk1r, wk1i, wk2r, wk2i, wk3r, wk3i;
*59d799daSIngo Weinhold    double x0r, x0i, x1r, x1i, x2r, x2i, x3r, x3i;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    m = l << 2;
*59d799daSIngo Weinhold    for (j = 0; j < l; j += 2) {
*59d799daSIngo Weinhold        j1 = j + l;
*59d799daSIngo Weinhold        j2 = j1 + l;
*59d799daSIngo Weinhold        j3 = j2 + l;
*59d799daSIngo Weinhold        x0r = a[j] + a[j1];
*59d799daSIngo Weinhold        x0i = a[j + 1] + a[j1 + 1];
*59d799daSIngo Weinhold        x1r = a[j] - a[j1];
*59d799daSIngo Weinhold        x1i = a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold        x2r = a[j2] + a[j3];
*59d799daSIngo Weinhold        x2i = a[j2 + 1] + a[j3 + 1];
*59d799daSIngo Weinhold        x3r = a[j2] - a[j3];
*59d799daSIngo Weinhold        x3i = a[j2 + 1] - a[j3 + 1];
*59d799daSIngo Weinhold        a[j] = x0r + x2r;
*59d799daSIngo Weinhold        a[j + 1] = x0i + x2i;
*59d799daSIngo Weinhold        a[j2] = x0r - x2r;
*59d799daSIngo Weinhold        a[j2 + 1] = x0i - x2i;
*59d799daSIngo Weinhold        a[j1] = x1r - x3i;
*59d799daSIngo Weinhold        a[j1 + 1] = x1i + x3r;
*59d799daSIngo Weinhold        a[j3] = x1r + x3i;
*59d799daSIngo Weinhold        a[j3 + 1] = x1i - x3r;
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold    wn4r = WR5000;
*59d799daSIngo Weinhold    for (j = m; j < l + m; j += 2) {
*59d799daSIngo Weinhold        j1 = j + l;
*59d799daSIngo Weinhold        j2 = j1 + l;
*59d799daSIngo Weinhold        j3 = j2 + l;
*59d799daSIngo Weinhold        x0r = a[j] + a[j1];
*59d799daSIngo Weinhold        x0i = a[j + 1] + a[j1 + 1];
*59d799daSIngo Weinhold        x1r = a[j] - a[j1];
*59d799daSIngo Weinhold        x1i = a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold        x2r = a[j2] + a[j3];
*59d799daSIngo Weinhold        x2i = a[j2 + 1] + a[j3 + 1];
*59d799daSIngo Weinhold        x3r = a[j2] - a[j3];
*59d799daSIngo Weinhold        x3i = a[j2 + 1] - a[j3 + 1];
*59d799daSIngo Weinhold        a[j] = x0r + x2r;
*59d799daSIngo Weinhold        a[j + 1] = x0i + x2i;
*59d799daSIngo Weinhold        a[j2] = x2i - x0i;
*59d799daSIngo Weinhold        a[j2 + 1] = x0r - x2r;
*59d799daSIngo Weinhold        x0r = x1r - x3i;
*59d799daSIngo Weinhold        x0i = x1i + x3r;
*59d799daSIngo Weinhold        a[j1] = wn4r * (x0r - x0i);
*59d799daSIngo Weinhold        a[j1 + 1] = wn4r * (x0r + x0i);
*59d799daSIngo Weinhold        x0r = x3i + x1r;
*59d799daSIngo Weinhold        x0i = x3r - x1i;
*59d799daSIngo Weinhold        a[j3] = wn4r * (x0i - x0r);
*59d799daSIngo Weinhold        a[j3 + 1] = wn4r * (x0i + x0r);
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold    ew = MM_PI_2 / n;
*59d799daSIngo Weinhold    kr = 0;
*59d799daSIngo Weinhold    m2 = 2 * m;
*59d799daSIngo Weinhold    for (k = m2; k < n; k += m2) {
*59d799daSIngo Weinhold        for (kj = n >> 2; kj > (kr ^= kj); kj >>= 1);
*59d799daSIngo Weinhold        wk1r = cos(ew * kr);
*59d799daSIngo Weinhold        wk1i = sin(ew * kr);
*59d799daSIngo Weinhold        wk2r = 1 - 2 * wk1i * wk1i;
*59d799daSIngo Weinhold        wk2i = 2 * wk1i * wk1r;
*59d799daSIngo Weinhold        wk3r = wk1r - 2 * wk2i * wk1i;
*59d799daSIngo Weinhold        wk3i = 2 * wk2i * wk1r - wk1i;
*59d799daSIngo Weinhold        for (j = k; j < l + k; j += 2) {
*59d799daSIngo Weinhold            j1 = j + l;
*59d799daSIngo Weinhold            j2 = j1 + l;
*59d799daSIngo Weinhold            j3 = j2 + l;
*59d799daSIngo Weinhold            x0r = a[j] + a[j1];
*59d799daSIngo Weinhold            x0i = a[j + 1] + a[j1 + 1];
*59d799daSIngo Weinhold            x1r = a[j] - a[j1];
*59d799daSIngo Weinhold            x1i = a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold            x2r = a[j2] + a[j3];
*59d799daSIngo Weinhold            x2i = a[j2 + 1] + a[j3 + 1];
*59d799daSIngo Weinhold            x3r = a[j2] - a[j3];
*59d799daSIngo Weinhold            x3i = a[j2 + 1] - a[j3 + 1];
*59d799daSIngo Weinhold            a[j] = x0r + x2r;
*59d799daSIngo Weinhold            a[j + 1] = x0i + x2i;
*59d799daSIngo Weinhold            x0r -= x2r;
*59d799daSIngo Weinhold            x0i -= x2i;
*59d799daSIngo Weinhold            a[j2] = wk2r * x0r - wk2i * x0i;
*59d799daSIngo Weinhold            a[j2 + 1] = wk2r * x0i + wk2i * x0r;
*59d799daSIngo Weinhold            x0r = x1r - x3i;
*59d799daSIngo Weinhold            x0i = x1i + x3r;
*59d799daSIngo Weinhold            a[j1] = wk1r * x0r - wk1i * x0i;
*59d799daSIngo Weinhold            a[j1 + 1] = wk1r * x0i + wk1i * x0r;
*59d799daSIngo Weinhold            x0r = x1r + x3i;
*59d799daSIngo Weinhold            x0i = x1i - x3r;
*59d799daSIngo Weinhold            a[j3] = wk3r * x0r - wk3i * x0i;
*59d799daSIngo Weinhold            a[j3 + 1] = wk3r * x0i + wk3i * x0r;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        x0r = wn4r * (wk1r - wk1i);
*59d799daSIngo Weinhold        wk1i = wn4r * (wk1r + wk1i);
*59d799daSIngo Weinhold        wk1r = x0r;
*59d799daSIngo Weinhold        wk3r = wk1r - 2 * wk2r * wk1i;
*59d799daSIngo Weinhold        wk3i = 2 * wk2r * wk1r - wk1i;
*59d799daSIngo Weinhold        for (j = k + m; j < l + (k + m); j += 2) {
*59d799daSIngo Weinhold            j1 = j + l;
*59d799daSIngo Weinhold            j2 = j1 + l;
*59d799daSIngo Weinhold            j3 = j2 + l;
*59d799daSIngo Weinhold            x0r = a[j] + a[j1];
*59d799daSIngo Weinhold            x0i = a[j + 1] + a[j1 + 1];
*59d799daSIngo Weinhold            x1r = a[j] - a[j1];
*59d799daSIngo Weinhold            x1i = a[j + 1] - a[j1 + 1];
*59d799daSIngo Weinhold            x2r = a[j2] + a[j3];
*59d799daSIngo Weinhold            x2i = a[j2 + 1] + a[j3 + 1];
*59d799daSIngo Weinhold            x3r = a[j2] - a[j3];
*59d799daSIngo Weinhold            x3i = a[j2 + 1] - a[j3 + 1];
*59d799daSIngo Weinhold            a[j] = x0r + x2r;
*59d799daSIngo Weinhold            a[j + 1] = x0i + x2i;
*59d799daSIngo Weinhold            x0r -= x2r;
*59d799daSIngo Weinhold            x0i -= x2i;
*59d799daSIngo Weinhold            a[j2] = -wk2i * x0r - wk2r * x0i;
*59d799daSIngo Weinhold            a[j2 + 1] = -wk2i * x0i + wk2r * x0r;
*59d799daSIngo Weinhold            x0r = x1r - x3i;
*59d799daSIngo Weinhold            x0i = x1i + x3r;
*59d799daSIngo Weinhold            a[j1] = wk1r * x0r - wk1i * x0i;
*59d799daSIngo Weinhold            a[j1 + 1] = wk1r * x0i + wk1i * x0r;
*59d799daSIngo Weinhold            x0r = x1r + x3i;
*59d799daSIngo Weinhold            x0i = x1i - x3r;
*59d799daSIngo Weinhold            a[j3] = wk3r * x0r - wk3i * x0i;
*59d799daSIngo Weinhold            a[j3 + 1] = wk3r * x0i + wk3i * x0r;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid 	M_rftfsub(int n, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    int i, i0, j, k;
*59d799daSIngo Weinhold    double ec, w1r, w1i, wkr, wki, wdr, wdi, ss, xr, xi, yr, yi;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    ec = 2 * MM_PI_2 / n;
*59d799daSIngo Weinhold    wkr = 0;
*59d799daSIngo Weinhold    wki = 0;
*59d799daSIngo Weinhold    wdi = cos(ec);
*59d799daSIngo Weinhold    wdr = sin(ec);
*59d799daSIngo Weinhold    wdi *= wdr;
*59d799daSIngo Weinhold    wdr *= wdr;
*59d799daSIngo Weinhold    w1r = 1 - 2 * wdr;
*59d799daSIngo Weinhold    w1i = 2 * wdi;
*59d799daSIngo Weinhold    ss = 2 * w1i;
*59d799daSIngo Weinhold    i = n >> 1;
*59d799daSIngo Weinhold    while (1) {
*59d799daSIngo Weinhold        i0 = i - 4 * RDFT_LOOP_DIV;
*59d799daSIngo Weinhold        if (i0 < 4) {
*59d799daSIngo Weinhold            i0 = 4;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        for (j = i - 4; j >= i0; j -= 4) {
*59d799daSIngo Weinhold            k = n - j;
*59d799daSIngo Weinhold            xr = a[j + 2] - a[k - 2];
*59d799daSIngo Weinhold            xi = a[j + 3] + a[k - 1];
*59d799daSIngo Weinhold            yr = wdr * xr - wdi * xi;
*59d799daSIngo Weinhold            yi = wdr * xi + wdi * xr;
*59d799daSIngo Weinhold            a[j + 2] -= yr;
*59d799daSIngo Weinhold            a[j + 3] -= yi;
*59d799daSIngo Weinhold            a[k - 2] += yr;
*59d799daSIngo Weinhold            a[k - 1] -= yi;
*59d799daSIngo Weinhold            wkr += ss * wdi;
*59d799daSIngo Weinhold            wki += ss * (0.5 - wdr);
*59d799daSIngo Weinhold            xr = a[j] - a[k];
*59d799daSIngo Weinhold            xi = a[j + 1] + a[k + 1];
*59d799daSIngo Weinhold            yr = wkr * xr - wki * xi;
*59d799daSIngo Weinhold            yi = wkr * xi + wki * xr;
*59d799daSIngo Weinhold            a[j] -= yr;
*59d799daSIngo Weinhold            a[j + 1] -= yi;
*59d799daSIngo Weinhold            a[k] += yr;
*59d799daSIngo Weinhold            a[k + 1] -= yi;
*59d799daSIngo Weinhold            wdr += ss * wki;
*59d799daSIngo Weinhold            wdi += ss * (0.5 - wkr);
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        if (i0 == 4) {
*59d799daSIngo Weinhold            break;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        wkr = 0.5 * sin(ec * i0);
*59d799daSIngo Weinhold        wki = 0.5 * cos(ec * i0);
*59d799daSIngo Weinhold        wdr = 0.5 - (wkr * w1r - wki * w1i);
*59d799daSIngo Weinhold        wdi = wkr * w1i + wki * w1r;
*59d799daSIngo Weinhold        wkr = 0.5 - wkr;
*59d799daSIngo Weinhold        i = i0;
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold    xr = a[2] - a[n - 2];
*59d799daSIngo Weinhold    xi = a[3] + a[n - 1];
*59d799daSIngo Weinhold    yr = wdr * xr - wdi * xi;
*59d799daSIngo Weinhold    yi = wdr * xi + wdi * xr;
*59d799daSIngo Weinhold    a[2] -= yr;
*59d799daSIngo Weinhold    a[3] -= yi;
*59d799daSIngo Weinhold    a[n - 2] += yr;
*59d799daSIngo Weinhold    a[n - 1] -= yi;
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold
*59d799daSIngo Weinholdvoid 	M_rftbsub(int n, double *a)
*59d799daSIngo Weinhold{
*59d799daSIngo Weinhold    int i, i0, j, k;
*59d799daSIngo Weinhold    double ec, w1r, w1i, wkr, wki, wdr, wdi, ss, xr, xi, yr, yi;
*59d799daSIngo Weinhold
*59d799daSIngo Weinhold    ec = 2 * MM_PI_2 / n;
*59d799daSIngo Weinhold    wkr = 0;
*59d799daSIngo Weinhold    wki = 0;
*59d799daSIngo Weinhold    wdi = cos(ec);
*59d799daSIngo Weinhold    wdr = sin(ec);
*59d799daSIngo Weinhold    wdi *= wdr;
*59d799daSIngo Weinhold    wdr *= wdr;
*59d799daSIngo Weinhold    w1r = 1 - 2 * wdr;
*59d799daSIngo Weinhold    w1i = 2 * wdi;
*59d799daSIngo Weinhold    ss = 2 * w1i;
*59d799daSIngo Weinhold    i = n >> 1;
*59d799daSIngo Weinhold    a[i + 1] = -a[i + 1];
*59d799daSIngo Weinhold    while (1) {
*59d799daSIngo Weinhold        i0 = i - 4 * RDFT_LOOP_DIV;
*59d799daSIngo Weinhold        if (i0 < 4) {
*59d799daSIngo Weinhold            i0 = 4;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        for (j = i - 4; j >= i0; j -= 4) {
*59d799daSIngo Weinhold            k = n - j;
*59d799daSIngo Weinhold            xr = a[j + 2] - a[k - 2];
*59d799daSIngo Weinhold            xi = a[j + 3] + a[k - 1];
*59d799daSIngo Weinhold            yr = wdr * xr + wdi * xi;
*59d799daSIngo Weinhold            yi = wdr * xi - wdi * xr;
*59d799daSIngo Weinhold            a[j + 2] -= yr;
*59d799daSIngo Weinhold            a[j + 3] = yi - a[j + 3];
*59d799daSIngo Weinhold            a[k - 2] += yr;
*59d799daSIngo Weinhold            a[k - 1] = yi - a[k - 1];
*59d799daSIngo Weinhold            wkr += ss * wdi;
*59d799daSIngo Weinhold            wki += ss * (0.5 - wdr);
*59d799daSIngo Weinhold            xr = a[j] - a[k];
*59d799daSIngo Weinhold            xi = a[j + 1] + a[k + 1];
*59d799daSIngo Weinhold            yr = wkr * xr + wki * xi;
*59d799daSIngo Weinhold            yi = wkr * xi - wki * xr;
*59d799daSIngo Weinhold            a[j] -= yr;
*59d799daSIngo Weinhold            a[j + 1] = yi - a[j + 1];
*59d799daSIngo Weinhold            a[k] += yr;
*59d799daSIngo Weinhold            a[k + 1] = yi - a[k + 1];
*59d799daSIngo Weinhold            wdr += ss * wki;
*59d799daSIngo Weinhold            wdi += ss * (0.5 - wkr);
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        if (i0 == 4) {
*59d799daSIngo Weinhold            break;
*59d799daSIngo Weinhold        }
*59d799daSIngo Weinhold        wkr = 0.5 * sin(ec * i0);
*59d799daSIngo Weinhold        wki = 0.5 * cos(ec * i0);
*59d799daSIngo Weinhold        wdr = 0.5 - (wkr * w1r - wki * w1i);
*59d799daSIngo Weinhold        wdi = wkr * w1i + wki * w1r;
*59d799daSIngo Weinhold        wkr = 0.5 - wkr;
*59d799daSIngo Weinhold        i = i0;
*59d799daSIngo Weinhold    }
*59d799daSIngo Weinhold    xr = a[2] - a[n - 2];
*59d799daSIngo Weinhold    xi = a[3] + a[n - 1];
*59d799daSIngo Weinhold    yr = wdr * xr + wdi * xi;
*59d799daSIngo Weinhold    yi = wdr * xi - wdi * xr;
*59d799daSIngo Weinhold    a[2] -= yr;
*59d799daSIngo Weinhold    a[3] = yi - a[3];
*59d799daSIngo Weinhold    a[n - 2] += yr;
*59d799daSIngo Weinhold    a[n - 1] = yi - a[n - 1];
*59d799daSIngo Weinhold    a[1] = -a[1];
*59d799daSIngo Weinhold}
*59d799daSIngo Weinhold