[simh.git] / VAX / vax_fpa.c

/* vax_fpa.c - VAX f_, d_, g_floating instructions\r
\r
   Copyright (c) 1998-2008, Robert M Supnik\r
\r
   Permission is hereby granted, free of charge, to any person obtaining a\r
   copy of this software and associated documentation files (the "Software"),\r
   to deal in the Software without restriction, including without limitation\r
   the rights to use, copy, modify, merge, publish, distribute, sublicense,\r
   and/or sell copies of the Software, and to permit persons to whom the\r
   Software is furnished to do so, subject to the following conditions:\r
\r
   The above copyright notice and this permission notice shall be included in\r
   all copies or substantial portions of the Software.\r
\r
   THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR\r
   IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,\r
   FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL\r
   ROBERT M SUPNIK BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER\r
   IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN\r
   CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.\r
\r
   Except as contained in this notice, the name of Robert M Supnik shall not be\r
   used in advertising or otherwise to promote the sale, use or other dealings\r
   in this Software without prior written authorization from Robert M Supnik.\r
\r
   28-May-08    RMS     Inlined physical memory routines\r
   16-May-06    RMS     Fixed bug in 32b floating multiply routine\r
                        Fixed bug in 64b extended modulus routine\r
   03-May-06    RMS     Fixed POLYD, POLYG to clear R4, R5\r
                        Fixed POLYD, POLYG to set R3 correctly\r
                        Fixed POLYD, POLYG to not exit prematurely if arg = 0\r
                        Fixed POLYD, POLYG to do full 64b multiply\r
                        Fixed POLYF, POLYD, POLYG to remove truncation on add\r
                        Fixed POLYF, POLYD, POLYG to mask mul reslt to 31b/63b/63b\r
                        Fixed fp add routine to test for zero via fraction\r
                         to support "denormal" argument from POLYF, POLYD, POLYG\r
                        (all reported by Tim Stark)\r
   27-Sep-05    RMS     Fixed bug in 32b structure definitions (from Jason Stevens)\r
   30-Sep-04    RMS     Comment and formating changes based on vax_octa.c\r
   18-Apr-04    RMS     Moved format definitions to vax_defs.h\r
   19-Jun-03    RMS     Simplified add algorithm\r
   16-May-03    RMS     Fixed bug in floating to integer convert overflow\r
                        Fixed multiple bugs in EMODx\r
                        Integrated 32b only code\r
   05-Jul-02    RMS     Changed internal routine names for C library conflict\r
   17-Apr-02    RMS     Fixed bug in EDIV zero quotient\r
\r
   This module contains the instruction simulators for\r
\r
        - 64 bit arithmetic (ASHQ, EMUL, EDIV)\r
        - single precision floating point\r
        - double precision floating point, D and G format\r
*/\r
\r
#include "vax_defs.h"\r
#include <setjmp.h>\r
\r
extern int32 R[16];\r
extern int32 PSL;\r
extern int32 p1;\r
extern jmp_buf save_env;\r
\r
#if defined (USE_INT64)\r
\r
#define M64             0xFFFFFFFFFFFFFFFF              /* 64b */\r
#define FD_FRACW        (0xFFFF & ~(FD_EXP | FPSIGN))\r
#define FD_FRACL        (FD_FRACW | 0xFFFF0000)         /* f/d fraction */\r
#define G_FRACW         (0xFFFF & ~(G_EXP | FPSIGN))\r
#define G_FRACL         (G_FRACW | 0xFFFF0000)          /* g fraction */\r
#define UNSCRAM(h,l)    (((((t_uint64) (h)) << 48) & 0xFFFF000000000000) | \\r
                        ((((t_uint64) (h)) << 16) & 0x0000FFFF00000000) | \\r
                        ((((t_uint64) (l)) << 16) & 0x00000000FFFF0000) | \\r
                        ((((t_uint64) (l)) >> 16) & 0x000000000000FFFF))\r
#define CONCAT(h,l)     ((((t_uint64) (h)) << 32) | ((uint32) (l)))\r
\r
typedef struct {\r
    int32               sign;\r
    int32               exp;\r
    t_uint64            frac;\r
    } UFP;\r
\r
#define UF_NM           0x8000000000000000              /* normalized */\r
#define UF_FRND         0x0000008000000000              /* F round */\r
#define UF_DRND         0x0000000000000080              /* D round */\r
#define UF_GRND         0x0000000000000400              /* G round */\r
#define UF_V_NM         63\r
#define UF_V_FDHI       40\r
#define UF_V_FDLO       (UF_V_FDHI - 32)\r
#define UF_V_GHI        43\r
#define UF_V_GLO        (UF_V_GHI - 32)\r
#define UF_GETFDHI(x)   (int32) ((((x) >> (16 + UF_V_FDHI)) & FD_FRACW) | \\r
                        (((x) >> (UF_V_FDHI - 16)) & ~0xFFFF))\r
#define UF_GETFDLO(x)   (int32) ((((x) >> (16 + UF_V_FDLO)) & 0xFFFF) | \\r
                        (((x) << (16 - UF_V_FDLO)) & ~0xFFFF))\r
#define UF_GETGHI(x)    (int32) ((((x) >> (16 + UF_V_GHI)) & G_FRACW) | \\r
                        (((x) >> (UF_V_GHI - 16)) & ~0xFFFF))\r
#define UF_GETGLO(x)    (int32) ((((x) >> (16 + UF_V_GLO)) & 0xFFFF) | \\r
                        (((x) << (16 - UF_V_GLO)) & ~0xFFFF))\r
\r
void unpackf (int32 hi, UFP *a);\r
void unpackd (int32 hi, int32 lo, UFP *a);\r
void unpackg (int32 hi, int32 lo, UFP *a);\r
void norm (UFP *a);\r
int32 rpackfd (UFP *a, int32 *rh);\r
int32 rpackg (UFP *a, int32 *rh);\r
void vax_fadd (UFP *a, UFP *b);\r
void vax_fmul (UFP *a, UFP *b, t_bool qd, int32 bias, uint32 mhi, uint32 mlo);\r
void vax_fdiv (UFP *b, UFP *a, int32 prec, int32 bias);\r
void vax_fmod (UFP *a, int32 bias, int32 *intgr, int32 *flg);\r
\r
/* Quadword arithmetic shift\r
\r
        opnd[0]         =       shift count (cnt.rb)\r
        opnd[1:2]       =       source (src.rq)\r
        opnd[3:4]       =       destination (dst.wq)\r
*/\r
\r
int32 op_ashq (int32 *opnd, int32 *rh, int32 *flg)\r
{\r
t_int64 src, r;\r
int32 sc = opnd[0];\r
\r
src = CONCAT (opnd[2], opnd[1]);                        /* build src */\r
if (sc & BSIGN) {                                       /* right shift? */\r
    *flg = 0;                                           /* no ovflo */\r
    sc = 0x100 - sc;                                    /* |shift| */\r
    if (sc > 63) r = (opnd[2] & LSIGN)? -1: 0;          /* sc > 63? */\r
    else r = src >> sc;\r
    }\r
else {\r
    if (sc > 63) {                                      /* left shift */\r
        r = 0;                                          /* sc > 63? */\r
        *flg = (src != 0);                              /* ovflo test */\r
        }\r
    else {\r
        r = src << sc;                                  /* do shift */\r
        *flg = (src != (r >> sc));                      /* ovflo test */\r
        }\r
    }\r
*rh = (int32) ((r >> 32) & LMASK);                      /* hi result */\r
return ((int32) (r & LMASK));                           /* lo result */\r
}\r
\r
/* Extended multiply subroutine */\r
\r
int32 op_emul (int32 mpy, int32 mpc, int32 *rh)\r
{\r
t_int64 lmpy = mpy;\r
t_int64 lmpc = mpc;\r
\r
lmpy = lmpy * lmpc;\r
*rh = (int32) ((lmpy >> 32) & LMASK);\r
return ((int32) (lmpy & LMASK));\r
}\r
\r
/* Extended divide\r
\r
        opnd[0]         =       divisor (non-zero)\r
        opnd[1:2]       =       dividend\r
*/\r
\r
int32 op_ediv (int32 *opnd, int32 *rh, int32 *flg)\r
{\r
t_int64 ldvd, ldvr;\r
int32 quo, rem;\r
\r
*flg = CC_V;                                            /* assume error */\r
*rh = 0;\r
ldvr = ((opnd[0] & LSIGN)? -opnd[0]: opnd[0]) & LMASK;  /* |divisor| */\r
ldvd = CONCAT (opnd[2], opnd[1]);                       /* 64b dividend */\r
if (opnd[2] & LSIGN) ldvd = -ldvd;                      /* |dividend| */\r
if (((ldvd >> 32) & LMASK) >= ldvr) return opnd[1];     /* divide work? */\r
quo = (int32) (ldvd / ldvr);                            /* do divide */\r
rem = (int32) (ldvd % ldvr);\r
if ((opnd[0] ^ opnd[2]) & LSIGN) {                      /* result -? */\r
    quo = -quo;                                         /* negate */\r
    if (quo && ((quo & LSIGN) == 0)) return opnd[1];    /* right sign? */\r
    }\r
else if (quo & LSIGN) return opnd[1];\r
if (opnd[2] & LSIGN) rem = -rem;                        /* sign of rem */\r
*flg = 0;                                               /* no overflow */\r
*rh = rem & LMASK;                                      /* set rem */\r
return (quo & LMASK);                                   /* return quo */\r
}\r
\r
/* Compare floating */\r
\r
int32 op_cmpfd (int32 h1, int32 l1, int32 h2, int32 l2)\r
{\r
t_uint64 n1, n2;\r
\r
if ((h1 & FD_EXP) == 0) {\r
    if (h1 & FPSIGN) RSVD_OPND_FAULT;\r
    h1 = l1 = 0;\r
    }\r
if ((h2 & FD_EXP) == 0) {\r
    if (h2 & FPSIGN) RSVD_OPND_FAULT;\r
    h2 = l2 = 0;\r
    }\r
if ((h1 ^ h2) & FPSIGN) return ((h1 & FPSIGN)? CC_N: 0);\r
n1 = UNSCRAM (h1, l1);\r
n2 = UNSCRAM (h2, l2);\r
if (n1 == n2) return CC_Z;\r
return (((n1 < n2) ^ ((h1 & FPSIGN) != 0))? CC_N: 0);\r
}\r
\r
int32 op_cmpg (int32 h1, int32 l1, int32 h2, int32 l2)\r
{\r
t_uint64 n1, n2;\r
\r
if ((h1 & G_EXP) == 0) {\r
    if (h1 & FPSIGN) RSVD_OPND_FAULT;\r
    h1 = l1 = 0;\r
    }\r
if ((h2 & G_EXP) == 0) {\r
    if (h2 & FPSIGN) RSVD_OPND_FAULT;\r
    h2 = l2 = 0;\r
    }\r
if ((h1 ^ h2) & FPSIGN) return ((h1 & FPSIGN)? CC_N: 0);\r
n1 = UNSCRAM (h1, l1);\r
n2 = UNSCRAM (h2, l2);\r
if (n1 == n2) return CC_Z;\r
return (((n1 < n2) ^ ((h1 & FPSIGN) != 0))? CC_N: 0);\r
}\r
\r
/* Integer to floating convert */\r
\r
int32 op_cvtifdg (int32 val, int32 *rh, int32 opc)\r
{\r
UFP a;\r
\r
if (val == 0) {\r
    if (rh) *rh = 0;\r
    return 0;\r
    }\r
if (val < 0) {\r
    a.sign = FPSIGN;\r
    val = - val;\r
    }\r
else a.sign = 0;\r
a.exp = 32 + ((opc & 0x100)? G_BIAS: FD_BIAS);\r
a.frac = ((t_uint64) val) << (UF_V_NM - 31);\r
norm (&a);\r
if (opc & 0x100) return rpackg (&a, rh);\r
return rpackfd (&a, rh);\r
}\r
\r
/* Floating to integer convert */\r
\r
int32 op_cvtfdgi (int32 *opnd, int32 *flg, int32 opc)\r
{\r
UFP a;\r
int32 lnt = opc & 03;\r
int32 ubexp;\r
static t_uint64 maxv[4] = { 0x7F, 0x7FFF, 0x7FFFFFFF, 0x7FFFFFFF };\r
\r
*flg = 0;\r
if (opc & 0x100) {\r
    unpackg (opnd[0], opnd[1], &a);\r
    ubexp = a.exp - G_BIAS;\r
    }\r
else {\r
    if (opc & 0x20) unpackd (opnd[0], opnd[1], &a);\r
    else unpackf (opnd[0], &a);\r
    ubexp = a.exp - FD_BIAS;\r
    }\r
if ((a.exp == 0) || (ubexp < 0)) return 0;\r
if (ubexp <= UF_V_NM) {\r
    a.frac = a.frac >> (UF_V_NM - ubexp);               /* leave rnd bit */\r
    if ((opc & 03) == 03) a.frac = a.frac + 1;          /* if CVTR, round */\r
    a.frac = a.frac >> 1;                               /* now justified */\r
    if (a.frac > (maxv[lnt] + (a.sign? 1: 0))) *flg = CC_V;\r
    }\r
else {\r
    *flg = CC_V;                                        /* set overflow */\r
    if (ubexp > (UF_V_NM + 32)) return 0;\r
    a.frac = a.frac << (ubexp - UF_V_NM - 1);           /* no rnd bit */\r
    }\r
return ((int32) ((a.sign? (a.frac ^ LMASK) + 1: a.frac) & LMASK));\r
}\r
\r
/* Extended modularize\r
\r
   One of three floating point instructions dropped from the architecture,\r
   EMOD presents two sets of complications.  First, it requires an extended\r
   fraction multiply, with precise (and unusual) truncation conditions.\r
   Second, it has two write operands, a dubious distinction it shares\r
   with EDIV.\r
*/\r
\r
int32 op_emodf (int32 *opnd, int32 *intgr, int32 *flg)\r
{\r
UFP a, b;\r
\r
unpackf (opnd[0], &a);                                  /* unpack operands */\r
unpackf (opnd[2], &b);\r
a.frac = a.frac | (((t_uint64) opnd[1]) << 32);         /* extend src1 */\r
vax_fmul (&a, &b, 0, FD_BIAS, 0, LMASK);                /* multiply */\r
vax_fmod (&a, FD_BIAS, intgr, flg);                     /* sep int & frac */\r
return rpackfd (&a, NULL);                              /* return frac */\r
}\r
\r
int32 op_emodd (int32 *opnd, int32 *flo, int32 *intgr, int32 *flg)\r
{\r
UFP a, b;\r
\r
unpackd (opnd[0], opnd[1], &a);                         /* unpack operands */\r
unpackd (opnd[3], opnd[4], &b);\r
a.frac = a.frac | opnd[2];                              /* extend src1 */\r
vax_fmul (&a, &b, 1, FD_BIAS, 0, 0);                    /* multiply */\r
vax_fmod (&a, FD_BIAS, intgr, flg);                     /* sep int & frac */\r
return rpackfd (&a, flo);                               /* return frac */\r
}\r
\r
int32 op_emodg (int32 *opnd, int32 *flo, int32 *intgr, int32 *flg)\r
{\r
UFP a, b;\r
\r
unpackg (opnd[0], opnd[1], &a);                         /* unpack operands */\r
unpackg (opnd[3], opnd[4], &b);\r
a.frac = a.frac | (opnd[2] >> 5);                       /* extend src1 */\r
vax_fmul (&a, &b, 1, G_BIAS, 0, 0);                     /* multiply */\r
vax_fmod (&a, G_BIAS, intgr, flg);                      /* sep int & frac */\r
return rpackg (&a, flo);                                /* return frac */\r
}\r
\r
/* Unpacked floating point routines */\r
\r
void vax_fadd (UFP *a, UFP *b)\r
{\r
int32 ediff;\r
UFP t;\r
\r
if (a->frac == 0) {                                     /* s1 = 0? */\r
    *a = *b;\r
    return;\r
    }\r
if (b->frac == 0) return;                               /* s2 = 0? */\r
if ((a->exp < b->exp) ||                                /* |s1| < |s2|? swap */\r
    ((a->exp == b->exp) && (a->frac < b->frac))) {\r
    t = *a;\r
    *a = *b;\r
    *b = t;\r
    }\r
ediff = a->exp - b->exp;                                /* exp diff */\r
if (a->sign ^ b->sign) {                                /* eff sub? */\r
    if (ediff) {                                        /* exp diff? */\r
        if (ediff > 63) b->frac = M64;                  /* retain sticky */\r
        else b->frac = ((-((t_int64) b->frac) >> ediff) | /* denormalize */\r
            (M64 << (64 - ediff)));                     /* preserve sign */\r
        a->frac = a->frac + b->frac;                    /* add frac */\r
        }\r
    else a->frac = a->frac - b->frac;                   /* sub frac */\r
    norm (a);                                           /* normalize */\r
    }\r
else {\r
    if (ediff > 63) b->frac = 0;                        /* add */\r
    else if (ediff) b->frac = b->frac >> ediff;         /* denormalize */\r
    a->frac = a->frac + b->frac;                        /* add frac */\r
    if (a->frac < b->frac) {                            /* chk for carry */\r
        a->frac = UF_NM | (a->frac >> 1);               /* shift in carry */\r
        a->exp = a->exp + 1;                            /* skip norm */\r
        }\r
    }\r
return;\r
}\r
\r
/* Floating multiply - 64b * 64b with cross products */\r
\r
void vax_fmul (UFP *a, UFP *b, t_bool qd, int32 bias, uint32 mhi, uint32 mlo)\r
{\r
t_uint64 ah, bh, al, bl, rhi, rlo, rmid1, rmid2;\r
t_uint64 mask = (((t_uint64) mhi) << 32) | ((t_uint64) mlo);\r
\r
if ((a->exp == 0) || (b->exp == 0)) {                   /* zero argument? */\r
    a->frac = a->sign = a->exp = 0;                     /* result is zero */\r
    return;\r
    }\r
a->sign = a->sign ^ b->sign;                            /* sign of result */\r
a->exp = a->exp + b->exp - bias;                        /* add exponents */\r
ah = (a->frac >> 32) & LMASK;                           /* split operands */\r
bh = (b->frac >> 32) & LMASK;                           /* into 32b chunks */\r
rhi = ah * bh;                                          /* high result */\r
if (qd) {                                               /* 64b needed? */\r
    al = a->frac & LMASK;\r
    bl = b->frac & LMASK;\r
    rmid1 = ah * bl;\r
    rmid2 = al * bh;\r
    rlo = al * bl;\r
    rhi = rhi + ((rmid1 >> 32) & LMASK) + ((rmid2 >> 32) & LMASK);\r
    rmid1 = rlo + (rmid1 << 32);                        /* add mid1 to lo */\r
    if (rmid1 < rlo) rhi = rhi + 1;                     /* carry? incr hi */\r
    rmid2 = rmid1 + (rmid2 << 32);                      /* add mid2 to lo */\r
    if (rmid2 < rmid1) rhi = rhi + 1;                   /* carry? incr hi */\r
    }\r
a->frac = rhi & ~mask;\r
norm (a);                                               /* normalize */\r
return;\r
}\r
\r
/* Floating modulus - there are three cases\r
\r
   exp <= bias                  - integer is 0, fraction is input,\r
                                  no overflow\r
   bias < exp <= bias+64        - separate integer and fraction,\r
                                  integer overflow may occur\r
   bias+64 < exp                - result is integer, fraction is 0\r
                                  integer overflow\r
*/\r
\r
void vax_fmod (UFP *a, int32 bias, int32 *intgr, int32 *flg)\r
{\r
if (a->exp <= bias) *intgr = *flg = 0;                  /* 0 or <1? int = 0 */\r
else if (a->exp <= (bias + 64)) {                       /* in range [1,64]? */\r
    *intgr = (int32) (a->frac >> (64 - (a->exp - bias)));\r
    if ((a->exp > (bias + 32)) ||                       /* test ovflo */\r
        ((a->exp == (bias + 32)) &&\r
         (((uint32) *intgr) > (a->sign? 0x80000000: 0x7FFFFFFF))))\r
        *flg = CC_V;\r
    else *flg = 0;\r
    if (a->sign) *intgr = -*intgr;                      /* -? comp int */\r
    if (a->exp == (bias + 64)) a->frac = 0;             /* special case 64 */\r
    else a->frac = a->frac << (a->exp - bias);\r
    a->exp = bias;\r
    }\r
else {\r
    *intgr = 0;                                         /* out of range */\r
    a->frac = a->sign = a->exp = 0;                     /* result 0 */\r
    *flg = CC_V;                                        /* overflow */\r
    }\r
norm (a);                                               /* normalize */\r
return;\r
}\r
\r
/* Floating divide\r
   Needs to develop at least one rounding bit.  Since the first\r
   divide step can fail, caller should specify 2 more bits than\r
   the precision of the fraction.\r
*/\r
\r
void vax_fdiv (UFP *a, UFP *b, int32 prec, int32 bias)\r
{\r
int32 i;\r
t_uint64 quo = 0;\r
\r
if (a->exp == 0) FLT_DZRO_FAULT;                        /* divr = 0? */\r
if (b->exp == 0) return;                                /* divd = 0? */\r
b->sign = b->sign ^ a->sign;                            /* result sign */\r
b->exp = b->exp - a->exp + bias + 1;                    /* unbiased exp */\r
a->frac = a->frac >> 1;                                 /* allow 1 bit left */\r
b->frac = b->frac >> 1;\r
for (i = 0; (i < prec) && b->frac; i++) {               /* divide loop */\r
    quo = quo << 1;                                     /* shift quo */\r
    if (b->frac >= a->frac) {                           /* div step ok? */\r
        b->frac = b->frac - a->frac;                    /* subtract */\r
        quo = quo + 1;                                  /* quo bit = 1 */\r
        }\r
    b->frac = b->frac << 1;                             /* shift divd */\r
    }\r
b->frac = quo << (UF_V_NM - i + 1);                     /* shift quo */\r
norm (b);                                               /* normalize */\r
return;\r
}\r
\r
/* Support routines */\r
\r
void unpackf (int32 hi, UFP *r)\r
{\r
r->sign = hi & FPSIGN;                                  /* get sign */\r
r->exp = FD_GETEXP (hi);                                /* get exponent */\r
if (r->exp == 0) {                                      /* exp = 0? */\r
    if (r->sign) RSVD_OPND_FAULT;                       /* if -, rsvd op */\r
    r->frac = 0;                                        /* else 0 */\r
    return;\r
    }\r
hi = (((hi & FD_FRACW) | FD_HB) << 16) | ((hi >> 16) & 0xFFFF);\r
r->frac = ((t_uint64) hi) << (32 + UF_V_FDLO);\r
return;\r
}\r
\r
void unpackd (int32 hi, int32 lo, UFP *r)\r
{\r
r->sign = hi & FPSIGN;                                  /* get sign */\r
r->exp = FD_GETEXP (hi);                                /* get exponent */\r
if (r->exp == 0) {                                      /* exp = 0? */\r
    if (r->sign) RSVD_OPND_FAULT;                       /* if -, rsvd op */\r
    r->frac = 0;                                        /* else 0 */\r
    return;\r
    }\r
hi = (hi & FD_FRACL) | FD_HB;                           /* canonical form */\r
r->frac = UNSCRAM (hi, lo) << UF_V_FDLO;                /* guard bits */\r
return;\r
}\r
\r
void unpackg (int32 hi, int32 lo, UFP *r)\r
{\r
r->sign = hi & FPSIGN;                                  /* get sign */\r
r->exp = G_GETEXP (hi);                                 /* get exponent */\r
if (r->exp == 0) {                                      /* exp = 0? */\r
    if (r->sign) RSVD_OPND_FAULT;                       /* if -, rsvd op */\r
    r->frac = 0;                                        /* else 0 */\r
    return;\r
    }\r
hi = (hi & G_FRACL) | G_HB;                             /* canonical form */\r
r->frac = UNSCRAM (hi, lo) << UF_V_GLO;                 /* guard bits */\r
return;\r
}\r
\r
void norm (UFP *r)\r
{\r
int32 i;\r
static t_uint64 normmask[5] = {\r
 0xc000000000000000, 0xf000000000000000, 0xff00000000000000,\r
 0xffff000000000000, 0xffffffff00000000\r
 };\r
static int32 normtab[6] = { 1, 2, 4, 8, 16, 32};\r
\r
if (r->frac == 0) {                                     /* if fraction = 0 */\r
    r->sign = r->exp = 0;                               /* result is 0 */\r
    return;\r
    }\r
while ((r->frac & UF_NM) == 0) {                        /* normalized? */\r
    for (i = 0; i < 5; i++) {                           /* find first 1 */\r
        if (r->frac & normmask[i]) break;\r
        }\r
    r->frac = r->frac << normtab[i];                    /* shift frac */\r
    r->exp = r->exp - normtab[i];                       /* decr exp */\r
    }\r
return;\r
}\r
\r
int32 rpackfd (UFP *r, int32 *rh)\r
{\r
if (rh) *rh = 0;                                        /* assume 0 */\r
if (r->frac == 0) return 0;                             /* result 0? */\r
r->frac = r->frac + (rh? UF_DRND: UF_FRND);             /* round */\r
if ((r->frac & UF_NM) == 0) {                           /* carry out? */\r
    r->frac = r->frac >> 1;                             /* renormalize */\r
    r->exp = r->exp + 1;\r
    }\r
if (r->exp > (int32) FD_M_EXP) FLT_OVFL_FAULT;          /* ovflo? fault */\r
if (r->exp <= 0) {                                      /* underflow? */\r
    if (PSL & PSW_FU) FLT_UNFL_FAULT;                   /* fault if fu */\r
    return 0;                                           /* else 0 */\r
    }\r
if (rh) *rh = UF_GETFDLO (r->frac);                     /* get low */\r
return r->sign | (r->exp << FD_V_EXP) | UF_GETFDHI (r->frac);\r
}\r
\r
int32 rpackg (UFP *r, int32 *rh)\r
{\r
*rh = 0;                                                /* assume 0 */\r
if (r->frac == 0) return 0;                             /* result 0? */\r
r->frac = r->frac + UF_GRND;                            /* round */\r
if ((r->frac & UF_NM) == 0) {                           /* carry out? */\r
    r->frac = r->frac >> 1;                             /* renormalize */\r
    r->exp = r->exp + 1;\r
    }\r
if (r->exp > (int32) G_M_EXP) FLT_OVFL_FAULT;           /* ovflo? fault */\r
if (r->exp <= 0) {                                      /* underflow? */\r
    if (PSL & PSW_FU) FLT_UNFL_FAULT;                   /* fault if fu */\r
    return 0;                                           /* else 0 */\r
    }\r
if (rh) *rh = UF_GETGLO (r->frac);                      /* get low */\r
return r->sign | (r->exp << G_V_EXP) | UF_GETGHI (r->frac);\r
}\r
\r
#else                                                   /* 32b code */\r
\r
#define WORDSWAP(x)     ((((x) & WMASK) << 16) | (((x) >> 16) & WMASK))\r
\r
typedef struct {\r
    uint32              lo;\r
    uint32              hi;\r
    } UDP;\r
\r
typedef struct {\r
    int32               sign;\r
    int32               exp;\r
    UDP                 frac;\r
    } UFP;\r
\r
#define UF_NM_H         0x80000000                      /* normalized */\r
#define UF_FRND_H       0x00000080                      /* F round */\r
#define UF_FRND_L       0x00000000\r
#define UF_DRND_H       0x00000000                      /* D round */\r
#define UF_DRND_L       0x00000080\r
#define UF_GRND_H       0x00000000                      /* G round */\r
#define UF_GRND_L       0x00000400\r
#define UF_V_NM         63\r
\r
void unpackf (uint32 hi, UFP *a);\r
void unpackd (uint32 hi, uint32 lo, UFP *a);\r
void unpackg (uint32 hi, uint32 lo, UFP *a);\r
void norm (UFP *a);\r
int32 rpackfd (UFP *a, int32 *rh);\r
int32 rpackg (UFP *a, int32 *rh);\r
void vax_fadd (UFP *a, UFP *b);\r
void vax_fmul (UFP *a, UFP *b, t_bool qd, int32 bias, uint32 mhi, uint32 mlo);\r
void vax_fmod (UFP *a, int32 bias, int32 *intgr, int32 *flg);\r
void vax_fdiv (UFP *b, UFP *a, int32 prec, int32 bias);\r
void dp_add (UDP *a, UDP *b);\r
void dp_inc (UDP *a);\r
void dp_sub (UDP *a, UDP *b);\r
void dp_imul (uint32 a, uint32 b, UDP *r);\r
void dp_lsh (UDP *a, uint32 sc);\r
void dp_rsh (UDP *a, uint32 sc);\r
void dp_rsh_s (UDP *a, uint32 sc, uint32 neg);\r
void dp_neg (UDP *a);\r
int32 dp_cmp (UDP *a, UDP *b);\r
\r
/* Quadword arithmetic shift\r
\r
        opnd[0]         =       shift count (cnt.rb)\r
        opnd[1:2]       =       source (src.rq)\r
        opnd[3:4]       =       destination (dst.wq)\r
*/\r
\r
int32 op_ashq (int32 *opnd, int32 *rh, int32 *flg)\r
{\r
UDP r, sr;\r
uint32 sc = opnd[0];\r
\r
r.lo = opnd[1];                                         /* get source */\r
r.hi = opnd[2];\r
*flg = 0;                                               /* assume no ovflo */\r
if (sc & BSIGN)                                         /* right shift? */\r
    dp_rsh_s (&r, 0x100 - sc, r.hi & LSIGN);            /* signed right */\r
else {\r
    dp_lsh (&r, sc);                                    /* left shift */\r
    sr = r;                                             /* copy result */\r
    dp_rsh_s (&sr, sc, sr.hi & LSIGN);                  /* signed right */\r
    if ((sr.hi != ((uint32) opnd[2])) ||                /* reshift != orig? */\r
        (sr.lo != ((uint32) opnd[1]))) *flg = 1;        /* overflow */\r
    }\r
*rh = r.hi;                                             /* hi result */\r
return r.lo;                                            /* lo result */\r
}\r
\r
/* Extended multiply subroutine */\r
\r
int32 op_emul (int32 mpy, int32 mpc, int32 *rh)\r
{\r
UDP r;\r
int32 sign = mpy ^ mpc;                                 /* sign of result */\r
\r
if (mpy & LSIGN) mpy = -mpy;                            /* abs value */\r
if (mpc & LSIGN) mpc = -mpc;\r
dp_imul (mpy & LMASK, mpc & LMASK, &r);                 /* 32b * 32b -> 64b */\r
if (sign & LSIGN) dp_neg (&r);                          /* negative result? */\r
*rh = r.hi;\r
return r.lo;\r
}\r
\r
/* Extended divide\r
\r
        opnd[0]         =       divisor (non-zero)\r
        opnd[1:2]       =       dividend\r
*/\r
\r
int32 op_ediv (int32 *opnd, int32 *rh, int32 *flg)\r
{\r
UDP dvd;\r
uint32 i, dvr, quo;\r
\r
dvr = opnd[0];                                          /* get divisor */\r
dvd.lo = opnd[1];                                       /* get dividend */\r
dvd.hi = opnd[2];\r
*flg = CC_V;                                            /* assume error */\r
*rh = 0;\r
if (dvd.hi & LSIGN) dp_neg (&dvd);                      /* |dividend| */\r
if (dvr & LSIGN) dvr = NEG (dvr);                       /* |divisor| */\r
if (dvd.hi >= dvr) return opnd[1];                      /* divide work? */\r
for (i = quo = 0; i < 32; i++) {                        /* 32 iterations */\r
    quo = quo << 1;                                     /* shift quotient */\r
    dp_lsh (&dvd, 1);                                   /* shift dividend */\r
    if (dvd.hi >= dvr) {                                /* step work? */\r
        dvd.hi = (dvd.hi - dvr) & LMASK;                /* subtract dvr */\r
        quo = quo + 1;\r
        }\r
    }\r
if ((opnd[0] ^ opnd[2]) & LSIGN) {                      /* result -? */\r
    quo = NEG (quo);                                    /* negate */\r
    if (quo && ((quo & LSIGN) == 0)) return opnd[1];    /* right sign? */\r
    }\r
else if (quo & LSIGN) return opnd[1];\r
if (opnd[2] & LSIGN) *rh = NEG (dvd.hi);                /* sign of rem */\r
else *rh = dvd.hi;\r
*flg = 0;                                               /* no overflow */\r
return quo;                                             /* return quo */\r
}\r
\r
/* Compare floating */\r
\r
int32 op_cmpfd (int32 h1, int32 l1, int32 h2, int32 l2)\r
{\r
UFP a, b;\r
int32 r;\r
\r
unpackd (h1, l1, &a);\r
unpackd (h2, l2, &b);\r
if (a.sign != b.sign) return (a.sign? CC_N: 0);\r
r = a.exp - b.exp;\r
if (r == 0) r = dp_cmp (&a.frac, &b.frac);\r
if (r < 0) return (a.sign? 0: CC_N);\r
if (r > 0) return (a.sign? CC_N: 0);\r
return CC_Z;\r
}\r
\r
int32 op_cmpg (int32 h1, int32 l1, int32 h2, int32 l2)\r
{\r
UFP a, b;\r
int32 r;\r
\r
unpackg (h1, l1, &a);\r
unpackg (h2, l2, &b);\r
if (a.sign != b.sign) return (a.sign? CC_N: 0);\r
r = a.exp - b.exp;\r
if (r == 0) r = dp_cmp (&a.frac, &b.frac);\r
if (r < 0) return (a.sign? 0: CC_N);\r
if (r > 0) return (a.sign? CC_N: 0);\r
return CC_Z;\r
}\r
\r
/* Integer to floating convert */\r
\r
int32 op_cvtifdg (int32 val, int32 *rh, int32 opc)\r
{\r
UFP a;\r
\r
if (val == 0) {                                         /* zero? */\r
    if (rh) *rh = 0;                                    /* return true 0 */\r
    return 0;\r
    }\r
if (val < 0) {                                          /* negative? */\r
    a.sign = FPSIGN;                                    /* sign = - */\r
    val = -val;\r
    }\r
else a.sign = 0;                                        /* else sign = + */\r
a.exp = 32 + ((opc & 0x100)? G_BIAS: FD_BIAS);          /* initial exp */\r
a.frac.hi = val & LMASK;                                /* fraction */\r
a.frac.lo = 0;\r
norm (&a);                                              /* normalize */\r
if (opc & 0x100) return rpackg (&a, rh);                /* pack and return */\r
return rpackfd (&a, rh);\r
}\r
\r
/* Floating to integer convert */\r
\r
int32 op_cvtfdgi (int32 *opnd, int32 *flg, int32 opc)\r
{\r
UFP a;\r
int32 lnt = opc & 03;\r
int32 ubexp;\r
static uint32 maxv[4] = { 0x7F, 0x7FFF, 0x7FFFFFFF, 0x7FFFFFFF };\r
\r
*flg = 0;\r
if (opc & 0x100) {                                      /* G? */\r
    unpackg (opnd[0], opnd[1], &a);                     /* unpack */\r
    ubexp = a.exp - G_BIAS;                             /* unbiased exp */\r
    }\r
else {\r
    if (opc & 0x20) unpackd (opnd[0], opnd[1], &a);     /* F or D */\r
    else unpackf (opnd[0], &a);                         /* unpack */\r
    ubexp = a.exp - FD_BIAS;                            /* unbiased exp */\r
    }\r
if ((a.exp == 0) || (ubexp < 0)) return 0;              /* true zero or frac? */\r
if (ubexp <= UF_V_NM) {                                 /* exp in range? */\r
    dp_rsh (&a.frac, UF_V_NM - ubexp);                  /* leave rnd bit */\r
    if (lnt == 03) dp_inc (&a.frac);                    /* if CVTR, round */\r
    dp_rsh (&a.frac, 1);                                /* now justified */\r
    if ((a.frac.hi != 0) ||\r
        (a.frac.lo > (maxv[lnt] + (a.sign? 1: 0)))) *flg = CC_V;\r
    }\r
else {\r
    *flg = CC_V;                                        /* always ovflo */\r
    if (ubexp > (UF_V_NM + 32)) return 0;               /* in ext range? */\r
    dp_lsh (&a.frac, ubexp - UF_V_NM - 1);              /* no rnd bit */\r
    }\r
return (a.sign? NEG (a.frac.lo): a.frac.lo);            /* return lo frac */\r
}\r
\r
/* Extended modularize\r
\r
   One of three floating point instructions dropped from the architecture,\r
   EMOD presents two sets of complications.  First, it requires an extended\r
   fraction multiply, with precise (and unusual) truncation conditions.\r
   Second, it has two write operands, a dubious distinction it shares\r
   with EDIV.\r
*/\r
\r
int32 op_emodf (int32 *opnd, int32 *intgr, int32 *flg)\r
{\r
UFP a, b;\r
\r
unpackf (opnd[0], &a);                                  /* unpack operands */\r
unpackf (opnd[2], &b);\r
a.frac.hi = a.frac.hi | opnd[1];                        /* extend src1 */\r
vax_fmul (&a, &b, 0, FD_BIAS, 0, LMASK);                /* multiply */\r
vax_fmod (&a, FD_BIAS, intgr, flg);                     /* sep int & frac */\r
return rpackfd (&a, NULL);                              /* return frac */\r
}\r
\r
int32 op_emodd (int32 *opnd, int32 *flo, int32 *intgr, int32 *flg)\r
{\r
UFP a, b;\r
\r
unpackd (opnd[0], opnd[1], &a);                         /* unpack operands */\r
unpackd (opnd[3], opnd[4], &b);\r
a.frac.lo = a.frac.lo | opnd[2];                        /* extend src1 */\r
vax_fmul (&a, &b, 1, FD_BIAS, 0, 0);                    /* multiply */\r
vax_fmod (&a, FD_BIAS, intgr, flg);                     /* sep int & frac */\r
return rpackfd (&a, flo);                               /* return frac */\r
}\r
\r
int32 op_emodg (int32 *opnd, int32 *flo, int32 *intgr, int32 *flg)\r
{\r
UFP a, b;\r
\r
unpackg (opnd[0], opnd[1], &a);                         /* unpack operands */\r
unpackg (opnd[3], opnd[4], &b);\r
a.frac.lo = a.frac.lo | (opnd[2] >> 5);                 /* extend src1 */\r
vax_fmul (&a, &b, 1, G_BIAS, 0, 0);                     /* multiply */\r
vax_fmod (&a, G_BIAS, intgr, flg);                      /* sep int & frac */\r
return rpackg (&a, flo);                                /* return frac */\r
}\r
\r
/* Unpacked floating point routines */\r
\r
/* Floating add */\r
\r
void vax_fadd (UFP *a, UFP *b)\r
{\r
int32 ediff;\r
UFP t;\r
\r
if ((a->frac.hi == 0) && (a->frac.lo == 0)) {           /* s1 = 0? */\r
    *a = *b;\r
    return;\r
    }\r
if ((b->frac.hi == 0) && (b->frac.lo == 0)) return;     /* s2 = 0? */\r
if ((a->exp < b->exp) ||                                /* |s1| < |s2|? swap */\r
    ((a->exp == b->exp) && (dp_cmp (&a->frac, &b->frac) < 0))) {\r
    t = *a;\r
    *a = *b;\r
    *b = t;\r
    }\r
ediff = a->exp - b->exp;                                /* exp diff */\r
if (a->sign ^ b->sign) {                                /* eff sub? */\r
    if (ediff) {                                        /* exp diff? */\r
        dp_neg (&b->frac);                              /* negate fraction */\r
        dp_rsh_s (&b->frac, ediff, 1);                  /* signed right */\r
        dp_add (&a->frac, &b->frac);                    /* "add" frac */\r
        }\r
    else dp_sub (&a->frac, &b->frac);                   /* a >= b */\r
    norm (a);                                           /* normalize */\r
    }\r
else {\r
    if (ediff) dp_rsh (&b->frac, ediff);                /* add, denormalize */\r
    dp_add (&a->frac, &b->frac);                        /* add frac */\r
    if (dp_cmp (&a->frac, &b->frac) < 0) {              /* chk for carry */\r
        dp_rsh (&a->frac, 1);                           /* renormalize */\r
        a->frac.hi = a->frac.hi | UF_NM_H;              /* add norm bit */\r
        a->exp = a->exp + 1;                            /* skip norm */\r
        }\r
    }\r
return;\r
}\r
\r
/* Floating multiply - 64b * 64b with cross products */\r
\r
void vax_fmul (UFP *a, UFP *b, t_bool qd, int32 bias, uint32 mhi, uint32 mlo)\r
{\r
UDP rhi, rlo, rmid1, rmid2;\r
\r
if ((a->exp == 0) || (b->exp == 0)) {                   /* zero argument? */\r
    a->frac.hi = a->frac.lo = 0;                        /* result is zero */\r
    a->sign = a->exp = 0;\r
    return;\r
    }\r
a->sign = a->sign ^ b->sign;                            /* sign of result */\r
a->exp = a->exp + b->exp - bias;                        /* add exponents */\r
dp_imul (a->frac.hi, b->frac.hi, &rhi);                 /* high result */\r
if (qd) {                                               /* 64b needed? */\r
    dp_imul (a->frac.hi, b->frac.lo, &rmid1);           /* cross products */\r
    dp_imul (a->frac.lo, b->frac.hi, &rmid2);\r
    dp_imul (a->frac.lo, b->frac.lo, &rlo);             /* low result */\r
    rhi.lo = (rhi.lo + rmid1.hi) & LMASK;               /* add hi cross */\r
    if (rhi.lo < rmid1.hi)                              /* to low high res */\r
        rhi.hi = (rhi.hi + 1) & LMASK;\r
    rhi.lo = (rhi.lo + rmid2.hi) & LMASK;\r
    if (rhi.lo < rmid2.hi)\r
         rhi.hi = (rhi.hi + 1) & LMASK;\r
    rlo.hi = (rlo.hi + rmid1.lo) & LMASK;               /* add mid1 to low res */\r
    if (rlo.hi < rmid1.lo) dp_inc (&rhi);               /* carry? incr high res */\r
    rlo.hi = (rlo.hi + rmid2.lo) & LMASK;               /* add mid2 to low res */\r
    if (rlo.hi < rmid2.lo) dp_inc (&rhi);               /* carry? incr high res */\r
    }\r
a->frac.hi = rhi.hi & ~mhi;                             /* mask fraction */\r
a->frac.lo = rhi.lo & ~mlo;\r
norm (a);                                               /* normalize */\r
return;\r
}\r
\r
/* Floating modulus - there are three cases\r
\r
   exp <= bias                  - integer is 0, fraction is input,\r
                                  no overflow\r
   bias < exp <= bias+64        - separate integer and fraction,\r
                                  integer overflow may occur\r
   bias+64 < exp                - result is integer, fraction is 0\r
                                  integer overflow\r
*/\r
\r
void vax_fmod (UFP *a, int32 bias, int32 *intgr, int32 *flg)\r
{\r
UDP ifr;\r
\r
if (a->exp <= bias) *intgr = *flg = 0;                  /* 0 or <1? int = 0 */\r
else if (a->exp <= (bias + 64)) {                       /* in range [1,64]? */\r
    ifr = a->frac;\r
    dp_rsh (&ifr, 64 - (a->exp - bias));                /* separate integer */\r
    if ((a->exp > (bias + 32)) ||                       /* test ovflo */\r
        ((a->exp == (bias + 32)) &&\r
         (ifr.lo > (a->sign? 0x80000000: 0x7FFFFFFF))))\r
        *flg = CC_V;\r
    else *flg = 0;\r
    *intgr = ifr.lo;\r
    if (a->sign) *intgr = -*intgr;                      /* -? comp int */\r
    dp_lsh (&a->frac, a->exp - bias);                   /* excise integer */\r
    a->exp = bias;\r
    }\r
else {\r
    *intgr = 0;                                         /* out of range */\r
    a->frac.hi = a->frac.lo = a->sign = a->exp = 0;     /* result 0 */\r
    *flg = CC_V;                                        /* overflow */\r
    }\r
norm (a);                                               /* normalize */\r
return;\r
}\r
\r
/* Floating divide\r
   Needs to develop at least one rounding bit.  Since the first\r
   divide step can fail, caller should specify 2 more bits than\r
   the precision of the fraction.\r
*/\r
\r
void vax_fdiv (UFP *a, UFP *b, int32 prec, int32 bias)\r
{\r
int32 i;\r
UDP quo = { 0, 0 };\r
\r
if (a->exp == 0) FLT_DZRO_FAULT;                        /* divr = 0? */\r
if (b->exp == 0) return;                                /* divd = 0? */\r
b->sign = b->sign ^ a->sign;                            /* result sign */\r
b->exp = b->exp - a->exp + bias + 1;                    /* unbiased exp */\r
dp_rsh (&a->frac, 1);                                   /* allow 1 bit left */\r
dp_rsh (&b->frac, 1);\r
for (i = 0; i < prec; i++) {                            /* divide loop */\r
    dp_lsh (&quo, 1);                                   /* shift quo */\r
    if (dp_cmp (&b->frac, &a->frac) >= 0) {             /* div step ok? */\r
        dp_sub (&b->frac, &a->frac);                    /* subtract */\r
        quo.lo = quo.lo + 1;                            /* quo bit = 1 */\r
        }\r
    dp_lsh (&b->frac, 1);                               /* shift divd */\r
    }\r
dp_lsh (&quo, UF_V_NM - prec + 1);                      /* put in position */\r
b->frac = quo;\r
norm (b);                                               /* normalize */\r
return;\r
}\r
\r
/* Double precision integer routines */\r
\r
int32 dp_cmp (UDP *a, UDP *b)\r
{\r
if (a->hi < b->hi) return -1;                           /* compare hi */\r
if (a->hi > b->hi) return +1;\r
if (a->lo < b->lo) return -1;                           /* hi =, compare lo */\r
if (a->lo > b->lo) return +1;\r
return 0;                                               /* hi, lo equal */\r
}\r
\r
void dp_add (UDP *a, UDP *b)\r
{\r
a->lo = (a->lo + b->lo) & LMASK;                        /* add lo */\r
if (a->lo < b->lo) a->hi = a->hi + 1;                   /* carry? */\r
a->hi = (a->hi + b->hi) & LMASK;                        /* add hi */\r
return;\r
}\r
\r
void dp_inc (UDP *a)\r
{\r
a->lo = (a->lo + 1) & LMASK;                            /* inc lo */\r
if (a->lo == 0) a->hi = (a->hi + 1) & LMASK;            /* carry? inc hi */\r
return;\r
}\r
\r
void dp_sub (UDP *a, UDP *b)\r
{\r
if (a->lo < b->lo) a->hi = a->hi - 1;                   /* borrow? decr hi */\r
a->lo = (a->lo - b->lo) & LMASK;                        /* sub lo */\r
a->hi = (a->hi - b->hi) & LMASK;                        /* sub hi */\r
return;\r
}\r
\r
void dp_lsh (UDP *r, uint32 sc)\r
{\r
if (sc > 63) r->hi = r->lo = 0;                         /* > 63? result 0 */\r
else if (sc > 31) {                                     /* [32,63]? */\r
    r->hi = (r->lo << (sc - 32)) & LMASK;\r
    r->lo = 0;\r
    }\r
else if (sc != 0) {\r
    r->hi = ((r->hi << sc) | (r->lo >> (32 - sc))) & LMASK;\r
    r->lo = (r->lo << sc) & LMASK;\r
    }\r
return;\r
}\r
\r
void dp_rsh (UDP *r, uint32 sc)\r
{\r
if (sc > 63) r->hi = r->lo = 0;                         /* > 63? result 0 */\r
else if (sc > 31) {                                     /* [32,63]? */\r
    r->lo = (r->hi >> (sc - 32)) & LMASK;\r
    r->hi = 0;\r
    }\r
else if (sc != 0) {\r
    r->lo = ((r->lo >> sc) | (r->hi << (32 - sc))) & LMASK;\r
    r->hi = (r->hi >> sc) & LMASK;\r
    }\r
return;\r
}\r
\r
void dp_rsh_s (UDP *r, uint32 sc, uint32 neg)\r
{\r
dp_rsh (r, sc);                                         /* do unsigned right */\r
if (neg && sc) {                                        /* negative? */\r
    if (sc > 63) r->hi = r->lo = LMASK;                 /* > 63? result -1 */\r
    else {\r
        UDP ones = { LMASK, LMASK };\r
        dp_lsh (&ones, 64 - sc);                        /* shift ones */\r
        r->hi = r->hi | ones.hi;                        /* or into result */\r
        r->lo = r->lo | ones.lo;\r
        }\r
    }\r
return;\r
}\r
\r
void dp_imul (uint32 a, uint32 b, UDP *r)\r
{\r
uint32 ah, bh, al, bl, rhi, rlo, rmid1, rmid2;\r
\r
if ((a == 0) || (b == 0)) {                             /* zero argument? */\r
    r->hi = r->lo = 0;                                  /* result is zero */\r
    return;\r
    }\r
ah = (a >> 16) & WMASK;                                 /* split operands */\r
bh = (b >> 16) & WMASK;                                 /* into 16b chunks */\r
al = a & WMASK;\r
bl = b & WMASK;\r
rhi = ah * bh;                                          /* high result */\r
rmid1 = ah * bl;\r
rmid2 = al * bh;\r
rlo = al * bl;\r
rhi = rhi + ((rmid1 >> 16) & WMASK) + ((rmid2 >> 16) & WMASK);\r
rmid1 = (rlo + (rmid1 << 16)) & LMASK;                  /* add mid1 to lo */\r
if (rmid1 < rlo) rhi = rhi + 1;                         /* carry? incr hi */\r
rmid2 = (rmid1 + (rmid2 << 16)) & LMASK;                /* add mid2 to to */\r
if (rmid2 < rmid1) rhi = rhi + 1;                       /* carry? incr hi */\r
r->hi = rhi & LMASK;                                    /* mask result */\r
r->lo = rmid2;\r
return;\r
}\r
\r
void dp_neg (UDP *r)\r
{\r
r->lo = NEG (r->lo);\r
r->hi = (~r->hi + (r->lo == 0)) & LMASK;\r
return;\r
}\r
\r
/* Support routines */\r
\r
void unpackf (uint32 hi, UFP *r)\r
{\r
r->sign = hi & FPSIGN;                                  /* get sign */\r
r->exp = FD_GETEXP (hi);                                /* get exponent */\r
if (r->exp == 0) {                                      /* exp = 0? */\r
    if (r->sign) RSVD_OPND_FAULT;                       /* if -, rsvd op */\r
    r->frac.hi = r->frac.lo = 0;                        /* else 0 */\r
    return;\r
    }\r
r->frac.hi = WORDSWAP ((hi & ~(FPSIGN | FD_EXP)) | FD_HB);\r
r->frac.lo = 0;\r
dp_lsh (&r->frac, FD_GUARD);\r
return;\r
}\r
\r
void unpackd (uint32 hi, uint32 lo, UFP *r)\r
{\r
r->sign = hi & FPSIGN;                                  /* get sign */\r
r->exp = FD_GETEXP (hi);                                /* get exponent */\r
if (r->exp == 0) {                                      /* exp = 0? */\r
    if (r->sign) RSVD_OPND_FAULT;                       /* if -, rsvd op */\r
    r->frac.hi = r->frac.lo = 0;                        /* else 0 */\r
    return;\r
      }\r
r->frac.hi = WORDSWAP ((hi & ~(FPSIGN | FD_EXP)) | FD_HB);\r
r->frac.lo = WORDSWAP (lo);\r
dp_lsh (&r->frac, FD_GUARD);\r
return;\r
}\r
\r
void unpackg (uint32 hi, uint32 lo, UFP *r)\r
{\r
r->sign = hi & FPSIGN;                                  /* get sign */\r
r->exp = G_GETEXP (hi);                                 /* get exponent */\r
if (r->exp == 0) {                                      /* exp = 0? */\r
    if (r->sign) RSVD_OPND_FAULT;                       /* if -, rsvd op */\r
    r->frac.hi = r->frac.lo = 0;                        /* else 0 */\r
    return;\r
    }\r
r->frac.hi = WORDSWAP ((hi & ~(FPSIGN | G_EXP)) | G_HB);\r
r->frac.lo = WORDSWAP (lo);\r
dp_lsh (&r->frac, G_GUARD);\r
return;\r
}\r
\r
void norm (UFP *r)\r
{\r
int32 i;\r
static uint32 normmask[5] = {\r
 0xc0000000, 0xf0000000, 0xff000000, 0xffff0000, 0xffffffff\r
 };\r
static int32 normtab[6] = { 1, 2, 4, 8, 16, 32};\r
\r
if ((r->frac.hi == 0) && (r->frac.lo == 0)) {           /* if fraction = 0 */\r
    r->sign = r->exp = 0;                               /* result is 0 */\r
    return;\r
    }\r
while ((r->frac.hi & UF_NM_H) == 0) {                   /* normalized? */\r
    for (i = 0; i < 5; i++) {                           /* find first 1 */\r
        if (r->frac.hi & normmask[i]) break;\r
        }\r
    dp_lsh (&r->frac, normtab[i]);                      /* shift frac */\r
    r->exp = r->exp - normtab[i];                       /* decr exp */\r
    }\r
return;\r
}\r
\r
int32 rpackfd (UFP *r, int32 *rh)\r
{\r
static UDP f_round = { UF_FRND_L, UF_FRND_H };\r
static UDP d_round = { UF_DRND_L, UF_DRND_H };\r
\r
if (rh) *rh = 0;                                        /* assume 0 */\r
if ((r->frac.hi == 0) && (r->frac.lo == 0)) return 0;   /* result 0? */\r
if (rh) dp_add (&r->frac, &d_round);                    /* round */\r
else dp_add (&r->frac, &f_round);\r
if ((r->frac.hi & UF_NM_H) == 0) {                      /* carry out? */\r
    dp_rsh (&r->frac, 1);                               /* renormalize */\r
    r->exp = r->exp + 1;\r
    }\r
if (r->exp > (int32) FD_M_EXP) FLT_OVFL_FAULT;          /* ovflo? fault */\r
if (r->exp <= 0) {                                      /* underflow? */\r
    if (PSL & PSW_FU) FLT_UNFL_FAULT;                   /* fault if fu */\r
    return 0;                                           /* else 0 */\r
    }\r
dp_rsh (&r->frac, FD_GUARD);                            /* remove guard */\r
if (rh) *rh = WORDSWAP (r->frac.lo);                    /* get low */\r
return r->sign | (r->exp << FD_V_EXP) |\r
    (WORDSWAP (r->frac.hi) & ~(FD_HB | FPSIGN | FD_EXP));\r
}\r
\r
int32 rpackg (UFP *r, int32 *rh)\r
{\r
static UDP g_round = { UF_GRND_L, UF_GRND_H };\r
\r
*rh = 0;                                                /* assume 0 */\r
if ((r->frac.hi == 0) && (r->frac.lo == 0)) return 0;   /* result 0? */\r
dp_add (&r->frac, &g_round);                            /* round */\r
if ((r->frac.hi & UF_NM_H) == 0) {                      /* carry out? */\r
    dp_rsh (&r->frac, 1);                               /* renormalize */\r
    r->exp = r->exp + 1;\r
    }\r
if (r->exp > (int32) G_M_EXP) FLT_OVFL_FAULT;           /* ovflo? fault */\r
if (r->exp <= 0) {                                      /* underflow? */\r
    if (PSL & PSW_FU) FLT_UNFL_FAULT;                   /* fault if fu */\r
    return 0;                                           /* else 0 */\r
    }\r
dp_rsh (&r->frac, G_GUARD);                             /* remove guard */\r
*rh = WORDSWAP (r->frac.lo);                            /* get low */\r
return r->sign | (r->exp << G_V_EXP) |\r
    (WORDSWAP (r->frac.hi) & ~(G_HB | FPSIGN | G_EXP));\r
}\r
\r
#endif\r
\r
/* Floating point instructions */\r
\r
/* Move/test/move negated floating\r
\r
   Note that only the high 32b is processed.\r
   If the high 32b is not zero, it is unchanged.\r
*/\r
\r
int32 op_movfd (int32 val)\r
{\r
if (val & FD_EXP) return val;\r
if (val & FPSIGN) RSVD_OPND_FAULT;\r
return 0;\r
}\r
\r
int32 op_mnegfd (int32 val)\r
{\r
if (val & FD_EXP) return (val ^ FPSIGN);\r
if (val & FPSIGN) RSVD_OPND_FAULT;\r
return 0;\r
}\r
\r
int32 op_movg (int32 val)\r
{\r
if (val & G_EXP) return val;\r
if (val & FPSIGN) RSVD_OPND_FAULT;\r
return 0;\r
}\r
\r
int32 op_mnegg (int32 val)\r
{\r
if (val & G_EXP) return (val ^ FPSIGN);\r
if (val & FPSIGN) RSVD_OPND_FAULT;\r
return 0;\r
}\r
\r
/* Floating to floating convert - F to D is essentially done with MOVFD */\r
\r
int32 op_cvtdf (int32 *opnd)\r
{\r
UFP a;\r
\r
unpackd (opnd[0], opnd[1], &a);\r
return rpackfd (&a, NULL);\r
}\r
\r
int32 op_cvtfg (int32 *opnd, int32 *rh)\r
{\r
UFP a;\r
\r
unpackf (opnd[0], &a);\r
a.exp = a.exp - FD_BIAS + G_BIAS;\r
return rpackg (&a, rh);\r
}\r
\r
int32 op_cvtgf (int32 *opnd)\r
{\r
UFP a;\r
\r
unpackg (opnd[0], opnd[1], &a);\r
a.exp = a.exp - G_BIAS + FD_BIAS;\r
return rpackfd (&a, NULL);\r
}\r
\r
/* Floating add and subtract */\r
\r
int32 op_addf (int32 *opnd, t_bool sub)\r
{\r
UFP a, b;\r
\r
unpackf (opnd[0], &a);                                  /* F format */\r
unpackf (opnd[1], &b);\r
if (sub) a.sign = a.sign ^ FPSIGN;                      /* sub? -s1 */\r
vax_fadd (&a, &b);                                      /* add fractions */\r
return rpackfd (&a, NULL);\r
}\r
\r
int32 op_addd (int32 *opnd, int32 *rh, t_bool sub)\r
{\r
UFP a, b;\r
\r
unpackd (opnd[0], opnd[1], &a);\r
unpackd (opnd[2], opnd[3], &b);\r
if (sub) a.sign = a.sign ^ FPSIGN;                      /* sub? -s1 */\r
vax_fadd (&a, &b);                                      /* add fractions */\r
return rpackfd (&a, rh);\r
}\r
\r
int32 op_addg (int32 *opnd, int32 *rh, t_bool sub)\r
{\r
UFP a, b;\r
\r
unpackg (opnd[0], opnd[1], &a);\r
unpackg (opnd[2], opnd[3], &b);\r
if (sub) a.sign = a.sign ^ FPSIGN;                      /* sub? -s1 */\r
vax_fadd (&a, &b);                                   /* add fractions */\r
return rpackg (&a, rh);                                 /* round and pack */\r
}\r
\r
/* Floating multiply */\r
\r
int32 op_mulf (int32 *opnd)\r
{\r
UFP a, b;\r
    \r
unpackf (opnd[0], &a);                                  /* F format */\r
unpackf (opnd[1], &b);\r
vax_fmul (&a, &b, 0, FD_BIAS, 0, 0);                    /* do multiply */\r
return rpackfd (&a, NULL);                              /* round and pack */\r
}\r
\r
int32 op_muld (int32 *opnd, int32 *rh)\r
{\r
UFP a, b;\r
    \r
unpackd (opnd[0], opnd[1], &a);                         /* D format */\r
unpackd (opnd[2], opnd[3], &b);\r
vax_fmul (&a, &b, 1, FD_BIAS, 0, 0);                    /* do multiply */\r
return rpackfd (&a, rh);                                /* round and pack */\r
}\r
\r
int32 op_mulg (int32 *opnd, int32 *rh)\r
{\r
UFP a, b;\r
\r
unpackg (opnd[0], opnd[1], &a);                         /* G format */\r
unpackg (opnd[2], opnd[3], &b);\r
vax_fmul (&a, &b, 1, G_BIAS, 0, 0);                     /* do multiply */\r
return rpackg (&a, rh);                                 /* round and pack */\r
}\r
\r
/* Floating divide */\r
\r
int32 op_divf (int32 *opnd)\r
{\r
UFP a, b;\r
\r
unpackf (opnd[0], &a);                                  /* F format */\r
unpackf (opnd[1], &b);\r
vax_fdiv (&a, &b, 26, FD_BIAS);                         /* do divide */\r
return rpackfd (&b, NULL);                              /* round and pack */\r
}\r
\r
int32 op_divd (int32 *opnd, int32 *rh)\r
{\r
UFP a, b;\r
\r
unpackd (opnd[0], opnd[1], &a);                         /* D format */\r
unpackd (opnd[2], opnd[3], &b);\r
vax_fdiv (&a, &b, 58, FD_BIAS);                         /* do divide */\r
return rpackfd (&b, rh);                                /* round and pack */\r
}\r
\r
int32 op_divg (int32 *opnd, int32 *rh)\r
{\r
UFP a, b;\r
\r
unpackg (opnd[0], opnd[1], &a);                         /* G format */\r
unpackg (opnd[2], opnd[3], &b);\r
vax_fdiv (&a, &b, 55, G_BIAS);                          /* do divide */\r
return rpackg (&b, rh);                                 /* round and pack */\r
}\r
\r
/* Polynomial evaluation\r
   The most mis-implemented instruction in the VAX (probably here too).\r
   POLY requires a precise combination of masking versus normalizing\r
   to achieve the desired answer.  In particular, the multiply step\r
   is masked prior to normalization.  In addition, negative small\r
   fractions must not be treated as 0 during denorm.\r
*/\r
\r
void op_polyf (int32 *opnd, int32 acc)\r
{\r
UFP r, a, c;\r
int32 deg = opnd[1];\r
int32 ptr = opnd[2];\r
int32 i, wd, res;\r
\r
if (deg > 31) RSVD_OPND_FAULT;                          /* degree > 31? fault */\r
unpackf (opnd[0], &a);                                  /* unpack arg */\r
wd = Read (ptr, L_LONG, RD);                            /* get C0 */\r
ptr = ptr + 4;\r
unpackf (wd, &r);                                       /* unpack C0 */\r
res = rpackfd (&r, NULL);                               /* first result */\r
for (i = 0; i < deg; i++) {                             /* loop */\r
    unpackf (res, &r);                                  /* unpack result */\r
    vax_fmul (&r, &a, 0, FD_BIAS, 1, LMASK);            /* r = r * arg, mask */\r
    wd = Read (ptr, L_LONG, RD);                        /* get Cnext */\r
    ptr = ptr + 4;\r
    unpackf (wd, &c);                                   /* unpack Cnext */\r
    vax_fadd (&r, &c);                                  /* r = r + Cnext */\r
    res = rpackfd (&r, NULL);                           /* round and pack */\r
    }\r
R[0] = res;\r
R[1] = R[2] = 0;\r
R[3] = ptr;\r
return;\r
}\r
\r
void op_polyd (int32 *opnd, int32 acc)\r
{\r
UFP r, a, c;\r
int32 deg = opnd[2];\r
int32 ptr = opnd[3];\r
int32 i, wd, wd1, res, resh;\r
\r
if (deg > 31) RSVD_OPND_FAULT;                          /* degree > 31? fault */\r
unpackd (opnd[0], opnd[1], &a);                         /* unpack arg */\r
wd = Read (ptr, L_LONG, RD);                            /* get C0 */\r
wd1 = Read (ptr + 4, L_LONG, RD);\r
ptr = ptr + 8;\r
unpackd (wd, wd1, &r);                                  /* unpack C0 */\r
res = rpackfd (&r, &resh);                              /* first result */\r
for (i = 0; i < deg; i++) {                             /* loop */\r
    unpackd (res, resh, &r);                            /* unpack result */\r
    vax_fmul (&r, &a, 1, FD_BIAS, 0, 1);                /* r = r * arg, mask */\r
    wd = Read (ptr, L_LONG, RD);                        /* get Cnext */\r
    wd1 = Read (ptr + 4, L_LONG, RD);\r
    ptr = ptr + 8;\r
    unpackd (wd, wd1, &c);                              /* unpack Cnext */\r
    vax_fadd (&r, &c);                                  /* r = r + Cnext */\r
    res = rpackfd (&r, &resh);                          /* round and pack */\r
    }\r
R[0] = res;\r
R[1] = resh;\r
R[2] = 0;\r
R[3] = ptr;\r
R[4] = 0;\r
R[5] = 0;\r
return;\r
}\r
\r
void op_polyg (int32 *opnd, int32 acc)\r
{\r
UFP r, a, c;\r
int32 deg = opnd[2];\r
int32 ptr = opnd[3];\r
int32 i, wd, wd1, res, resh;\r
\r
if (deg > 31) RSVD_OPND_FAULT;                          /* degree > 31? fault */\r
unpackg (opnd[0], opnd[1], &a);                         /* unpack arg */\r
wd = Read (ptr, L_LONG, RD);                            /* get C0 */\r
wd1 = Read (ptr + 4, L_LONG, RD);\r
ptr = ptr + 8;\r
unpackg (wd, wd1, &r);                                  /* unpack C0 */\r
res = rpackg (&r, &resh);                               /* first result */\r
for (i = 0; i < deg; i++) {                             /* loop */\r
    unpackg (res, resh, &r);                            /* unpack result */\r
    vax_fmul (&r, &a, 1, G_BIAS, 0, 1);                 /* r = r * arg */\r
    wd = Read (ptr, L_LONG, RD);                        /* get Cnext */\r
    wd1 = Read (ptr + 4, L_LONG, RD);\r
    ptr = ptr + 8;\r
    unpackg (wd, wd1, &c);                              /* unpack Cnext */\r
    vax_fadd (&r, &c);                                  /* r = r + Cnext */\r
    res = rpackg (&r, &resh);                           /* round and pack */\r
    }\r
R[0] = res;\r
R[1] = resh;\r
R[2] = 0;\r
R[3] = ptr;\r
R[4] = 0;\r
R[5] = 0;\r
return;\r
}\r