source: trunk/lib/carryQ.hpp @ 4050

Last change on this file since 4050 was 3729, checked in by ksherdy, 5 years ago

Added local carry declare to header vs. template.

File size: 8.2 KB
RevLine 
[1544]1#ifndef CARRYQ_HPP_
2#define CARRYQ_HPP_
3
[1950]4/*=============================================================================
[2005]5  carryQ.hpp - Pablo compiler support for carry introduction.
6  Ken Herdy, Robert D. Cameron
[2719]7  Copyright (C) 2012, Robert D. Cameron, Kenneth S. Herdy.
8    Licensed to the public under the Open Software License 3.0.
9    Licensed to International Characters Inc.
10       under the Academic Free License version 3.0.
[2005]11  April 2012
[1950]12=============================================================================*/
13
[2958]14#include <string.h>
[1544]15#include <stdint.h>
16#include <iostream>
17
18#include "bitblock.hpp"
19#include "stdio.h"
20
[1950]21///////////////////////////////////////////////////////////////////////////////
22//
23// Carry method variants.
24//
25// BitBlock_op_ci_co()  - standard block non while loop statement and in final block if ignore the carry out
26// BitBlock_op_co()     - standard block while loop and in final block while loop if ignore carry out
27// BitBlock_op_ci()             - final block non while loop statement
28// BitBlock_op()                - final while loop statement
29//
30// BitBlock_op_ci(), BitBlock_op() methods not implemented to reduce the total number of
31// methods and Pablo compiler complexity.
32//
33///////////////////////////////////////////////////////////////////////////////
[1544]34
[1694]35#define interpose32(x,y,pos) interpose32_<pos>(x,y)     
[1663]36template<uint32_t n>
[1694]37IDISA_ALWAYS_INLINE BitBlock interpose32_(BitBlock s, BitBlock s32) {
[1662]38        return simd_or(simd<32>::slli<n>(s), simd<32>::srli<32-n>(s32));
[1659]39}
40
[2207]41template<uint32_t n>
42IDISA_ALWAYS_INLINE BitBlock interpose64_(BitBlock s, BitBlock s64) {
43        return simd_or(simd<64>::slli<n>(s), simd<64>::srli<64-n>(s64));
44}
45
[2958]46template <uint16_t CarryCount, uint16_t AdvanceNCount> class CarryArray;
[1544]47
[2991]48#define LocalCarryCombine(carrySet, localCarry, carryNo, carryCount)\
49        carrySet.CarryCombine(localCarry.cq, carryNo, carryCount); 
50
[2958]51#define CarryDeclare(name, carry1_count, carryN_count)\
52CarryArray<carry1_count, carryN_count> name;
[1544]53
[3729]54#define LocalCarryDeclare(name, count)\
55CarryArray<count, 0> name;
56
[1544]57// Array of BitBlock implementation.
[2207]58template <uint16_t CarryCount, uint16_t AdvanceNCount>
[2213]59class CarryArray {
[1544]60
61public:
[1933]62
[3519]63#ifndef CARRY64
[3524]64    #define carry_value_0 simd<BLOCK_SIZE>::constant<0>()
65    #define carry_value_1 simd<BLOCK_SIZE>::constant<1>()
[3519]66#endif
67#ifdef CARRY64
[3524]68    #define carry_value_0 0
69    #define carry_value_1 1
[3519]70#endif
71
[3457]72        carry_t cq[CarryCount + AdvanceNCount];
[2221]73        //BitBlock pending64[AdvanceNCount];
[1544]74        CarryArray()
75        {
[3519]76            memset (cq, 0, sizeof(carry_t) * (CarryCount + AdvanceNCount));
[2221]77            //memset(pending64, 0, sizeof(BitBlock) * AdvanceNCount);
[1544]78        }
79        ~CarryArray() {}
80
[3519]81        IDISA_ALWAYS_INLINE BitBlock BitBlock_advance_ci_co(BitBlock strm, carry_t carryin, uint16_t carryno)
[1996]82        {
83                BitBlock rslt;
84                advance_with_carry(strm, carryin, cq[carryno], rslt);
85                return rslt;
86        }
87
[3519]88        IDISA_ALWAYS_INLINE BitBlock BitBlock_add_ci_co(BitBlock strm1, BitBlock strm2, carry_t carryin, const uint16_t carryno)
[1996]89        {
90                BitBlock sum;
91                adc(strm1, strm2, carryin, cq[carryno], sum);
92                return sum;
93        }
94
[3519]95        IDISA_ALWAYS_INLINE BitBlock BitBlock_sub_ci_co(BitBlock strm1, BitBlock strm2, carry_t carryin, uint16_t carryno)
[1996]96        {
97                BitBlock diff;
98                sbb(strm1, strm2, carryin, cq[carryno], diff);
99                return diff;
100        }
101
[3519]102        IDISA_ALWAYS_INLINE BitBlock BitBlock_scantofirst(BitBlock charclass, carry_t carryin, uint16_t carryno)
[1996]103        {
104                BitBlock marker;
[2261]105//              BitBlock c = carry_flip(carryin);
106                adc(simd<BLOCK_SIZE>::constant<0>(), simd_not(charclass), carryin, cq[carryno], marker);
107//              cq[carryno] = carry_flip(cq[carryno]);
[1996]108                return simd_and(marker, charclass);
109        }
110
[3519]111        IDISA_ALWAYS_INLINE BitBlock BitBlock_scanthru_ci_co(BitBlock markers0, BitBlock charclass, carry_t carryin, uint16_t carryno)
[1996]112        {
113                BitBlock markers1;
114                adc(markers0, charclass, carryin, cq[carryno], markers1);
115                return simd_andc(markers1, charclass);
116        }
117
[3519]118        IDISA_ALWAYS_INLINE BitBlock BitBlock_advance_then_scanthru(BitBlock markers0, BitBlock charclass, carry_t carryin, uint16_t carryno)
[2042]119        {
120                BitBlock markers1;
[2207]121                //assert(!bitblock::any(simd_and(markers0, charclass)));
[2042]122                adc(markers0, simd_or(charclass, markers0), carryin, cq[carryno], markers1);
123                return simd_andc(markers1, charclass);
124        }
125
[3519]126        IDISA_ALWAYS_INLINE BitBlock BitBlock_span_upto(BitBlock starts, BitBlock follows, carry_t carryin, uint16_t carryno)
[2042]127        {
128                BitBlock span;
129                sbb(follows, starts, carryin, cq[carryno], span);
130                return span;
131        }
132
[3519]133        IDISA_ALWAYS_INLINE BitBlock BitBlock_inclusive_span(BitBlock starts, BitBlock ends, carry_t carryin, uint16_t carryno)
[2042]134        {
135                BitBlock span;
136                sbb(ends, starts, carryin, cq[carryno], span);
137                return simd_or(span, ends);
138        }
139
[3519]140        IDISA_ALWAYS_INLINE BitBlock BitBlock_exclusive_span(BitBlock starts, BitBlock ends, carry_t carryin, uint16_t carryno)
[2042]141        {
142                BitBlock span;
143                sbb(ends, starts, carryin, cq[carryno], span);
144                return simd_andc(span, starts);
145        }
146
[3519]147/*
[1996]148        IDISA_ALWAYS_INLINE BitBlock BitBlock_advance32_ci_co(BitBlock strm, uint32_t pending_in, uint32_t & pending_out)
149        {
150                pending_out = (uint32_t) mvmd<32>::extract< (sizeof(BitBlock)/sizeof(pending_out))-1 >(strm);
151                return simd_or(simd<BLOCK_SIZE>::slli<32>(strm), mvmd<BLOCK_SIZE>::fill((uint64_t)pending_in));
152        }
[3519]153*/
[1996]154
[3519]155/*
156        template <int n> IDISA_ALWAYS_INLINE BitBlock BitBlock_advance_n_(BitBlock strm, carry_t pending_in, uint16_t pendingno)
[2207]157        {
158                BitBlock half_block_shifted = esimd<BLOCK_SIZE/2>::mergel(strm, pending_in);
[2221]159                cq[CarryCount + pendingno] = bitblock::srli<BLOCK_SIZE/2>(strm);
160                //pending64[pendingno] = bitblock::srli<BLOCK_SIZE/2>(strm);
[2207]161                BitBlock result = simd_or(simd<BLOCK_SIZE/2>::srli<(BLOCK_SIZE/2)-n>(half_block_shifted),
162                               simd<BLOCK_SIZE/2>::slli<n>(strm));
163                return result;
164        }
[3519]165*/
[2207]166
[1544]167        IDISA_ALWAYS_INLINE bool CarryTest(uint16_t carryno, uint16_t carry_count)
168        {
[3519]169                  carry_t c1 = cq[carryno];
[1544]170                  int ubound = carryno + carry_count;
171                  for (int i = carryno + 1; i < ubound ; i++) {
172                        c1 = carry_or(c1, cq[i]);
173                  }
174                  return test_carry(c1);
175        }
176
[3519]177        IDISA_ALWAYS_INLINE carry_t CarryRange(uint16_t carryno, uint16_t carry_count)
[2794]178        {
[3519]179                  carry_t c1 = cq[carryno];
[2794]180                  int ubound = carryno + carry_count;
181                  for (int i = carryno + 1; i < ubound ; i++) {
182                        c1 = carry_or(c1, cq[i]);
183                  }
184                  return c1;
185        }
186
[1544]187        IDISA_ALWAYS_INLINE void CarryDequeueEnqueue(uint16_t carryno, uint16_t carry_count)
188        {
189                return;
190        }
191
[2960]192        // Deprecated (renamed)
[1544]193        IDISA_ALWAYS_INLINE void CarryQ_Adjust(uint16_t carry_count)
194        {
[3320]195                return;
[1544]196        }
197
[2960]198        IDISA_ALWAYS_INLINE void CarryAdjust(uint16_t carry_count)
199        {
200                return;
201        }
202
[3519]203        IDISA_ALWAYS_INLINE void CarryCombine(carry_t local_cq[], uint16_t carryno, uint16_t carry_count)
[1544]204        {
205                  for (int i = 0; i < carry_count; i++) {
206                    cq[carryno+i] = carry_or(cq[carryno+i], local_cq[i]);
207                  }
208        }
209
[2268]210        IDISA_ALWAYS_INLINE void CarryCombine1(uint16_t carryno, uint16_t carry2)
211        {
212                  cq[carryno] = carry_or(cq[carryno], cq[carry2]);
[3524]213                  cq[carry2] = carry_value_0;
[2268]214        }
215
[3519]216        IDISA_ALWAYS_INLINE carry_t get_carry_in(uint16_t carryno) const 
[1996]217        {
[3519]218                return cq[carryno];
[1996]219        }
220
[3320]221        // Deprecated (renamed)
[3519]222        IDISA_ALWAYS_INLINE carry_t GetCarry(uint16_t carryno) const
[2960]223        {
[3519]224                return cq[carryno];
[2960]225        }
226
[3519]227        IDISA_ALWAYS_INLINE void SetCarry(carry_t carryVal, uint16_t carryno)
[2987]228        {
229                cq[carryno] = carryVal;
230        }
231
[3320]232
[3023]233        // Deprecated in PabloJ, retained for legacy compiler.
[3519]234        IDISA_ALWAYS_INLINE carry_t get_pending64(uint16_t advance_n_blkno) const 
[3023]235        {
[3320]236                return cq[CarryCount + advance_n_blkno];
[3023]237        }
238
[3519]239        IDISA_ALWAYS_INLINE carry_t Pending64(uint16_t advance_n_blkno) const 
[2221]240        {
241                return cq[CarryCount + advance_n_blkno];
242        }
243
[3320]244//private:
245        // helpers
[3519]246#ifndef  CARRY64
[2960]247        // Deprecated (renamed)
[3519]248        IDISA_ALWAYS_INLINE carry_t carry_flip(carry_t carry) const
[1544]249        {
[3524]250                return simd_xor(carry, carry_value_1);
[1544]251        }
252
[3519]253        IDISA_ALWAYS_INLINE BitBlock CarryFlip(carry_t carry) const
[2960]254        {
[3524]255                return simd_xor(carry, carry_value_1);
[2960]256        }
257
[3519]258        IDISA_ALWAYS_INLINE bool test_carry(carry_t carry) const
[1544]259        {
[1826]260                return bitblock::any(carry);
[1544]261        }
262
[3519]263        IDISA_ALWAYS_INLINE carry_t carry_or(carry_t carry1, carry_t carry2) const
[1544]264        {
265                return simd_or(carry1, carry2);
266        }
[3519]267#endif
268#ifdef  CARRY64
269        // Deprecated (renamed)
270        IDISA_ALWAYS_INLINE carry_t carry_flip(carry_t carry) const
271        {
272                return carry ^ 1;
273        }
[1544]274
[3519]275        IDISA_ALWAYS_INLINE BitBlock CarryFlip(carry_t carry) const
276        {
277                return carry ^ 1;
278        }
279
280        IDISA_ALWAYS_INLINE bool test_carry(carry_t carry) const
281        {
282                return carry != 0;
283        }
284
285        IDISA_ALWAYS_INLINE carry_t carry_or(carry_t carry1, carry_t carry2) const
286        {
287                return carry1 | carry2;
288        }
289#endif
290
[1544]291};
292
[1950]293#endif // CARRYQ_HPP_
Note: See TracBrowser for help on using the repository browser.