source: trunk/lib/carryQ.hpp @ 3320

Last change on this file since 3320 was 3320, checked in by ksherdy, 6 years ago

Reverted bad carryQ.hpp changes.

File size: 7.7 KB
Line 
1#ifndef CARRYQ_HPP_
2#define CARRYQ_HPP_
3
4/*=============================================================================
5  carryQ.hpp - Pablo compiler support for carry introduction.
6  Ken Herdy, Robert D. Cameron
7  Copyright (C) 2012, Robert D. Cameron, Kenneth S. Herdy.
8    Licensed to the public under the Open Software License 3.0.
9    Licensed to International Characters Inc.
10       under the Academic Free License version 3.0.
11  April 2012
12=============================================================================*/
13
14#include <string.h>
15#include <stdint.h>
16#include <iostream>
17
18#include "bitblock.hpp"
19#include "stdio.h"
20
21///////////////////////////////////////////////////////////////////////////////
22//
23// Carry method variants.
24//
25// BitBlock_op_ci_co()  - standard block non while loop statement and in final block if ignore the carry out
26// BitBlock_op_co()     - standard block while loop and in final block while loop if ignore carry out
27// BitBlock_op_ci()             - final block non while loop statement
28// BitBlock_op()                - final while loop statement
29//
30// BitBlock_op_ci(), BitBlock_op() methods not implemented to reduce the total number of
31// methods and Pablo compiler complexity.
32//
33///////////////////////////////////////////////////////////////////////////////
34
35#define interpose32(x,y,pos) interpose32_<pos>(x,y)     
36template<uint32_t n>
37IDISA_ALWAYS_INLINE BitBlock interpose32_(BitBlock s, BitBlock s32) {
38        return simd_or(simd<32>::slli<n>(s), simd<32>::srli<32-n>(s32));
39}
40
41template<uint32_t n>
42IDISA_ALWAYS_INLINE BitBlock interpose64_(BitBlock s, BitBlock s64) {
43        return simd_or(simd<64>::slli<n>(s), simd<64>::srli<64-n>(s64));
44}
45
46template <uint16_t CarryCount, uint16_t AdvanceNCount> class CarryArray;
47
48#define LocalCarryCombine(carrySet, localCarry, carryNo, carryCount)\
49        carrySet.CarryCombine(localCarry.cq, carryNo, carryCount); 
50
51#define CarryDeclare(name, carry1_count, carryN_count)\
52CarryArray<carry1_count, carryN_count> name;
53
54// Array of BitBlock implementation.
55template <uint16_t CarryCount, uint16_t AdvanceNCount>
56class CarryArray {
57
58public:
59
60    #define Carry0 simd<BLOCK_SIZE>::constant<0>()
61    #define Carry1 simd<BLOCK_SIZE>::constant<1>()
62 
63        BitBlock cq[CarryCount + AdvanceNCount];
64        //BitBlock pending64[AdvanceNCount];
65        CarryArray()
66        {
67            memset (cq, 0, sizeof(BitBlock) * (CarryCount + AdvanceNCount));
68            //memset(pending64, 0, sizeof(BitBlock) * AdvanceNCount);
69        }
70        ~CarryArray() {}
71
72        IDISA_ALWAYS_INLINE BitBlock BitBlock_advance_ci_co(BitBlock strm, BitBlock carryin, uint16_t carryno)
73        {
74                BitBlock rslt;
75                advance_with_carry(strm, carryin, cq[carryno], rslt);
76                return rslt;
77        }
78
79        IDISA_ALWAYS_INLINE BitBlock BitBlock_add_ci_co(BitBlock strm1, BitBlock strm2, BitBlock carryin, const uint16_t carryno)
80        {
81                BitBlock sum;
82                adc(strm1, strm2, carryin, cq[carryno], sum);
83                return sum;
84        }
85
86        IDISA_ALWAYS_INLINE BitBlock BitBlock_sub_ci_co(BitBlock strm1, BitBlock strm2, BitBlock carryin, uint16_t carryno)
87        {
88                BitBlock diff;
89                sbb(strm1, strm2, carryin, cq[carryno], diff);
90                return diff;
91        }
92
93        IDISA_ALWAYS_INLINE BitBlock BitBlock_scantofirst(BitBlock charclass, BitBlock carryin, uint16_t carryno)
94        {
95                BitBlock marker;
96//              BitBlock c = carry_flip(carryin);
97                adc(simd<BLOCK_SIZE>::constant<0>(), simd_not(charclass), carryin, cq[carryno], marker);
98//              cq[carryno] = carry_flip(cq[carryno]);
99                return simd_and(marker, charclass);
100        }
101
102        IDISA_ALWAYS_INLINE BitBlock BitBlock_scanthru_ci_co(BitBlock markers0, BitBlock charclass, BitBlock carryin, uint16_t carryno)
103        {
104                BitBlock markers1;
105                adc(markers0, charclass, carryin, cq[carryno], markers1);
106                return simd_andc(markers1, charclass);
107        }
108
109        IDISA_ALWAYS_INLINE BitBlock BitBlock_advance_then_scanthru(BitBlock markers0, BitBlock charclass, BitBlock carryin, uint16_t carryno)
110        {
111                BitBlock markers1;
112                //assert(!bitblock::any(simd_and(markers0, charclass)));
113                adc(markers0, simd_or(charclass, markers0), carryin, cq[carryno], markers1);
114                return simd_andc(markers1, charclass);
115        }
116
117        IDISA_ALWAYS_INLINE BitBlock BitBlock_span_upto(BitBlock starts, BitBlock follows, BitBlock carryin, uint16_t carryno)
118        {
119                BitBlock span;
120                sbb(follows, starts, carryin, cq[carryno], span);
121                return span;
122        }
123
124        IDISA_ALWAYS_INLINE BitBlock BitBlock_inclusive_span(BitBlock starts, BitBlock ends, BitBlock carryin, uint16_t carryno)
125        {
126                BitBlock span;
127                sbb(ends, starts, carryin, cq[carryno], span);
128                return simd_or(span, ends);
129        }
130
131        IDISA_ALWAYS_INLINE BitBlock BitBlock_exclusive_span(BitBlock starts, BitBlock ends, BitBlock carryin, uint16_t carryno)
132        {
133                BitBlock span;
134                sbb(ends, starts, carryin, cq[carryno], span);
135                return simd_andc(span, starts);
136        }
137
138
139        IDISA_ALWAYS_INLINE BitBlock BitBlock_advance32_ci_co(BitBlock strm, uint32_t pending_in, uint32_t & pending_out)
140        {
141                pending_out = (uint32_t) mvmd<32>::extract< (sizeof(BitBlock)/sizeof(pending_out))-1 >(strm);
142                return simd_or(simd<BLOCK_SIZE>::slli<32>(strm), mvmd<BLOCK_SIZE>::fill((uint64_t)pending_in));
143        }
144
145        template <int n> IDISA_ALWAYS_INLINE BitBlock BitBlock_advance_n_(BitBlock strm, BitBlock pending_in, uint16_t pendingno)
146        {
147                BitBlock half_block_shifted = esimd<BLOCK_SIZE/2>::mergel(strm, pending_in);
148                cq[CarryCount + pendingno] = bitblock::srli<BLOCK_SIZE/2>(strm);
149                //pending64[pendingno] = bitblock::srli<BLOCK_SIZE/2>(strm);
150                BitBlock result = simd_or(simd<BLOCK_SIZE/2>::srli<(BLOCK_SIZE/2)-n>(half_block_shifted),
151                               simd<BLOCK_SIZE/2>::slli<n>(strm));
152                return result;
153        }
154
155        IDISA_ALWAYS_INLINE bool CarryTest(uint16_t carryno, uint16_t carry_count)
156        {
157                  BitBlock c1 = cq[carryno];
158                  int ubound = carryno + carry_count;
159                  for (int i = carryno + 1; i < ubound ; i++) {
160                        c1 = carry_or(c1, cq[i]);
161                  }
162                  return test_carry(c1);
163        }
164
165        IDISA_ALWAYS_INLINE BitBlock CarryRange(uint16_t carryno, uint16_t carry_count)
166        {
167                  BitBlock c1 = cq[carryno];
168                  int ubound = carryno + carry_count;
169                  for (int i = carryno + 1; i < ubound ; i++) {
170                        c1 = carry_or(c1, cq[i]);
171                  }
172                  return c1;
173        }
174
175        IDISA_ALWAYS_INLINE void CarryDequeueEnqueue(uint16_t carryno, uint16_t carry_count)
176        {
177                return;
178        }
179
180        // Deprecated (renamed)
181        IDISA_ALWAYS_INLINE void CarryQ_Adjust(uint16_t carry_count)
182        {
183                return;
184        }
185
186        IDISA_ALWAYS_INLINE void CarryAdjust(uint16_t carry_count)
187        {
188                return;
189        }
190
191        IDISA_ALWAYS_INLINE void CarryCombine(BitBlock local_cq[], uint16_t carryno, uint16_t carry_count)
192        {
193                  for (int i = 0; i < carry_count; i++) {
194                    cq[carryno+i] = carry_or(cq[carryno+i], local_cq[i]);
195                  }
196        }
197
198        IDISA_ALWAYS_INLINE void CarryCombine1(uint16_t carryno, uint16_t carry2)
199        {
200                  cq[carryno] = carry_or(cq[carryno], cq[carry2]);
201                  cq[carry2] = Carry0;
202        }
203
204        IDISA_ALWAYS_INLINE BitBlock get_carry_in(uint16_t carryno) const 
205        {
206                return carry2bitblock(cq[carryno]);
207        }
208
209        // Deprecated (renamed)
210        IDISA_ALWAYS_INLINE BitBlock GetCarry(uint16_t carryno) const
211        {
212                return carry2bitblock(cq[carryno]);
213        }
214
215        IDISA_ALWAYS_INLINE void SetCarry(BitBlock carryVal, uint16_t carryno)
216        {
217                cq[carryno] = carryVal;
218        }
219
220
221        // Deprecated in PabloJ, retained for legacy compiler.
222        IDISA_ALWAYS_INLINE BitBlock get_pending64(uint16_t advance_n_blkno) const 
223        {
224                return cq[CarryCount + advance_n_blkno];
225        }
226
227        IDISA_ALWAYS_INLINE BitBlock Pending64(uint16_t advance_n_blkno) const 
228        {
229                return cq[CarryCount + advance_n_blkno];
230        }
231
232//private:
233        // helpers
234
235        // Deprecated (renamed)
236        IDISA_ALWAYS_INLINE BitBlock carry_flip(BitBlock carry) const
237        {
238                return simd_xor(carry, Carry1);
239        }
240
241        IDISA_ALWAYS_INLINE BitBlock CarryFlip(BitBlock carry) const
242        {
243                return simd_xor(carry, Carry1);
244        }
245
246        IDISA_ALWAYS_INLINE bool test_carry(BitBlock carry) const
247        {
248                return bitblock::any(carry);
249        }
250
251        IDISA_ALWAYS_INLINE BitBlock carry_or(BitBlock carry1, BitBlock carry2) const
252        {
253                return simd_or(carry1, carry2);
254        }
255       
256#undef Carry0
257#undef Carry1
258
259};
260
261#endif // CARRYQ_HPP_
Note: See TracBrowser for help on using the repository browser.