source: trunk/src/bitplex.c @ 78

Last change on this file since 78 was 69, checked in by cameron, 11 years ago

Parallel Bit Stream Module

File size: 3.0 KB
Line 
1/*  bitplex - Parallel bit stream module.
2    Copyright (c) 2007, 2008, Robert D. Cameron.
3    Licensed to the public under the Open Software License 3.0.
4    Licensed to International Characters, Inc., under the Academic
5    Free License 3.0.
6
7    Given a character stream of 8-bit code units, this module
8    produces a parallel bit stream representation.
9
10
11*/
12
13#include "bitplex.h"
14#include "../lib/lib_simd.h"
15
16#ifdef CODE_CLOCKING
17#include "../codeclocker/clocker/code_clocker_session.h"
18Code_Clocker * transpose_clocker;
19#endif
20
21
22
23#define s2p_step(s0, s1, hi_mask, shift, p0, p1) \
24{\
25  BitBlock t0, t1;\
26  t0 = simd_pack_16_hh(s0, s1);\
27  t1 = simd_pack_16_ll(s0, s1);\
28  p0 = simd_if(hi_mask, t0, simd_srli_16(t1, shift));\
29  p1 = simd_if(hi_mask, simd_slli_16(t0, shift), t1);\
30}
31
32static inline void s2p_bytepack(BytePack s[], BitBlock p[]) {
33    BitBlock mask_2 = simd_himask_2;
34    BitBlock mask_4 = simd_himask_4;
35    BitBlock mask_8 = simd_himask_8;
36    BitBlock bit00224466_0, bit00224466_1, bit00224466_2, bit00224466_3;
37    BitBlock bit11335577_0, bit11335577_1, bit11335577_2, bit11335577_3;
38    BitBlock bit00004444_0, bit22226666_0, bit00004444_1, bit22226666_1;
39    BitBlock bit11115555_0, bit33337777_0, bit11115555_1, bit33337777_1;
40#if (BYTE_ORDER == BIG_ENDIAN)
41    s2p_step(s[0], s[1], mask_2, 1, bit00224466_0, bit11335577_0);
42    s2p_step(s[2], s[3], mask_2, 1, bit00224466_1, bit11335577_1);
43    s2p_step(s[4], s[5], mask_2, 1, bit00224466_2, bit11335577_2);
44    s2p_step(s[6], s[7], mask_2, 1, bit00224466_3, bit11335577_3);
45#endif
46#if (BYTE_ORDER == LITTLE_ENDIAN)
47    s2p_step(s[7], s[6], mask_2, 1, bit00224466_0, bit11335577_0);
48    s2p_step(s[5], s[4], mask_2, 1, bit00224466_1, bit11335577_1);
49    s2p_step(s[3], s[2], mask_2, 1, bit00224466_2, bit11335577_2);
50    s2p_step(s[1], s[0], mask_2, 1, bit00224466_3, bit11335577_3);
51#endif
52    s2p_step(bit00224466_0, bit00224466_1, mask_4, 2, bit00004444_0, bit22226666_0);
53    s2p_step(bit00224466_2, bit00224466_3, mask_4, 2, bit00004444_1, bit22226666_1);
54    s2p_step(bit11335577_0, bit11335577_1, mask_4, 2, bit11115555_0, bit33337777_0);
55    s2p_step(bit11335577_2, bit11335577_3, mask_4, 2, bit11115555_1, bit33337777_1);
56    s2p_step(bit00004444_0, bit00004444_1, mask_8, 4, p[0], p[4]);
57    s2p_step(bit11115555_0, bit11115555_1, mask_8, 4, p[1], p[5]);
58    s2p_step(bit22226666_0, bit22226666_1, mask_8, 4, p[2], p[6]);
59    s2p_step(bit33337777_0, bit33337777_1, mask_8, 4, p[3], p[7]);
60}
61
62
63Bitplex::Bitplex () {
64        x8basis = (BitBlockBasis *) simd_new(BUFFER_SIZE/PACKSIZE);
65#ifdef CODE_CLOCKING
66        transpose_clocker = 
67                register_Code_Clocker("s2p", "transposition to parallel bit streams\n");
68#endif
69}
70
71Bitplex::~Bitplex() {
72        simd_delete((SIMD_type *) x8basis);
73};
74
75
76
77
78
79void Bitplex::TransposeToBitStreams(BytePack * pseudo_ASCII_stream, int blocks) {
80#ifdef CODE_CLOCKING
81        start_Interval(transpose_clocker);
82#endif
83        for (int blk = 0; blk < blocks; blk++) {
84                s2p_bytepack(&pseudo_ASCII_stream[blk*8], x8basis[blk].bit);
85        }
86#ifdef CODE_CLOCKING
87        end_Interval(transpose_clocker, BUFFER_SIZE);
88#endif
89}
90
91
92
93
Note: See TracBrowser for help on using the repository browser.