|
void | csky_fir_f32 (const csky_fir_instance_f32 *S, float32_t *pSrc, float32_t *pDst, uint32_t blockSize) |
| 浮点FIR滤波器处理函数 更多...
|
|
void | csky_fir_fast_q15 (const csky_fir_instance_q15 *S, q15_t *pSrc, q15_t *pDst, uint32_t blockSize) |
|
void | csky_fir_fast_q31 (const csky_fir_instance_q31 *S, q31_t *pSrc, q31_t *pDst, uint32_t blockSize) |
|
void | csky_fir_init_f32 (csky_fir_instance_f32 *S, uint16_t numTaps, float32_t *pCoeffs, float32_t *pState, uint32_t blockSize) |
|
csky_status | csky_fir_init_q15 (csky_fir_instance_q15 *S, uint16_t numTaps, q15_t *pCoeffs, q15_t *pState, uint32_t blockSize) |
|
void | csky_fir_init_q31 (csky_fir_instance_q31 *S, uint16_t numTaps, q31_t *pCoeffs, q31_t *pState, uint32_t blockSize) |
|
void | csky_fir_init_q7 (csky_fir_instance_q7 *S, uint16_t numTaps, q7_t *pCoeffs, q7_t *pState, uint32_t blockSize) |
|
void | csky_fir_q15 (const csky_fir_instance_q15 *S, q15_t *pSrc, q15_t *pDst, uint32_t blockSize) |
| Q15 FIR滤波器的处理函数 更多...
|
|
void | csky_fir_q31 (const csky_fir_instance_q31 *S, q31_t *pSrc, q31_t *pDst, uint32_t blockSize) |
|
void | csky_fir_q7 (const csky_fir_instance_q7 *S, q7_t *pSrc, q7_t *pDst, uint32_t blockSize) |
|
这些函数实现了Q7,Q15,Q31和浮点数据类型的的有限冲激响应(FIR)滤波器,还有Q15和Q31的快速版本。 还是以块为单位处理输入输出数据,每次调用滤波器函数处理 blockSize
个样本. pSrc
和 pDst
指向输入和输出数组,数组有 blockSize
个值.
- 算法:
- FIR滤波器的算法建立在一系列的乘加(MAC)操作之上。 每个滤波器系数
b[n]
和一个状态变量相乘,状态变量与之前的输入样本 x[n]
相同.
y[n] = b[0] * x[n] + b[1] * x[n-1] + b[2] * x[n-2] + ...+ b[numTaps-1] * x[n-numTaps+1]
有限冲激响应滤波器
pCoeffs
指向系数数组,数组的大小是 numTaps
. 系数按以下顺序保存:
{b[numTaps-1], b[numTaps-2], b[N-2], ..., b[1], b[0]}
pState
指向状态数组,数组的大小是 numTaps + blockSize - 1
. 状态数组的样本保存顺序如下:
{x[n-numTaps+1], x[n-numTaps], x[n-numTaps-1], x[n-numTaps-2]....x[0], x[1], ..., x[blockSize-1]}
- 注意:状态缓存的长度超过了系数数组的长度
blockSize-1
. 扩展之后的状态缓存长度,可以避免循环寻址,并且显著提升速度。循环寻址是用在传统FIR滤波器的一种寻址方式。 状态变量在每块数据操作之后更新,系数不更新。
- 结构体实例
- 滤波器的系数和状态变量都保存在数据结构的实例中。 每个滤波器都必须有一个单独的结构体实例。 系数数组可能可以在几个实例之间共享,但是状态变量数组不能共享。 为支持的4种数据类型分别提供了不同的结构体实例声明。
- 初始化函数
- 为每种支持的数据类型都提供了一个相应的初始化函数。 初始化函数处理以下操作:
- 设置内部结构体字段的值
- 清零状态缓存中的值 如果手动初始化,而不调用初始化函数,需要指定结构体实例的以下字段: numTaps, pCoeffs, pState. pState中的所有值置0.
- 是否使用初始化函数是可选的。 但是,使用了初始化函数,则不能将结构体实例放在常量数据段。 要将结构体实例放在常量数据段,则必须手动初始化结构体实例。 在静态初始化之前,要确保状态缓存中的值已经清零。 下面的代码,为4种不同的滤波器,静态的初始化了结构体实例。
*csky_fir_instance_f32 S = {numTaps, pState, pCoeffs};
*csky_fir_instance_q31 S = {numTaps, pState, pCoeffs};
*csky_fir_instance_q15 S = {numTaps, pState, pCoeffs};
*csky_fir_instance_q7 S = {numTaps, pState, pCoeffs};
其中 numTaps
是滤波器中的系数数量; pState
是状态缓存的地址; pCoeffs
是系数缓存的地址
- 定点行为
- 使用定点FIR滤波器函数需要注意。 特别是要考虑,在每个函数内使用的累加器的溢出和饱和行为。 具体参考每个函数各自的文档和使用说明。
- 参数
-
[in] | *S | 指向Q15 FIR滤波器结构体实例 |
[in] | *pSrc | 指向输入数据块 |
[out] | *pDst | 指向输出数据块 |
[in] | blockSize | 输入样本的数量 |
- 返回
- none.
缩放和溢出行为:
- 这个快速版本使用一个2.30格式的32位累加器。 累加器维持了中间乘法的所有精度,但是只有一个保护位。 因此为了防止溢出,输入信号必须缩小 log2(numTaps) 位. 最后2.30 格式累加器截断为 2.15 格式,并且饱和为 1.15 格式.
- 函数
csky_fir_q15()
是这个函数的一个慢速版本,使用了一个64位累加器,防止溢出。慢速和快速版本使用了相同的结构体实例。 可以使用函数 csky_fir_init_q15()
初始化滤波器结构体。
- 参数
-
[in] | *S | 指向Q31结构体实例 |
[in] | *pSrc | 指向输入数据块 |
[out] | *pDst | 指向输出数据块 |
[in] | blockSize | 处理的样本数量 |
- 返回
- none.
缩放和溢出行为:
- 函数为了优化速度,舍弃了一些定点精度和溢出保护。 每个 1.31 和 1.31 相乘的结果截断为 2.30 格式. 这些中间结果在一个2.30格式累加器相加。 最后,累加器饱和转换为1.31的结果。 快速版本和标准版本有一样的溢出行为,因为丢弃了每次相乘结果的低32位,所以相对提供了更少的精度。 为了防止溢出,输入信号必须缩小 log2(numTaps) 个位.
- 函数
csky_fir_q31()
是这个函数的一个慢速版本,使用了一个64位累加器,提供了更高的精度。 慢速和快速版本使用了相同的结构体实例。 可以使用函数 csky_fir_init_q31()
初始化滤波器的结构体.
- 参数
-
[in,out] | *S | 指向浮点FIR滤波器结构体实例 |
[in] | numTaps | 滤波器内系数数量 |
[in] | *pCoeffs | 指向滤波器系数缓存 |
[in] | *pState | 指向状态缓存 |
[in] | blockSize | 处理的样本数量 |
- 返回
- none.
描述说明:
pCoeffs
指向滤波器系数数组,保存的顺序如下:
{b[numTaps-1], b[numTaps-2], b[N-2], ..., b[1], b[0]}
pState
指向状态变量的数组。 pState
是长度为 numTaps+blockSize-1
的样本, 其中 blockSize
是传递给 csky_fir_f32()
的输入样本数量.
- 示例:
- csky_fir_example_f32.c , 以及 csky_signal_converge_example_f32.c.
- 参数
-
[in,out] | *S | 指向Q15 FIR滤波器结构体实例 |
[in] | numTaps | 滤波器的系数数量,必须是偶数,并且大于等于4。 |
[in] | *pCoeffs | 指向滤波器系数缓存 |
[in] | *pState | 指向状态缓存 |
[in] | blockSize | 处理样本的数量 |
- 返回
- 初始化成功则函数返回 CSKY_MATH_SUCCESS ,如果
numTaps
小于4或者不是偶数,则返回 CSKY_MATH_ARGUMENT_ERROR 。
描述说明:
pCoeffs
指向滤波器系数数组,系数保存的顺序如下:
{b[numTaps-1], b[numTaps-2], b[N-2], ..., b[1], b[0]}
注意: numTaps
必须是偶数,并且大于等于4。 实现奇数长度的滤波器,则将 numTaps
加1,然后将最后的系数设成0。 比如,要实现一个滤波器的 numTaps=3
,系数是:
{0.3, -0.8, 0.3}
改成 numTaps=4
,使用系数:
{0.3, -0.8, 0.3, 0}.
类似的,实现只有两个点的滤波器
{0.3, -0.3}
改成 numTaps=4
,使用系数:
{0.3, -0.3, 0, 0}.
pState
指向状态变量的数组。 pState
的长度是 numTaps+blockSize
, 其中 blockSize
作为输入样本的数量传给 csky_fir_q15()
.
- 参数
-
[in,out] | *S | 指向Q31 FIR滤波器结构体实例 |
[in] | numTaps | 滤波器中的系数数量 |
[in] | *pCoeffs | 指向滤波器系数缓存 |
[in] | *pState | 指向状态缓存 |
[in] | blockSize | 处理的样本数量 |
- 返回
- none.
描述说明:
pCoeffs
指向滤波器系数数组,系数保存的顺序如下:
{b[numTaps-1], b[numTaps-2], b[N-2], ..., b[1], b[0]}
pState
指向状态变量的数组。 pState
的长度是 numTaps+blockSize-1
, 其中 blockSize
作为输入样本的数量传入 csky_fir_q31()
.
- 参数
-
[in,out] | *S | 指向Q7 FIR滤波器结构体实例 |
[in] | numTaps | 滤波器中的系数数量 |
[in] | *pCoeffs | 指向滤波器系数缓存 |
[in] | *pState | 指向状态缓存 |
[in] | blockSize | 处理的样本数量 |
- 返回
- none
描述说明:
pCoeffs
指向滤波器系数数组,系数保存的顺序如下:
{b[numTaps-1], b[numTaps-2], b[N-2], ..., b[1], b[0]}
pState
指向状态变量的数组。 pState
的长度是 numTaps+blockSize-1
, 其中 blockSize
作为输入样本的数量传入 csky_fir_q7()
.
- 参数
-
[in] | *S | 指向Q15 FIR结构体实例 |
[in] | *pSrc | 指向输入数据块 |
[out] | *pDst | 指向输出数据块 |
[in] | blockSize | 处理样本的数量 |
- 返回
- none.
- 限制
- 如果芯片不支持分对齐访问,则定义宏 UNALIGNED_SUPPORT_DISABLE 同时,输入,输出,临时buffer,都应该是32位对齐。
缩放和溢出行为:
- 函数实现使用了一个内部64位累加器。 输入都是1.15格式的,乘法生成2.30结果。 2.30格式的中间结果在34.30格式的64位累加器累加。 由于有33个保护位,所以不会有溢出风险。 34.30的结果丢弃低15位截断为34.15格式,然后饱和成为1.15格式的结果。
- 函数
csky_fir_fast_q15()
是这个函数的一个快速版本,但是丢失了更多的精度
- 参数
-
[in] | *S | 指向Q31 FIR结构体实例 |
[in] | *pSrc | 指向输入数据块 |
[out] | *pDst | 指向输出数据块 |
[in] | blockSize | 处理样本的数量 |
- 返回
- none.
缩放和溢出行为:
- 函数实现使用了一个内部64位累加器。 输入数据表示为1.31格式。 中间乘法生成2.62格式的结果,结果在2.62格式的64位累加器累加。 因为只有一个保护位,所以需要缩小输入信号来防止溢出。 需要缩小log2(numTaps)才可以保证没有溢出。 最后,2.62格式右移31位,然后饱和生成1.15格式的结果。
- 函数
csky_fir_fast_q31()
是这个函数的一个快速版本,但是丢失了更多的精度
- 参数
-
[in] | *S | 指向Q15 FIR结构体实例 |
[in] | *pSrc | 指向输入数据块 |
[out] | *pDst | 指向输出数据块 |
[in] | blockSize | 处理样本的数量 |
- 返回
- none.
缩放和溢出行为:
- 函数实现使用了一个内部32位累加器。 输入都是1.7格式,相乘的结果是2.14格式。 2.14格式的结果在18.14格式的32位累加器中累加。 中间结果不会有溢出风险,而且可以保留所有的精度。 18.14 的结果丢弃低7位,截断为18.7格式,最后饱和为1.7格式。