SAM4E单片机之旅——23、在AS6（GCC）中使用FPU

浮点单元（Floating Point Unit，FPU)，是用于处理浮点数运算的单元。

为使用FPU，除了需要启用FPU外，还需要对编译器进行设置，以使其针对浮点运算生成特殊的指令。虽然在Atmel Studio 6中，开发板使用的工程模板中默认就完成了这两部分工作，但这次仍然对设置的方法进行介绍，同时简单测试一下FPU的效率。

一、编译器设置

AS6.1 SP2中，使用的编译器为arm-none-eabi-gcc.exe，版本为4.7.3。其中“none”表示没有指定操作系统，“eabi”表示使用的二进制文件接口是eabi。

在ARM GCC中，可以使用-mfloat-abi选项设置浮点数的ABI：
- soft：调用软浮点库对浮点运算进行支持。在GCC中采用常用的指令来模拟浮点运算。
- softfp：使用FPU进行浮点数运算。但是在函数调用时，仍然使用通用的寄存器传递浮点数参数。这需要额外的类型转换的开销。
- hard：使用FPU进行浮点数运算。而且在函数调用时，使用FPU的寄存器传递浮点数参数。
AS6.1使用的编译器，默认情况下即使用soft选项。而为了使用FPU，这里将使用softfp选项。
使用-mfpu选项设置FPU硬件的类型。

SAM4E搭载了Cortex-M4F FPU，它实现了FPv4-SP版本（SP表示单精度）的浮点数扩展。另外，它也搭载了32个32位的单精度寄存器，而这些寄存器也可以被当作16个64位的双精度寄存器以进行load，store和move操作。

所以需要将-mfpu赋值为fpv4-sp-d16。其中d16表示有16个64位寄存器。
AS6中的设置。

在解决方案管理器中，右键点击工程，进入属性页面。然后选中“Toolchain”选项卡，再选择“ARM/GUN C Complier ”下的“Miscellaneous”选项，就可以看到自定义的编译器的选项了。

可以看到，默认情况下已经追加了“-mfloat-abi=softfp -mfpu=vfpv4”的选项了。vfpv4默认表示vfpv4-D32，表示实现了完全的FPV4的版本，且配有32个64位寄存器。很明显，这是一个不怎么正确的设置，所以需要更改为“-mfloat-abi=softfp -mfpu= fpv4-sp-d16”：

注意，在Release版本的配置中也需要进行修改。

二、启用FPU

开发板重置时，FPU是禁止访问的。但是AS6中使用的startup文件会根据编译器设置启用FPU。

启用FPU的方法

向FPU的CPACR寄存器的CP10和CP11字段写入0b11即可开放FPU的完全访问权限。另外，在特权模式下才能读写该寄存器。

在CMSIS中该寄存器的地址被定义成了保留地址。但是在fpu.h 中提供了相应的API：

#include <fpu.h> // 会和sam.h的宏定义冲突，使用board.h即可
fpu_enable();

fpu_enable() 的实现如下：

/** CPACR寄存器 */
#define ADDR_CPACR 0xE000ED88
#define REG_CPACR  (*((volatile uint32_t *)ADDR_CPACR))

/** 保存CPU当前中断的状态，并屏蔽之 */
irqflags_t flags;
flags = cpu_irq_save();

/** 修改CPACR寄存器*/
REG_CPACR |=  (0xFu << 20);

__DSB();		/** 等待寄存器修改完成*/
__ISB();		/** 清空处理器流水线  */

/** 根据设置决定是否重新启用中断 */
cpu_irq_restore(flags);

AS6中已经完成的工作

开发板使用的AS6的工程模板中，程序的入口函数是Reset_Handler() 。
- 该函数在调用main() 函数之前，会执行以下代码：
```
#if __FPU_USED
	fpu_enable();
#endif
```
- __FPU_USED在以下代码中定义：
```
//... 
/* 判断使用的编译器是否为GCC */
#elif defined ( __GNUC__ )
  /* 判断是否启用浮点运算，且运算不是用软件实现的 */
  #if defined (__VFP_FP__) && !defined(__SOFTFP__)
	  /* 判断目标平台是否有FPU */
    #if (__FPU_PRESENT == 1)
      #define __FPU_USED       1
#else
//...
```
- __FPU_PRESENT 在sam4e16e.h 中定义：
```
/**< SAM4E16E does provide a FPU */
#define __FPU_PRESENT 1
```
所以，只需要设置好了编译器的参数，就可以自动启用FPU了。

PS：__GNUC__ 在GCC编译器预定义的宏，__VFP_FP__ 在GCC启用浮点运算时预定义，__SOFTFP__ 是使用软模拟浮点运算时预定义。GCC可以使用“-dM –E”参数打印出预定义的宏。

三、测试

在第一次示例教程中，我们使用了空循环来进行延时，来完成LED的闪烁工作。在这里，我们将这个空循环的循环体修改为对一个浮点数的运算。然后观察在是否使用硬件FPU时，LED闪烁的频率的差别。

将延时函数修改如下：

void Delay(int num)
{
	volatile float f = 1.0f;
	for (volatile int i = 0; i < 1024 * 64 * num; ++i )
		f *= 1.1f;	
}

然后分别使用“-mfloat-abi=softfp ”和“-mfloat-abi=soft ”选项编译并执行程序，观察LED闪烁的频率。