ARM平台Neon优化资源整理

笔者在日前工作当中接触了NEON优化等内容,现将网络上搜集到的资料整理如下,以供参考。如有侵权,尽请告知,即刻删除。

1.官方链接

NEON汇编指令官方文档:http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0473j/dom1361289959991.html

NEON Intrinsics官方文档:http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491h/Badcdfad.html

快速查找NEON Intrinsics:https://developer.arm.com/technologies/neon/intrinsics

A57优化指南(包含指令Timing(Execution Latancy & Throughput)等信息):http://infocenter.arm.com/help/topic/com.arm.doc.uan0015b/Cortex_A57_Software_Optimization_Guide_external.pdf

2.开源库

Arm Compute library:https://github.com/ARM-software/ComputeLibrary

Ne10:http://projectne10.github.io/Ne10/

ncnn: https://github.com/Tencent/ncnn

3.中文博客

【入门】

NEON指令详解:http://blog.csdn.net/chshplp_liaoping/article/details/12752749

NEON Intrinsics命名方式参考:http://blog.throneclay.com/2015/12/30/armneon/

优化技巧概述:

http://zyddora.github.io/2016/02/28/neon_1/

http://zyddora.github.io/2016/03/16/neon_2/

A64汇编基本语法:https://blog.csdn.net/scarecrow_byr/article/details/79676401

A64 neon汇编常用指令解析:https://jzwdsb.github.io/2018/07/neon_frequently_use/

内嵌汇编调试:https://blog.csdn.net/u012058778/article/details/54564936

【进阶】

汇编代码优化细节:http://blog.csdn.net/yang_qi168/article/details/23935141

4.Tips

4.1 关于定点除法实现的讨论,涉及到牛顿迭代法等:https://community.arm.com/tools/f/discussions/930/division-with-neon

4.2 Linux环境下确认处理器是否支持NEON:

cat /proc/cpuinfo | grep neon

看是否有如下内容

Features : swp half thumb fastmult vfp edsp neon vfpv3 tlsvfpv4 idiva idivt

----------------

如果本文内容对你有帮助,请我喝杯咖啡吧~

(目前仅支持支付宝)

原文地址:https://www.cnblogs.com/pepetang/p/7647707.html