全自研存算一体创新IP

-N300

全自研存算一体创新IP

苹芯提供面向机器学习和人工智能领域的专用加速核心,针对AI计算涉及的大量神经网络模型进行特殊优化,能够以更高的效率、更低的能耗处理人工神经网络等机器学习算法和深度学习模型,助力AI多场景落地。

-N300

功能点

  • 算力

    N300提供单核0.5TOPS算力,以及多个NPU核组成的Cluster集群架构。

  • 精度

    支持混合精度计算,支持整型的4bit、8bit以及浮点的16bit计算,更好地平衡功耗、算力密度和计算精度。

  • 灵活性

    高速任务调度加速单元,支持多核或者多个计算单元的实时任务调度。

  • 兼容性

    支持自定义算子,满足各种模型部署需求,并针对人声监听、眼动追踪、主动降噪、环境感知等应用场景提供了配置方案和专门优化。

  • 软件与工具链

    满足客户更自主、灵活的算法移植需求。开放NPU中间表示层规范、模型解析器、模型优化器、驱动等,提供免费的软件工具链,包括软件模拟器、调试器、C编译器。

  • 支持网络

    MobileNet, ResNet, Yolo-v2/v3, UNet, ShuffleNet, SqueezeNet, EfficientNet, LSTM以及可以拆解为以上算子组合的网络。

-N300

NPU支持算子

算子名称
参数
Conv

Kernel size: <=7x7内的任意形状

Stride: 1,2,3

Zero padding: 0~kernel size-1

Depthwise

Kernel size:<=5x5内的任意形状

Stride: 1,2,3

Zero padding: 0~kernel size-1

转置卷积

Kernel size: <=7x7内的任意形状

Stride: 1,2,3

Zero padding: kernel size-1

FC

Channel size: 1~2048

Pooling

Kernel size:1~15

Type: max, avg, min

Concat

只支持channel方向

双目运算符

算数运算:add,sub, mul, div, mod, avg

逻辑运算:or,and

比较运算:min,max,cmp,logic,sel,compsel

单目运算符

Log,exp,abs,not,sqrt,tanh

Reorg

HWC<->CHW

Upsampling

最邻近插值,双线性插值

非线性

Relu,p-relu,leaky-relu,relu6,softmax

支持的网络:

MobileNet, ResNet, Yolo-v2/v3, UNet, ShuffleNet, SqueezeNet, EfficientNet, LSTM以及可以拆解为以上算子组合的网络。

COPYRIGHT@ 2000-2024 版权所有 :北京苹芯科技有限公司京ICP备2021020089号-1

苹芯 官微

联系
我们