钛媒体快讯 | 9月25日消息:就在去年的云栖大会上,阿里巴巴正式宣布成立芯片公司“平头哥半导体有限公司”,正式跨入造芯行列。一年后的今天,平头哥团队验收初步成果的日子到来了。
今天,达摩院院长张建锋在杭州云栖大会现场展示了含光800——阿里巴巴第一颗自研的芯片。
含光其名,源自上古三大神剑之一「含光剑」,该剑含而不露,光而不耀。
“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光 800 是平头哥的万里长征第一步,我们还有很长的路要走。”张建锋补充到。
沿着拆分模块化角度来分析,含光 800 性能的突破得益于软硬件的协同创新。
从硬件层面来看,含光 800 采用创新低自研芯片架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了 I/O 需求和数据的搬移,NPU 同时深度优化了卷积、矩阵乘、向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,有效解决芯片性能瓶颈问题;
而在软件层面,含光 800 集成了达摩院先进算法,针对 CNN 及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗 NPU 上完成计算。此外,它还拥有自动化开发工具,支持 TensorFlow、Caffe 等主流开源框架,还可进行多模型动态部署。
针对“云上场景”特殊定制
定位为是一款云端AI芯片,和过去定位在手机内置SOC里的NPU不同的是,含光800的应用场景主要集中于成规模的计算中心。
有场景,必然有重心的变化。这一次,含光800更加聚焦于降低运维成本所要考虑的能效和为了扩大硬件应用场景边界所要考虑的算力峰值。
据张建锋介绍,过去一年,平头哥团队始终在不断探索芯片与场景的融合道路上。以对算力需求较大的图像视频分析、搜索以及推荐等业务场景为例,围绕这一目标,平头哥针对场景深度定制了芯片的软硬件。“举个简单的例子,阿里先后自研了架构、软件编译器、框架、工具链等,玄铁 910、无剑 SoC 平台便是最好的印证。”
相较于其它,本次发布的绝对主角含光800,其从芯片设计、流片整过程都显得极为迅速。据了解,平头哥团队 7 个月就完成了含光800的前端设计,之后仅用了3个月就成功流片。
值得一提的是,眼下,含光800已经进入商用阶段。据悉,含光800已应用在阿里巴巴内部核心业务中。