存算一体的芯片运算无需数据读写和数据搬运
存算一体芯片设计公司「知存科技」今日宣布完成近亿元人民币的A轮融资,此轮融资中芯聚源领投,普华资本、招商局创投、三峡鑫泰、科讯创投、燕缘雄芯跟投。此轮融资将主要用于完成芯片的量产工作。
知存科技成立于2017年,主要研发NOR Flash存算一体AI芯片,主要针对语音识别和视觉识别两个领域,目前正在进行Demo芯片的测试,运算效率为15TOPS/W,预计半年内进入量产阶段。
上世纪40年代,冯诺依曼确立了处理器和存储器分离的基本计算架构,即数据和程序存入存储器中,处理器调出数据计算之后再传送回存储器当中。这一架构也是目前最普遍使用的架构。而存算一体,简单来说就是存储器部分同时拥有拥有计算和存储功能。
那存算一体的结构又有那些什么好处的优势呢?王绍迪介绍,知存科技研发的存算一体的AI芯片的计算效率能达到冯诺依曼结构芯片的20-50倍,这是因为存算一体的架构可以破解目前AI芯片遇到的“存储墙问题”。在一般AI运行当中,数据要不停地在存储器和处理器之间搬运,搬运速度限制了芯片运算速度,而搬运数据的功耗也提高了芯片的功耗。而存算一体的芯片运算无需数据读写和数据搬运,因而可以突破瓶颈提高芯片效率。
在存算一体芯片设计中最重要也是最难的部分就是如何去设计存储器使得其也能进行处理器的运算的过程。知存科技的方案是重新设计存储器,利用Flash闪存存储单元的物理特性,对存储阵列改造和重新设计外围电路使其能够容纳更多的数据,同时将算子也存储到存储器当中,使得每个单元都能进行模拟运算并且能直接输出运算结果,以达到存算一体的目的。
而在单次流片成本方面,王绍迪称知存科技的研发和流片成本与同性能的常规AI芯片相比,能够降低50倍,原因在于相比于常规方案,存算一体的架构无需高性能的处理器,而处理器又是成本占比最高的部分。
但存算一体作为一种较新的芯片设计方法,在实际研发当中同样存在困难需要攻克,一是在芯片设计阶段,由于区别于常规的芯片设计方案,所以目前市面上没有成熟的EDA工具辅助设计和仿真验证;二是在芯片流片之后,也没有成熟的工具帮助测试;三是在芯片应用层面,由于这是一种全新设计,所以在应用层面也许设计新的软件进行芯片的适配。因而,知存科技也正在着力研发芯片设计和应用的专业软件。
据美光公司NOR Flash产品线总监Richard De Caro的估算,每年NOR Flash的出货量超过 60 亿颗 。NOR Flash存算一体芯片在国际上也备受关注,包括英特尔、博世、美光、Lam Research、应用材料、微软、亚马逊、软银都投资了NOR Flash存算一体芯片。美国存算一体AI芯片初创公司Mythic于今年6月完成了Valor Equity Partners领投的3000万美元B-1轮融资,此前Future Ventures、Atreides、Micron Ventures、Lam Research、Softbank Venture、Draper Fisher Jurvetson,Lux Capital,Data Collective和AME Cloud Ventures也参与了此B轮投资,由此B轮融资总额达7000万美元。美国另一家专注于语音识别的存算一体AI芯片初创公司Syntiant也于2018年11月获得了微软、英特尔、亚马逊、博世和摩托罗拉等共同参与的2500万美元B轮融资。
团队方面,知存科技团队目前共有50人,超过80%人员为研发人员,毕业于加州大学、爱丁堡大学、清华大学、北京大学、国防科技大学、浙江大学、北京航空航天大学、哈尔滨工业大学、华中科技大学、北京理工大学等国内外知名学府。十多位核心成员拥有10年以上产业经验,来自于IBM、AMD、Qualcomm、Global Foundries、RDA 等知名半导体企业。CTO郭昕婕曾有5年存算一体芯片设计和多次流片经验,验证过多个存算一体芯片。
中芯聚源高级投资经理杨雪:知存科技技术传承路径清晰,在存算一体技术路线领域属于国际第一梯队。团队研发实力雄厚。产品在算力、功耗、功耗及面积方面优势突出。产品定义符合AI端侧推理芯片市场诉求。 产品量产在即。拥有行业龙头客户及合作伙伴。
普华资本合伙人蒋纯:人工智能的发展对计算机体系架构正在造成重大冲击,一场新的架构革命近在眼前。中国的芯片产业发展除了在现有赛道上要奋起直追,也需要在新的技术浪潮中换道超车,才能更好地冲出重围。存内计算是其中一个重要的新方向。王绍迪博士和郭昕婕博士的团队在这个领域具有丰富的研究和实践经验,成果和世界水平同步,是最有可能在这个方向上跑出来的团队,我们非常看好他们的发展。