【存内计算在AI大模型时代应用最佳实践系列】三十:新型存储代表着存算一体内技术的未来

完美句号 社区KOL 2024-02-10 16:09:34

目前能做存算一体的存储器包括Flash、SRAM、DRAM、RRAM(忆阻器)、MRAM(磁性存储器)等,不同技术路线各有优劣势,比如Flash具有密度比较高的优点,DRAM成本比较低,MRAM、RRAM等新型存储器除了存储密度较高之外,功耗也比较低等。未来随着人工智能对高性能、低功耗处理需求的不断增强,存算一体技术的开发和应用落地进程将会加速。

其中,在众多存储器中,新型存储器RRAM、MRAM等被格外看好,此前有业内人士对电子发烧友表示,RRAM、MRAM这两类新型存储器代表着存内计算的未来,不过因为技术比较新,目前在工艺成熟度和商业化上还需要一些耐心。

事实上RRAM、MRAM等已经在逐渐取得进展。MRAM是一种基于自旋电子学的新型信息存储器件,其核心结构由一个磁性隧道结和一个访问晶体管构成,和其他存储器相比,MRAM在运行速度、寿命和量产方面存在优势。事实上,早在十几年前就有企业研究和MRAM产品,包括飞思卡尔(被恩智浦并购)、东芝、高通等,过去几年台积电、英特尔、三星、SK海力士等晶圆代工厂和IDM也大力投入研发。目前RRAM、MRAM等还落后先进工艺3-4代以上。

此外也有不少初创公司投入研究并取得进展,比如国外的Everspin、Avalanche、Crocus、 Spin Transfer Technology 已经能够提供MRAM样品,国内成立于2019年的亘存科技,已经于2020年完成产业链闭环建设,打通了上下游各关键环节,获得数家来自国内外客户的合作订单和营收,涉及技术涵盖STT-MRAM和 SOT-MRAM等。

RRAM是继电阻、电容、电感之后的第四种电路基本元件,这种组件的电阻会随着通过的电流量而改变,它本身就像一个矩阵排列,最适合进行点积乘法和累加运算,而这类运算占深度学习算法中的绝大部分。乘积累加操作可以通过将忆阻器这样的可编程阻变元件直接集成到非易失性高密度存储芯片中来实现,处理单元被嵌入存储器中,可减少数据移动,也就是说忆阻器本身就已具备存内计算的特质,非常适合用于存算一体芯片技术方向。

目前已经有些RRAM进入小批量试产阶段,而且此前清华大学微电子所、未来芯片技术高精尖创新中心钱鹤、吴华强教授团队,与合作者共同研发出一款基于多个忆阻器阵列的存算一体系统,该系统在处理卷积神经网络时的能效,比图形处理器芯片高两个数量级,单芯片算力高达1POPs,大幅提升计算设备的算力,而且功耗比传统芯片降低了100倍。

可以看到,新型存储器RRAM、MRAM等的优势非常明显,不过相比于Flash、SRAM、DRAM等存储器,它们在开发上还有很多问题需要攻克,从当前的进展来看,预计未来5-8年将会逐渐有产品走向商用。

从统计情况来看,目前已经有基于SRAM、NOR Flash的存算一体产品批量生产,基本上是小算力产品,面向消费、泛安防等低功耗市场;此外可以看到,有不少企业正在研发面向边缘端、云端推理场景的大算力产品,应用于数据中心、智能驾驶等领域,并且已经到了芯片验证阶段,而接下来,除了基于新型存储器的存算一体将会逐渐走向商用,存算一体芯片产品也将从小算力终端消费类应用,逐渐走到面向大算力的智能驾驶、数据中心等应用。


1. 布局存内计算:

据 Gartner 预测,全球内存计算市场将以每年22%的速度持续增长。近年来,随着新兴非易失存储器的发展,国内开始出现做存算一体大算力的公司,同时不断有新玩家涌入。

科研院所方面,加州大学圣芭芭拉分校谢源教授团队致力于在新型存储器件ReRAM(阻变存储)里面实现计算的功能研究。清华大学刘勇攀教授团队和汪玉教授团队均参与了该架构的研发,目前已实现在150nm工艺下流片,在阻变存储阵列里实现了计算存储一体化的神经网络,功耗降低20倍,速度提高50倍。2022年7月中科院微电子所团队在40nm 256Kb RRAM 芯片上实现图神经网络小样本学习的功能验证,在存内计算领域取得进展。

在产业应用方面,英特尔、博世、美光、Lam Research、应用材料、微软、亚马逊、软银都投资了NOR闪存存算一体芯片。阿里达摩院于2021年11月成功研发存算一体芯片。为全球首款基于DRAM 的 3D 键合堆叠存算一体芯片。它可突破冯・诺依曼架构的性能瓶颈,在特定AI 场景中,该芯片性能提升10倍以上,效能比提升高达300 倍。2022 年 6 月,中国移动携手 12 家产业合作伙伴共同发布了《算力网络技术白皮书》,明确存内计算(存算一体)作为核心技术体系与技术路线之一。


2. 存内计算的重点在于新型存储器:

目前能做存算一体的存储器包括Flash、SRAM、DRAM、RRAM(忆阻器)、MRAM(磁性存储器)等,不同技术路线各有优劣势,比如Flash具有密度比较高的优点,DRAM成本比较低,MRAM、RRAM等新型存储器除了存储密度较高之外,功耗也比较低等。未来随着人工智能对高性能、低功耗处理需求的不断增强,存算一体技术的开发和应用落地进程将会加速。

存储芯片是国内集成电路市场份额占比最大的产品类别,但当前整个行业正处于低谷,由于市场需求普遍疲软,对各类存储器企业都是一个不小的考验。然而近期不少市场人士预判,存储行业至暗时刻已经过去。目前市场普遍预计芯片企业业绩将于年中触底,随着企业逐渐清理积压的产品库存,下半年行业有望开启复苏周期。台积电预计,由于汽车芯片持续强劲,以及服务器芯片需求有望复苏,全年销售额总体将实现增长。

 

...全文
52 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复

支持存内计算开发者社区的建设

完美句号 社区KOL 02-10
  • 打赏
  • 举报
回复 1

建设存内计算开发者社区

2,035

社区成员

发帖
与我相关
我的任务
社区描述
首个存内开发者社区,是整合产学研各界资源优势,搭建的学习与实践平台,提供存内架构学习,平台算法部署实践,存内计算线下训练以及AI时代大模型追踪,从理论到实践,供开发者体验未来第三极算力架构。
其他 企业社区
社区管理员
  • 存内计算开发者社区
  • Hundred++
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  • 奖品兑换上新:

100积分 - 品牌赞助托特包 (单个账号限兑换5个)

200积分-罗技M240无线鼠标 ( 单个账号限兑换3个)

400积分-马歇尔入耳式耳机 (单个账号限兑换2个)

600积分-Cherry MIX 3.0键盘 (单个账号限兑换2个)

800积分- 雷切Pro游戏手柄 (单个账号限兑换1个)

1200积分-Switch 积分(单个账号限兑换1个)

 

  • 积分规则:

 

创作积分:

1,发布文章获取20积分

2,文章内容加精30积分

互动积分:

1,发布评论互动积分:2积分

2,点赞文章获取积分:1积分

 

 

试试用AI创作助手写篇文章吧