3,425
社区成员
人工智能在自然语言处理、人脸识别、自动驾驶等众多领域广泛应用,其模型参数量和计算量呈爆炸式增长。例如,从 GPT - 1 到 GPT - 3,模型参数量大幅增加,导致对计算资源的需求急剧上升,出现了 AI 与存储墙的问题,即数据搬运成为计算效率的瓶颈。
晶体管集成密度的发展逐渐放缓,从原本每两年翻倍变为每 18 个月翻倍,且集成电路性能日趋饱和。晶体管尺寸缩小带来了寄生效应、高场效应和泄漏电流等问题,尽管材料和光刻技术不断进步,如采用 High - K 介质、从 DUV 到 EUV 光刻技术,以及晶体管结构从 Plain FET 到 FinFET 再到 GAA FET 的转变,但摩尔定律放缓的趋势不可避免。
冯诺依曼架构存在 “功耗墙” 和 “存储墙” 问题。在该架构下,处理器算力、存储器带宽增长速度不匹配,数据搬运远远大于计算,导致计算效率低下,限制了计算机性能的进一步提升。
存内计算架构打破了存储单元与计算单元的物理隔离,基于不同存储器件(如 DRAM、SRAM、MRAM、PCM、Flash、RRAM 等)的工作原理,利用多种物理定律在存储器内部实现计算功能,避免了数据搬运造成的高昂代价。
存内计算架构中的存内 MVM 运算在 ANN、CNN、RNN、K - Means 等多个领域有广泛应用。同时,训练后量化和硬件感知训练等方法对于解决存内计算架构面临的问题具有重要意义,为存内计算架构的进一步发展和应用提供了保障。