【存内计算在AI大模型时代应用最佳实践系列】三十四:三星存算一体人工智能的新浪潮2

完美句号 存内计算大使 2024-02-10 20:33:39

1. 赋予机器学习能力:

机器学习是通过人工智能 (AI) 分析复杂的数据并自动预测未来行为的过程。通过有监督的学习并使用标签对数据进行分类,并通过无监督的学习识别数据集中的模式,机器学习让机器能够帮助我们更快速更准确地作出决策。

强化学习方法是模仿人类和动物通过试验和错误进行学习的过程,让机器和设备无需显式编程即可独立扩展自己的能力。总而言之,这些过程构成了所有 AI 支持特性和功能的基础。


2. 神经元的力量:

得益于深度学习的强大能力,机器可以以惊人的准确率分析和识别图像等输入数据。这是可以按照类似于人类大脑的方式处理和学习数据的关联算法层,即通过由神经元组成的ANN(Artificial Neural Network,人工神经网络)实现。

DNN(Deep Neural Network,深度神经网络)是在输入层和输出层之间包含多个层的人工神经网络,在输入层和输出层之间通过像人脑一样错综复杂连接的多层神经元进行操作。CNN(Convolution Neural Network,卷积神经网络)通常用于识别处理图像、语音和自然语言的数据模式。


3. AI和大数据:

人工智能中很神奇的一个应用场景就是处理庞大而复杂的大数据,这是原有技术无法实现的。 这种数据分析方式可以在人们做决策时提供必要的关键见解,因此多个行业都在加速引进人工智能。

机器学习算法可基于突破性的速度快速筛选和分析信息,运用该技术的公司则可以更轻松地发现数据中隐藏的见解并加以应用。


4. 计算能力达到新高度:

为了进一步推进人工智能的发展,必须开发与其水平相当的计算基础设施,即HPC(high-performance computing,高性能计算)。 HPC广泛应用于使用大量数据的多种场景,包括高性能数据分析和机器学习模型的训练。 HPC通过计算服务器实现并行计算,每个服务器都成为一个“节点”,从而确保先进的大型应用程序快速可靠地运行。 在推进人工智能发展以处理呈指数增长的数据方面,这种性能和效率至关重要。


5. 端侧AI:

在更快、更高效地提供人工智能服务方面,端侧 (On-device) AI的发展发挥着关键作用。 人工智能算法以及硬件和软件的快速发展,让人工智能服务成功从云端转移到设备内部。 凭借于此,移动设备、家用电器和汽车等机器上运行的人工智能服务在稳定性、隐私性和性能等方面获益颇多。 端侧AI降低了网络依赖性,速度比云端更快,并且可以安全运用生物识别等类别的敏感数据。


6. 推动移动设备端 AI:

设备端 AI 不仅可显著提高处理速度,实现更高的可靠性和更严格的数据安全性,还将彻底改变我们使用移动设备的方式。例如,AI 相机可利用更好的图像处理技术来优化照片,并通过提供更准确的面部识别来增强生物识别的安全性。通过在移动设备本地进行 AI 处理,可带来更好的沉浸式和交互式虚拟和增强现实体验。它还将自然语言处理和语音识别等重要功能从云端转移出来,让虚拟助手变得更加智能和实用。


7. 实现更高水平的高性能计算:

即将大量普及的 AI 服务和技术将为高性能计算 (HPC) 开拓新的动态应用。依托由高性能计算支持的超快 IT 基础架构,让直播流式传输服务等需要实时处理大量数据的应用能够提供逼真的高清内容。高性能计算集群也将受益于更高的能效,促进计算服务器和存储之间的快速数据传输。

此外,由于集群架构能够更加高效地管理资源,降低了企业的 TCO(总体拥有成本),高性能计算的相关支持成本也将会降低。


8. 推动车用 AI的进步:

AI 不仅为自动驾驶汽车的发展创造了条件,还也是让通勤更加安全高效的关键。互联汽车使用几十甚至数百个传感器,用于:

1. 检测驾驶员尚未看到的潜在危险,并控制方向盘以避免事故;

2. 监控关键部件以帮助预防故障;以及其他功能。

3. 监控驾驶员的视线和头部位置,以检测他们可能出现分心或犯困的情况,以及实现众多探讨如何推动创新!


9. 推动人工智能创新:

人工智能、数据中心、超连接、元宇宙……在数字化转型时代,这些主要平台正在不断重塑我们的生活。正如以前的电脑和智能手机一样。 纵观这些新型平台的发展,我们不难发现,它们与半导体技术始终呈现齐头并进的局面。 一方的成长带动了另一方的变化,并激发了新的发展动力,从而产生了对下一次创新的需求。

以多种领先的半导体产品和技术为依托,三星为更高端人工智能在多种场景中的顺利应用奠定了稳固的基础。生成式AI现已成为全世界的焦点,若要打造与之相当的巨型AI,高速处理海量数据的能力是必不可少的。但现有的计算结构面临诸多限制,在这种情况下,急需新型内存技术的保驾护航。

HBM-PIM (Processing-In-Memory) 通过让超高速内存HBM (High Bandwidth Memory) 本身承担部分计算功能,将以CPU为中心的集中式计算处理过程转变为分散式。 在传统架构中,计算的工作仅由CPU负责;但在改变后的架构中,内存也会承担部分计算功能,从而可以显著提高的数据整体处理能力,HBM-PIM也成为名副其实的新一代内存技术。

以用于生成式AI的语言模型为例,据估计,80%以上的计算功能都可以通过应用 PIM来加速。 计算应用HBM-PIM后得到的性能提升效果可以发现,与使用HBM和GPU加速器时相比,AI模型的性能提升了3.4倍甚至更多。

CXL-PNM (Processing-Near-Memory)和上文提到的HBM-PIM一样,是在存储器半导体上搭载运算功能的技术,通过在更靠近内存的地方执行运算功能,减少CPU 和内存之间的传输数据带来的瓶颈,并尽可能提升CPU的运算处理功能。

基于CXL的PNM解决方案采用易于添加内存容量的CXL接口,可提供的容量达到传统GPU加速器的四倍。 它适用于一次性处理满足各种客户需求的AI模型,也可用于巨型AI语言模型。 此外,与使用PCIe接口的加速器相比,AI模型的加载速度也快了2倍以上。

三星电子以开源方式对外发布了HBM-PIM和CXL-PNM解决方案,以及支持该解决方案的软件、运行方法、性能评估环境等内容,不断努力扩大AI内存生态系统。 Exynos处理器搭载了先进的嵌入式神经网络处理器 (NPU),可实现更强大、更高效的端侧AI。同时,LPDDR5等内存解决方案针对打造AI系统所需的高性能处理也进行了优化。

...全文
42 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
完美句号 存内计算大使 02-11
  • 打赏
  • 举报
回复 1

建设存内计算开发者社区

完美句号 存内计算大使 02-11
  • 打赏
  • 举报
回复 1

建设存内计算开发者社区

完美句号 存内计算大使 02-10
  • 打赏
  • 举报
回复 1

建设存内计算开发者社区

百度联合清华大学发布了《产业智能化白皮书——人工智能产业化发展地形初现端倪》(以下简称《白皮书》)。 据了解,这份长80页、两万余字的《白皮书》,全面阐述了对产业智能化的战略思考和商业实践方法论,全书分为研究篇和商业实践篇两大部分,实践篇调研了人工智能走出实验室后的产业应用,展现了AI技术与产业的融合程度。 研究篇:人工智能产业化成熟度研究报告 1、人工智能概述:从实验室到产业应用 从20世纪50年代起,人工智能的方法、研究路径经历了好几次重大变化,行业发展也经历了好几次兴衰循环。当前新一轮快速发展,人工智能正从实验室走向广泛的产业应用。 当前人工智能技术在很多产业和领域中已经得到广泛应用人工智能产业化发展的地形已经初现端倪。 从产业角度看,人工智能技术按照结构划分为基础层、算法层、技术 层和应用层。 当前人工智能发展浪潮主要有4个驱动因素: 1.全球数据量爆发性增长 2.计算能力提升 3.算法的进步 4.政策支持、科技巨头和资本追逐 中美两国是人工智能发展最领先的国家,也是推动人工智能产业化最活跃的国家。人工智能技术的产业化将是中国的重要机遇。AI技术在医疗健康、金融、商业、教育、工业和安防 各个领域得到越来越多的广泛应用。中国巨大的市场,人工智能有着异常丰富的应用前景。 2、TUMC模型:新兴技术产业化成熟度的评估框架 目前,人工智能的增长不断加速,正在逼近产业化应用爆发的“临界点”。衡量人工智能技术的产业化成熟度,无论对于企业家、研究者还是国家相关 产业政策的制定者都具有重要意义。 TUMC模型是一个基于战略节奏理论,从产业演进视角研究新产业成熟度和新兴技术产业化成熟度的工具。 战略节奏理论将产品市场的发展分为小众市场、大众市场、分众市场和杂合市场4个阶段。TUMC模型AI技术应用的研究焦点放在“尚未进入小众市场”到“即将开启大众市场”的阶段上。 TUMC模型综合考察技术、用户效用、市场以及产业链4个维度: 1.技术:实现商业化的性能阈值 2.用户效用:特定场景中的特定价值 3.市场:市场起飞的关键规模 4.产业链:新的分工协作系统
面对AI时代的到来,以及最近如火如荼的chartGPT浪潮,我们这些职场小白,不懂点AI是怎么变得这么聪明,好像就对不起这个身处的时代。其实,AI的学习模式并没有那么难,职场小白们花五分钟时间都能理解。 机器学习是人工智能的一个分支,它通过数据、算法和计算资源来让计算机自己学习,从而达到某种目标。在机器学习中,监督学习、无监督学习、自监督学习和强化学习是四种主要的学习模型。 监督学习是一种有监督的学习方式,指给计算机大量数据样本和其对应的标签或输出,让计算机学习如何将输入与输出联系起来,以便于下次遇到新的数据时做出准确的预测,有点类似于,小学老师教小孩写汉字,你们必须按照一定的规范来写。这种学习模型需要大量的有标签的数据进行训练,成本相对较高。监督学习的优点是可以实现准确的预测和分类,适用领域广泛。例如,在医疗领域,监督学习被广泛应用于癌症诊断。医生会收集大量患者的病理数据,并为其打上是否有癌症的标签。然后利用监督学习的方法,让计算机自动地学习如何根据病理数据来预测是否患有癌症。 但是监督学习也存在一些不足之处,例如需要手动标记大量的数据样本,并且成本相对较高。同时,在某些场景下难以收

74

社区成员

发帖
与我相关
我的任务
社区描述
首个存内开发者社区,是整合产学研各界资源优势,搭建的学习与实践平台,提供存内架构学习,平台算法部署实践,存内计算线下训练以及AI时代大模型追踪,从理论到实践,供开发者体验未来第三极算力架构。
其他 企业社区
社区管理员
  • 存内计算开发者
  • Hundred++
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  • 积分规则:

 

创作积分:

1,发布文章获取20积分

2,文章内容加精30积分

互动积分:

1,发布评论互动积分:2积分

2,点赞文章获取积分:1积分

 

  • 积分兑换:

100积分 兑换品牌赞助托特包 (每个ID限定5份)

600积分 兑换Cherry Mix3.0键盘 (每个ID限定4份)

1200积分 兑换Switch (每个ID限定2台)

试试用AI创作助手写篇文章吧