进博会:智慧产品都有强劲的“芯”
来源:中国电子报 更新时间:2023-11-15


第六届中国国际进口博览会(以下简称“进博会”)已经落下帷幕。如果说进博会是各行业智慧的结晶,那么进博会展出的集成电路产品,就是推动行业进步和个人消费品升级的“幕后英雄”。本届进博会上,各大IC厂商围绕消费电子、工业应用两大主题,展开了畅快淋漓的竞逐。

端侧人工智能掰手腕,谁赢了?

同样的AIGC(生成式人工智能)展示,不同的技术路线,几乎是此次进博会上用于个人电脑(PC)计算芯片的基本画像。在端侧人工智能应用的推动下,PC芯片厂商正将大模型推理功能移入个人电脑中,带动包括AIGC在内的多种功能走下云端。

文生图、图生图等AIGC功能展示几乎已经成为消费电子芯片厂商的标配。与网友们使用ChatGPT、Midjourney等在线AIGC工具的体验不同,此次进博会上,芯片厂商们纷纷展示了将AIGC功能落到本地的能力。

“上海有哪些好玩儿的?”

“上海的旅游景点非常丰富,包括东方明珠塔、南京步行街、外滩等。”

这是记者在英特尔展区与车载生成式AI语音助手的一段对话。每走到一处配备了文生文功能的展台,记者都会问AI这样一个问题。尽管收获的答案不尽相同,但上海的标志性景点几乎都涵盖其中。这个看似相似的功能,当记者与展商详细了解后,才发现其背后的技术是多线开花。

车载AIGC语音助手的算力中枢,是采用Intel 7制程的PC级别处理器。展区车辆将AI大模型装载于本地的能力,是通过优化集成CPU和GPU的能力实现的。在此基础上,用户还可以通过PCIE高速接口,在该平台上扩展独立显卡,通过集显+独显的方式提升座舱内的图像处理能力。

走到高通展台,记者看到了一个装配在手机里、可以“朗读”文字的数字人。“Nice to meet you!”记者在对话界面输入了这样一句话。一秒之后,这位穿着西装的数字人小姐姐便有模有样地将这句话读了出来,且口型对得分毫不差。

展台工作人员告诉记者,现场展示的手机里装配了第三代骁龙8移动平台。作为高通首个专为生成式AI打造的移动平台,第三代骁龙8在上月底刚刚发布,能够支持在终端侧运行100亿参数大模型。而能模仿人说话的数字人,相对于该硬件实力而言,可以说是“小菜一碟”。

相比于这些在原有芯片结构的基础上进行适应AI计算需求的升级改造的案例来说,AMD的改造更加“大刀阔斧”。展台工作人员向记者介绍,手提电脑芯片“CPU+GPU两核集成的方式”正在AMD发生革命性的变化——AMD把基于XDNA架构、用电路模拟人类的神经元和突触结构的AI引擎(APU)集成到笔记本电脑主控芯片中。这意味着在一台电脑中AI功能可以交给“专业的人”,CPU和GPU可以更专注于常规应用的计算和图形处理。这样做的好处是,可以帮助计算机系统提升处理AI卷积推理运算的效率。

记者在现场体验了搭载AMD Ryzen AI产品的笔记本电脑。笔记本原装摄像头可实现人像追踪——记者走到哪个方向,摄像头就会转到哪个方向。在此基础上还可以选择背景虚化。

工作人员介绍称:“这不是第三方提供的摄像头软件,就是Windows系统自带的摄像头。当然你也可以选择关上这个功能。”

工业智能化还能再进一步吗?

走到ADI展台,两只移动的啤酒杯引起了记者的注意。两个装满水的啤酒杯同时出发,以同样的速度从展台的一侧移动到另一侧,但一杯水摇摇晃晃,另一杯水则稳稳当当。

难道端水的背后也有黑科技?

看出记者的疑问,展台的工作人员向记者解释了背后的技术:驱动水平行进的电机称之为“步进电机”。想要步进电机平稳运行,需要设计一套好的运动控制轨迹曲线。运动控制轨迹曲线设计得好,相当于完美的运动控制完成了一半。电机的运动轨迹曲线包括梯形曲线和S形曲线,相较于梯形曲线,S形曲线更加平稳,能够削减加速度突变,更有效地减小冲击。ADI现场展示的展品采用了Trinamic伺服电机控制芯片,能将传统软件算法通过硬件来实现,让原本结构复杂的S形曲线变得易于实现,从而能使电机运行得更加平稳,也更加节能高效。在实际场景中,该技术可以帮助工业物料运输车快速、高效地移动重型载荷。

看一眼就知道物体与观察者距离的科技你听过吗?这项听上去很炫酷的技术其实离我们的生活和工作并不远。手机摄像头、家里的人脸识别自动门锁等很多场景中都有应用。这项技术简称“ToF”,全称是基于飞行时间的三维物体测量。该技术产品从外形上看与摄像头没什么不同。实际区别在于,可以呈现摄像头无法体现的景深数据。换句话来说,如果普通摄像头拍摄的是2D平面图片,那么ToF能够呈现的就是3D立体画面。

ADI此次展出技术,将这项此前大多在消费端应用的技术带到了工业领域。展台工作人员告诉记者,之所以要做这样的创新设计,是因为在工业领域看到了很多需求。例如在仓储环节,使用ToF就可以帮助判断货物与运输通道之间的距离,从而提高运输过程的安全性。

缺陷检测,是许多工业生产流程的必经环节。在工业检测流程中,对精确度要求越高的检测对象,对检测摄像头的精度要求越高,对人工智能的计算要求也就越高。在进博会瑞萨展台,工作人员告诉记者,对于那些对精确度要求很高的环节,其缺陷检测使用的是可拍摄几百万像素画面的摄像头,这样一来,人工智能检测对硬件算力便提出了更高的要求。瑞萨工作人员表示,现在许多工厂选择用PC或者服务器作为工作站,以实现设备精细化检测的要求。而瑞萨的此次参展,带来了基于ARM架构的小型化、轻量化工作站解决方案,帮助厂商节省了设备成本和人力成本。

数据中心算力瓶颈如何破?

在当前计算机采用的冯·诺依曼的体系架构下,计算和存储是分离的。一项任务的完成,既需要高算力,又需要大存储量和高效互联作为支持。长期以来,厂商对于处理器效率提升的关注点都放在了算力上。而大模型训练,动辄需要上千个甚至上万个算力芯片组成的集群。这使得原本没有特别受到重视的存储量和带宽一下子成为制约集群效率的瓶颈,也成为各厂商最为关注的技术指标。

算力的瓶颈,可以从两个层面去理解:一是能否提供足够的存储量;二是如何为大量数据的传输提供足够的带宽。而这些问题,记者在进博会美光公司的展台找到了答案。

至于如何提供足够存储量的问题,记者看到美光展出的最新256G CXL(Compute Express Link)内存扩展模组产品,其目标是解决服务器内存不足的问题,可通过热插拔实现与服务器CPU直连,这样一来,服务器的内存容量就被扩展了。

其中,该内存条采用的CXL技术引起了记者的注意。经过了解得知,CXL是一种新型的高速互联技术,旨在提供更高的数据吞吐量和更低的延迟,以满足现代计算和存储系统的需求。其目标是解决CPU和设备、设备和设备之间的内存鸿沟。举个简单的例子,服务器有巨大的内存池和数量庞大的基于PCIe运算加速器,每个上面都有很大的内存。内存的分割已经造成巨大的浪费、不便和性能下降。而采用CXL技术,能够解决内存一致性的问题——内存中的数据如果有更改,需要搬到CPU中计算后再送回存储单元中,但是采用了CXL技术之后,数据更改的计算和存储流程就被简化了。

关于突破存储限制的问题,美光还提供了自己的创新思路:给冷热数据分类,分别提供不同的存储产品:例如,配合更高性能和更“热”的数据,可以放在DRAM里随时调用,其距离CPU更近,计算更方便;相对地,更“冷”的数据就可以放在更远端的存储器中。根据这样的规则,对数据做逐级调用。而至于什么样的数据更“热”,什么样的数据更“冷”,则可以客户的需求判断。例如游戏数据,需要实时处理计算,就算“热”数据;而网盘数据,对实时性的要求更低,就算“冷”数据。

此外,美光还提供了数据分立的另一条创新思路:CXL产品若大面积推广,将可能改变整个服务器的架构,将计算、存储和IO过程实现分立,厂商调用资源将更加灵活,从而帮助云服务商优化其服务。 (记者 姬晓婷)