高通骁龙进化的最佳写照: AI千里之行始于足下

　　从“无线通信公司”转型为面向新一代AI处理时代的“连接计算公司”，在过去很长一段时间以来，都是高通标榜自身的主基调，而今年在夏威夷茂宜岛如期举行的骁龙峰会，话题正是从这一基调展开。

连接与计算，是通信技术与智能技术的代称，新一代AI技术席卷之下，一切用户体验和商业逻辑都在被重构，就少不了连接与计算的力量，而手握这两种技术，高通自然使命必达。

在峰会开场时，高通公司总裁兼CEO安蒙花了大量篇幅，阐述了对下一代AI和人机交互方式变革的理解。

　　当AI出现时，人们问的最多的问题莫过于，AI的Killer App(王牌应用)是什么?安蒙随后说道，AI不存在Killer App的思维定式问题，因为AI变革的是人与计算机的交互方式，让计算机可以理解人的所见所闻、所思所想，所以，未来会出现成千上万的应用，而所有的应用都可以是王牌应用。

安蒙提及了一个银行App的例子。每个人手机中的银行App，都有同样繁琐的页面，但是未来在AI的帮助下，用户与银行App的交互完全可以用自然语言来完成，比如“帮我把这个单买了吧。”“我的本期账单是多少?”“什么储蓄计划适合我?”用户只需要用语言表达，AI就会自动完成操作。甚至用户在网上购物，只需要问购物App，“我想用我的借记卡购买，我的钱够吗?”购物App会自动关联到银行App，评估你的财力情况，在自动付款的同时也避免冲动消费。

　　这背后的一切，是“AI优先(AI First)”的体验，高通用一张图，具像化了这种AI变革体验。

首先AI要理解人的输入/输出(I/O)，包括语言、触摸、空间环境等，所有这些都会进入AI Agent(智能体);然后Agent理解用户的个性化数据，包括工作、娱乐、健康各种，再通过一系列多模态模型，最终所有的体验都是个性化且人性化的体验。这种体验，就打破了传统App的孤岛，App之间将会自由联动。

　　这将是一个巨变，会改变所有架构，包括操作系统、应用商店、算力平台等。用户可以有很多选择，选择更喜欢的Agent，选择更适合你的工作生产力、娱乐方式，数字生活。

为了让大家更易理解这种巨变，此处引用高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)在会后与科技行者的采访所说：

自智能手机问世以来，人机交互一直依赖双手，而有了利用规划器、智能体化AI处理，App在某种程度上被隐藏了起来，用户不再需要在手机中频繁切换不同的应用。“虽然高通并不设计终端，但随着这样的全新技术出现，未来可能会有新的终端产品形态，或者智能手机是否还会继续存在还是个未知数。随着用户交互方式的变革，这应该是很多终端设备厂商，尤其是手机厂商亟待思考的问题。”

　　在骁龙峰会2024期间，科技行者采访高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)

“我们看到了未来，未来即将实现，骁龙一定会帮大家把最好的技术落地，把明天的体验带到今天，把不可能变为可能。”安蒙强调。

而回应这句话最好的诠释，就是首先要有一颗“AI优先”的芯。

　　自研芯片架构，未来都是“至尊版”

高通技术公司手机、计算和XR事业群总经理阿力克斯·卡图赞(Alex Katouzian)登台，以一句话控场，也为他接下来的发布定调——“我们不满足于渐进式提升(所谓的挤牙膏)，高通希望打造一款全新的产品。”

高通技术公司手机、计算和XR事业群总经理阿力克斯·卡图赞(Alex Katouzian)

去年骁龙峰会上，高通就剧透了骁龙X Elite，而在今年，高通正式发布新一代移动平台：“Snapdragon 8 Elite”，中文命名“骁龙8至尊版”。

　　这次的命名没有延续传统，而是来个画风转变，是因为它与骁龙X Elite(骁龙的PC处理器)一样，也用了高通自研的Oryon CPU架构，区别是，这次进化到了第二代Oryon。按照高通的命名规则，Elite就代表了旗下性能最强的旗舰产品。这些年来，高通一直在加大自研技术投资，Oryon CPU就是在这一背景下诞生，它由高通收购的初创团队Nuvia开发，该团队领导者正是前任苹果首席芯片架构师Gerard Williams。

　　Oryon CPU是骁龙8至尊版的“王炸”，相当于是是给移动端处理器奉上桌面级CPU。高通技术公司高级副总裁兼手机业务总经理Christoper Patrick在随后的介绍中直指，“Oryon完成了高通整个SoC的最后一块拼图。”

性能方面总结而言，骁龙8至尊版采用台积电第二代3nm工艺，搭载了第二代高通Oryon CPU、高通Adreno GPU、增强的高通Hexagon NPU，三者各司其职。而提到这三者的互相作用，高通技术公司产品管理高级总监Siddhika Nevrekar打了个形象比喻：

假设高通AI引擎是一个交响乐团，Oryon CPU就是一位出色的指挥家，指挥每个音符、每个节奏、每个乐器创作出完美的AI交响乐;而Hexagon NPU就是那位出色的小提琴手，它将在AI最激烈的演奏中，成为舞台焦点。

接下来我们一一道来。

1、 Oryon CPU：满足特殊计算需求

大家知道，CPU对于管理系统层面的处理相当重要，它能执行来自应用程序、操作系统和用户输入的指令，也能运行高端游戏、视频剪辑软件、AR、AI、安全等复杂应用。

　　第二代高通Oryon CPU有两个重要创新，其一是面向移动端设计的全新微架构，其二是大幅改进的内存架构。

首先在微架构方面，骁龙8至尊版搭载了2个超级内核(Prime)+6个性能内核(Performance Core)，「超级内核」的最高主频达4.32GHz，以应对需要更快响应速度的密集型应用;「性能内核」的最高主频达3.53GHz，每个性能内核都经过调优，负责运行最密集型的应用程序，同时具有极高能效。

　　这里值得注意，骁龙的几代更新已经逐渐减少了效率内核，直到今天被性能内核完全取代。因为后者能提供最佳的性能和功耗组合，更适合这个AI时代的实际用例，所以效率内核就退出历史舞台了。

为了进一步证明Oryon CPU的强劲性能，高通也亮出了一系列基准测试。对比第三代骁龙8，骁龙8至尊版商用机在单线程和多线程基准测试中，单核性能提升45%、多核性能提升45%、能效提升44%。

　　阿力克斯·卡图赞在现场打趣说，“所有这些基准测试，都是基于高通的参考设计在实际室温环境下完成，不同于其他厂商在冷冻环境中运行以获得更高性能。”

此外还有Speedometer基准测试。这里有必要提一下Speedometer，它是用于衡量网页浏览等日常用例用户体验的测试工具，网页浏览看似平淡无奇，但它却是大家使用最频繁的应用，它会影响页面加载、快速转换、流畅滚动和后台计算等体验，还影响搜索、购物、研究和学习等日常体验，以及微信等应用内集成的体验。在该测试中，Oryon CPU浏览器上网性能提升62%(据说这是一个跨代际的提升)、能效提升45%。

高通Oryon CPU大放异彩的另一个领域是大幅改进的「内存架构」，通过采用最大的缓存来增强每一个CPU丛集——每个丛集都拥有12MB的二级缓存，总计24MB紧密耦合的专用缓存。

　　此外，考虑到生成式AI高度依赖内存，骁龙8至尊版配备了目前最高速的LPDDR5内存，实际频率5333MHz，等效于10.7GHz。以上，第二代Oryon CPU在微架构和内存方面的升级，让骁龙8至尊版可以带来更快的应用启动、多任务处理很丝滑、以及先进的生成式AI功能。从中受益最大的用例之一——游戏。骁龙8至尊版基于Oryon CPU带来的能效提升，可以将游戏时长延长2.5小时，同时不妥协流畅的游戏体验。实际用例上，针对虚幻引擎的Chaos Physics系统，Oryon CPU可以直接在终端侧实时模拟物理系统，且能在5毫秒时延内，处理超过1000个物体破坏和碰撞的情景。

　　2、 Adreno GPU：带来高保真图形

当然，CPU并不是骁龙8至尊版唯一重新设计的组件，Adreno GPU也是完全重新设计。高通技术公司产品市场经理Matt Grossman介绍说，“Adreno GPU在开发时，就充分考虑到手游玩家的需求，针对现代图形工作负载进行调优，能够提供基于着色处理器的独立内核，从而实现更佳工作分配和并发性能。”对于图形密集型游戏，其性能将提升40%，功耗降低40%，骁龙8至尊版的光追性能提高了35%。

　　除了性能提升之外，高通还在强强联合，带来绝佳游戏体验。现场，骁龙游戏工作室与Feral Interactive合作，将于12月推出《超级房车赛：传奇(Grid Legends)》移动版，它在骁龙8至尊版上，能够以2倍帧率运行，且将独家支持高通自适应性能引擎4.0。在不断追求“重新定义移动游戏”的过程中，高通与网易伏羲实验室合作，在《永劫无间》手游中，玩家可以用语音与AI队友互动，这些AI队友化身“神队友”，向新玩家提供策略来玩游戏。而且，双方还实现了首个游戏内终端侧大模型，这意味着，AI队友可以针对独特问题，进行定制化对话或给出建议。

　　更进一步，高通还在瞄准下一代游戏体验。虚幻引擎5的Nanite解决方案将首次在移动端运行，且仅在骁龙平台上运行，目前骁龙8至尊版可以支持在移动游戏中渲染电影级质量的3D环境。

3、 Hexagon NPU：带来更智能的交互为了把端侧AI践行到底，高通一直在磨练高通AI引擎，而它的核心，正是Hexagon NPU。Hexagon NPU这次也有重大改进：首先，所有内核的吞吐量都更强了，以实现更快的AI推理性能;其次，标量和向量的内核都增加了，向量加速器有6个核心，标量加速器则有8个核心，以满足生成式AI运算需求，支持更长上下文。与第三代骁龙8相比，全新架构的Hexagon NPU性能提升45%，能效提升45%。结合提升的CPU和GPU，骁龙8至尊版能够跨所有核心动态管理AI负载。

　　有了高通AI引擎，骁龙8至尊版可以在终端侧离线运行个性化、多模态、且安全的AI助手，这位AI助手也是全能助手，因为它的底层有多个模型在支撑，包括自动语音识别(ASR)、大语言模型(LLM)、大视觉模型(LVM)、多模态大模型(LMM)——这些模型，就像训练有素的团队一样运作，这就是异构计算的魔力。

或许在以前，当人与AI助手聊天时，AI响应的第一步，是先把语音转文本，再让语言模型通过文本看懂;而现在有了多模态模型，就能省掉这一步。

　　不要看这一小步，背后是效率提升的一大步。它带给用户最直观的感受，就是语音交互极速响应，几乎感觉不到延迟，就像和真人说话一样，AI助手能够立刻“听懂”人类语言。

为了让大家更易理解AI智能体，高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)在会后采访中举例说道，比如我拿起手机说：“今晚帮我订一个墨西哥菜餐厅，距离不要太远，评分要高，到店时间预计晚上7点30到8点30之间，而且得是我过去三个月没有去过的餐厅。”

要回答这个问题，智能体会调用各种模型来处理，包括位置信息、个人知识图谱等，而个人知识图谱，是存储在终端侧的用户情境信息(例如喜欢的饮食、锻炼习惯、常用联系人和消息、过往偏好历史)，从而帮助手机理解用户意图。

“每个厂商都有不同的方向来打造智能体。”马德嘉说道，高通有非常广泛的AI合作伙伴，包括Meta、IBM、Mistral、OpenAI、谷歌、智谱、腾讯、百川等。“我相信未来会出现定制的专用智能体，而高通旨在为构建高效的智能体体验，提供所需的底层软件技术支持。”

在生成式AI的表现方面，Hexagon NPU在基础大语言模型上的token生成速率提升了100%;在快速响应方面，在一些主流的大语言模型上，骁龙8至尊版的处理速度超过70 tokens/秒。除了文字和语音交互，AI助手首次可以完全在终端侧，通过摄像头“看到”用户所看到的内容，如此一来，用户可以通过相机或传感器，与AI助手实时互动。

　　比如吃完饭结账时，只要直接把摄像头对准收据和朋友们，AI助手就能扩展到翻译、汇率换算等相关任务，理解收据上的内容，计算每个人的分摊费用，相当高效。

　　除了AI助手之外，高通还在把Hexagon NPU与重新设计的AI-ISP结合，重新定义影像体验。以前，ISP会先处理图像，然后发送到NPU进行后处理。现在，NPU可以直接访问RAW原生传感器数据，在4K 60fps下实现基于AI的实时增强。

我们对AI-ISP进行优化，将ISP吞吐量提高了近35%，能效提升25%。通过这一提升，用户可以利用三个4800万像素传感器同时进行拍摄，也能实现完美的抓拍，包括拍快速移动的的宠物。

图：高通NPU支持的宠物摄影特性套件，让智能手机自动对焦跟踪宠物的眼睛。更夸张的是，手机还能观察宠物，在宠物看向镜头的一瞬间按下快门。在拍照之后，AI会继续工作，利用双摄背景虚化，智能增强细节，将照片变惊艳作品。

从移动计算中枢，到AI Hub：霸屏的好友圈里不止是手机

在当下的芯片格局下，让人惊讶的变化，似乎成了最不会让人惊讶的事情，前有Intel和AMD历史性地联手打造X86生态，后有高通自研芯片架构与好友圈技术共舞。

因为仅凭硬件，无法打造出强大的AI。就好比一辆赛车，油箱里没有油，一切都是空谈，所以高通这次基于骁龙8至尊版，也大力改进了AI软件。

高通用AI Hub软件栈，是一套帮助厂商、开发者实现最优化性能表现的工具，充分利用包括CPU、GPU和NPU在内的异构计算技术，所以无论是在手机、PC、汽车、XR任何领域的开发者，都可以用高通AI Hub实现开发自由。

　　在PC端。高通与微软持续合作，扩展面向Copilot+PC产品的AI功能。高通指出，PC用户90%的时间所使用的应用，都能够在骁龙X系列上原生运行，无论是“AI原生应用”还是“转译运行的应用”。高通支持数百款原生应用程序，包括Chrome、Google Drive、Photoshop、Lightroom、Express、Nord VPNs、Whatsapp、Zoom、Slack和Spotify等。

　　在XR端。目前骁龙赋能超过80款XR设备，高通与所有主流科技巨头OEM厂商和内容提供商合作创作，推动XR向前发展。

　　汽车端同样在进化。高通正在与各大汽车厂商一起，实现“AI上车”，用软件定义汽车。这次峰会现场，高通汽车产品路线图中的两款新品也一起亮相，一款是骁龙座舱至尊版平台(Snapdragon Cockpit Elite)，另一款是骁龙Ride至尊版平台(Snapdragon Ride Elite)。

　　值得一提的是，在汽车相关的会议环节，当理想和长城等中国汽车厂商作为一股新面孔站在舞台中央，台下的全球媒体给予了超级热烈的掌声。喝彩中，中国媒体的自豪感油然而生。外国媒体说：“为什么我们的车就只是在搞车，中国的车在搞音乐搞哲学。”对此，中国媒体同行纷纷交换意见，就喜欢看外国友人“没见过世面”的样子。

　　理想汽车战略采购负责人吴佐民用三个关键词介绍理想汽车。首先是「目标市场」：汽车是服务于全家人的综合空间，基于该理念，理想汽车定义了可满足用户需求的产品。第二个关键词是「电动化」。理想认为电动化有两条技术路径：REEV、HPC BEV。REEV代表增程式电动车，而HPC BEV则意味着充电12分钟即可补能500公里。第三个关键词是「AI」，特别是应用于智能座舱和自动驾驶的AI，是理想汽车投入大量精力和资源的领域。

　　长城汽车首席技术官吴会肖现场介绍，基于骁龙8295芯片，长城汽车工程师利用其高性能和高算力开发咖啡智能全新座舱系统Coffee OS 3和“五好”智能座舱。

　　长城汽车这次空运过来即将发布的摩托车，是全球唯一一台2000毫升排量水平对置8缸发动机、配备8档DCT变速箱，搭载了骁龙8155芯片，配备了摩托车行业最大尺寸的12.3英寸LCD可触控仪表盘，支持OTA远程升级和语音助手等功能。

从“至尊版”的命名不难看出，这两款骁龙汽车平台也采用了高通自研且专为汽车定制的最新一代Oryon CPU，同时配备了面向汽车应用设计的Adreno GPU、以及面向多模态AI设计的专用神经网络处理器Hexagon NPU，三大部分都完成了自研。

据高通技术公司汽车、行业解决方案和云事业群总经理Nakul Duggal介绍，与前代产品骁龙8295芯片相比，这次骁龙至尊版汽车平台CPU性能提升3倍、GPU性能提升3倍，NPU的AI性能提升了12倍。可以支持超过40个多模态传感器，包括多达20个高分辨率摄像头，实现360度全方位覆盖和车内监测。

　　技术参数相当能打，高通的技术交付，也同样亮眼。我们了解到，全新平台拥有灵活架构，可为汽车制造商提供多样化选择，可以通过骁龙座舱至尊版打造数字座舱，通过骁龙Ride至尊版实现智能驾驶，或者，可以在单一芯片组上同时支持数字座舱和智能驾驶。其中，Snapdragon Ride至尊版支持多个多模态传感器同时运行，实现基于AI的端到端传感器融合，能够生成高度精确和可靠的360度全方位车外覆盖视图。同时，Snapdragon Ride至尊版也能运行大型端到端Transformer等算法，处理数据并做出L3和L4级智能驾驶的实时决策，比如A辆车作出实时减速决策，避免了与闯红灯的B辆车碰撞。

　　但是，将AI引入汽车，需要多种工具，为了确保汽车制造商和开发者能够用这些AI工具。高通AI Hub，能够帮汽车制造商找到合适的AI模型，处理大量的车辆传感数据，并决定哪些模型可以并行运行。通过高通AI Hub，开发者可以从骁龙汽车平台中选择AI模型，也可以引入自主模型(BYOM)并进行优化，还可以用自己的数据来训练这些模型。

　　这里让我想到安蒙开场演讲时所说的一句话：“骁龙会一起进化，不仅引领了移动领域的创新步伐，还改变了很多其他行业的创新步伐。”再反观现场，无论是各领域巨头的站台，还是满屏放不下的高通在各领域的好友圈，无一不在证明骁龙的价值。

　　骁龙峰会2024现场，为高通骁龙站台的合作伙伴包括：微软、Meta、小米、OpenAI、BestBuy、三星、奔驰、宝马、理想、、长城汽车、通用汽车

骁龙移动平台好友圈

骁龙汽车平台好友圈

　　“当你拿起任何一款基于骁龙打造的旗舰智能手机，都会发现里面有超过40个组件来自高通，包括射频收发器、电源管理、超声波指纹识别等组件”，高通技术公司高级副总裁兼手机业务总经理Christoper Patrick总结说道，高通提供的是全面的系统解决方案。这也应了高通的那句话“Snapdragon is everywhere(骁龙无处不在)”。