连接与计算,是通信技术与智能技术的代称,新一代AI技术席卷之下,一切用户体验和商业逻辑都在被重构,就少不了连接与计算的力量,而手握这两种技术,高通自然使命必达。
在峰会开场时,高通公司总裁兼CEO安蒙花了大量篇幅,阐述了对下一代AI和人机交互方式变革的理解。
安蒙提及了一个银行App的例子。每个人手机中的银行App,都有同样繁琐的页面,但是未来在AI的帮助下,用户与银行App的交互完全可以用自然语言来完成,比如“帮我把这个单买了吧。”“我的本期账单是多少?”“什么储蓄计划适合我?”用户只需要用语言表达,AI就会自动完成操作。甚至用户在网上购物,只需要问购物App,“我想用我的借记卡购买,我的钱够吗?”购物App会自动关联到银行App,评估你的财力情况,在自动付款的同时也避免冲动消费。
首先AI要理解人的输入/输出(I/O),包括语言、触摸、空间环境等,所有这些都会进入AI Agent(智能体);然后Agent理解用户的个性化数据,包括工作、娱乐、健康各种,再通过一系列多模态模型,最终所有的体验都是个性化且人性化的体验。这种体验,就打破了传统App的孤岛,App之间将会自由联动。
为了让大家更易理解这种巨变,此处引用高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)在会后与科技行者的采访所说:
自智能手机问世以来,人机交互一直依赖双手,而有了利用规划器、智能体化AI处理,App在某种程度上被隐藏了起来,用户不再需要在手机中频繁切换不同的应用。“虽然高通并不设计终端,但随着这样的全新技术出现,未来可能会有新的终端产品形态,或者智能手机是否还会继续存在还是个未知数。随着用户交互方式的变革,这应该是很多终端设备厂商,尤其是手机厂商亟待思考的问题。”
“我们看到了未来,未来即将实现,骁龙一定会帮大家把最好的技术落地,把明天的体验带到今天,把不可能变为可能。”安蒙强调。
而回应这句话最好的诠释,就是首先要有一颗“AI优先”的芯。
高通技术公司手机、计算和XR事业群总经理阿力克斯·卡图赞(Alex Katouzian)登台,以一句话控场,也为他接下来的发布定调——“我们不满足于渐进式提升(所谓的挤牙膏),高通希望打造一款全新的产品。”
去年骁龙峰会上,高通就剧透了骁龙X Elite,而在今年,高通正式发布新一代移动平台:“Snapdragon 8 Elite”,中文命名“骁龙8至尊版”。
性能方面总结而言,骁龙8至尊版采用台积电第二代3nm工艺,搭载了第二代高通Oryon CPU、高通Adreno GPU、增强的高通Hexagon NPU,三者各司其职。而提到这三者的互相作用,高通技术公司产品管理高级总监Siddhika Nevrekar打了个形象比喻:
假设高通AI引擎是一个交响乐团,Oryon CPU就是一位出色的指挥家,指挥每个音符、每个节奏、每个乐器创作出完美的AI交响乐;而Hexagon NPU就是那位出色的小提琴手,它将在AI最激烈的演奏中,成为舞台焦点。
接下来我们一一道来。
1、 Oryon CPU:满足特殊计算需求
大家知道,CPU对于管理系统层面的处理相当重要,它能执行来自应用程序、操作系统和用户输入的指令,也能运行高端游戏、视频剪辑软件、AR、AI、安全等复杂应用。
首先在微架构方面,骁龙8至尊版搭载了2个超级内核(Prime)+6个性能内核(Performance Core),「超级内核」的最高主频达4.32GHz,以应对需要更快响应速度的密集型应用;「性能内核」的最高主频达3.53GHz,每个性能内核都经过调优,负责运行最密集型的应用程序,同时具有极高能效。
为了进一步证明Oryon CPU的强劲性能,高通也亮出了一系列基准测试。对比第三代骁龙8,骁龙8至尊版商用机在单线程和多线程基准测试中,单核性能提升45%、多核性能提升45%、能效提升44%。
此外还有Speedometer基准测试。这里有必要提一下Speedometer,它是用于衡量网页浏览等日常用例用户体验的测试工具,网页浏览看似平淡无奇,但它却是大家使用最频繁的应用,它会影响页面加载、快速转换、流畅滚动和后台计算等体验,还影响搜索、购物、研究和学习等日常体验,以及微信等应用内集成的体验。在该测试中,Oryon CPU浏览器上网性能提升62%(据说这是一个跨代际的提升)、能效提升45%。
高通Oryon CPU大放异彩的另一个领域是大幅改进的「内存架构」,通过采用最大的缓存来增强每一个CPU丛集——每个丛集都拥有12MB的二级缓存,总计24MB紧密耦合的专用缓存。
当然,CPU并不是骁龙8至尊版唯一重新设计的组件,Adreno GPU也是完全重新设计。高通技术公司产品市场经理Matt Grossman介绍说,“Adreno GPU在开发时,就充分考虑到手游玩家的需求,针对现代图形工作负载进行调优,能够提供基于着色处理器的独立内核,从而实现更佳工作分配和并发性能。”对于图形密集型游戏,其性能将提升40%,功耗降低40%,骁龙8至尊版的光追性能提高了35%。
3、 Hexagon NPU:带来更智能的交互为了把端侧AI践行到底,高通一直在磨练高通AI引擎,而它的核心,正是Hexagon NPU。Hexagon NPU这次也有重大改进:首先,所有内核的吞吐量都更强了,以实现更快的AI推理性能;其次,标量和向量的内核都增加了,向量加速器有6个核心,标量加速器则有8个核心,以满足生成式AI运算需求,支持更长上下文。与第三代骁龙8相比,全新架构的Hexagon NPU性能提升45%,能效提升45%。结合提升的CPU和GPU,骁龙8至尊版能够跨所有核心动态管理AI负载。
或许在以前,当人与AI助手聊天时,AI响应的第一步,是先把语音转文本,再让语言模型通过文本看懂;而现在有了多模态模型,就能省掉这一步。
为了让大家更易理解AI智能体,高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)在会后采访中举例说道,比如我拿起手机说:“今晚帮我订一个墨西哥菜餐厅,距离不要太远,评分要高,到店时间预计晚上7点30到8点30之间,而且得是我过去三个月没有去过的餐厅。”
要回答这个问题,智能体会调用各种模型来处理,包括位置信息、个人知识图谱等,而个人知识图谱,是存储在终端侧的用户情境信息(例如喜欢的饮食、锻炼习惯、常用联系人和消息、过往偏好历史),从而帮助手机理解用户意图。
“每个厂商都有不同的方向来打造智能体。”马德嘉说道,高通有非常广泛的AI合作伙伴,包括Meta、IBM、Mistral、OpenAI、谷歌、智谱、腾讯、百川等。“我相信未来会出现定制的专用智能体,而高通旨在为构建高效的智能体体验,提供所需的底层软件技术支持。”
在生成式AI的表现方面,Hexagon NPU在基础大语言模型上的token生成速率提升了100%;在快速响应方面,在一些主流的大语言模型上,骁龙8至尊版的处理速度超过70 tokens/秒。除了文字和语音交互,AI助手首次可以完全在终端侧,通过摄像头“看到”用户所看到的内容,如此一来,用户可以通过相机或传感器,与AI助手实时互动。
我们对AI-ISP进行优化,将ISP吞吐量提高了近35%,能效提升25%。通过这一提升,用户可以利用三个4800万像素传感器同时进行拍摄,也能实现完美的抓拍,包括拍快速移动的的宠物。
从移动计算中枢,到AI Hub:霸屏的好友圈里不止是手机
在当下的芯片格局下,让人惊讶的变化,似乎成了最不会让人惊讶的事情,前有Intel和AMD历史性地联手打造X86生态,后有高通自研芯片架构与好友圈技术共舞。
因为仅凭硬件,无法打造出强大的AI。就好比一辆赛车,油箱里没有油,一切都是空谈,所以高通这次基于骁龙8至尊版,也大力改进了AI软件。
高通用AI Hub软件栈,是一套帮助厂商、开发者实现最优化性能表现的工具,充分利用包括CPU、GPU和NPU在内的异构计算技术,所以无论是在手机、PC、汽车、XR任何领域的开发者,都可以用高通AI Hub实现开发自由。
从“至尊版”的命名不难看出,这两款骁龙汽车平台也采用了高通自研且专为汽车定制的最新一代Oryon CPU,同时配备了面向汽车应用设计的Adreno GPU、以及面向多模态AI设计的专用神经网络处理器Hexagon NPU,三大部分都完成了自研。
据高通技术公司汽车、行业解决方案和云事业群总经理Nakul Duggal介绍,与前代产品骁龙8295芯片相比,这次骁龙至尊版汽车平台CPU性能提升3倍、GPU性能提升3倍,NPU的AI性能提升了12倍。可以支持超过40个多模态传感器,包括多达20个高分辨率摄像头,实现360度全方位覆盖和车内监测。
骁龙移动平台好友圈
骁龙汽车平台好友圈
“当你拿起任何一款基于骁龙打造的旗舰智能手机,都会发现里面有超过40个组件来自高通,包括射频收发器、电源管理、超声波指纹识别等组件”,高通技术公司高级副总裁兼手机业务总经理Christoper Patrick总结说道,高通提供的是全面的系统解决方案。这也应了高通的那句话“Snapdragon is everywhere(骁龙无处不在)”。
(作者周雅 来源科技行者)