技术解析|Arm C1集群的性能:智能设备AI处理能力大幅提升!
芝能智芯出品
AI时代的计算新引擎随着手机、平板和可穿戴设备越来越“聪明”,CPU架构的进化成了行业焦点。Arm技术日上详细介绍了Arm C1的CPU内容,
2025年,Arm推出的C1 CPU集群基于最新的Armv9.3架构,在单线程性能上大幅提升,通过全新矩阵扩展(SME2)让AI任务处理能力飞跃,覆盖从旗舰手机到智能手表的各种设备。
C1集群由Ultra、Premium、Pro和Nano四种核心加上一个共享单元(DSU)组成,灵活适配不同场景。

Part 1
核心设计:
从旗舰到入门的全能选手

C1集群的魅力在于它的“模块化”设计——不是单一的处理器,而是一个由四种核心和一个共享单元组成的灵活组合。这种设计让芯片厂商可以根据设备需求自由搭配,从高端旗舰到低功耗手表都能找到最佳方案。

C1-Ultra:性能王者
C1-Ultra 为旗舰设备打造。相比上一代的Cortex-X925,单线程性能提升了25%,得益于更宽的指令流水线、更聪明的乱序执行和升级的预取技术。无论是运行大型游戏还是处理复杂AI模型,Ultra都能保持流畅不降速。
它还首次全面支持SME2矩阵指令集,让AI推理速度大幅提升,比如语音识别和图像处理任务快了近5倍。
不过,Ultra追求的是极致性能,芯片面积和功耗都不低,适合旗舰手机的“性能担当”。

C1-Premium:旗舰的性价比之选
Premium核心定位稍低,但性能接近Ultra,同时芯片面积缩小了35%,通过精简缓存和向量单元实现成本控制。
这让它成为次旗舰设备的理想选择,比如“2 Premium + 6 Pro”的配置,能在AI任务和多媒体处理中游刃有余,同时降低芯片制造成本和功耗。

C1-Pro:中端市场的多面手
C1-Pro是中高端设备的主力。相比Cortex-A725,它在同频率下性能提升16%,功耗降低12%,得益于更精准的分支预测和更高的内存带宽效率。
它还支持面积优化(AO)选项,让芯片厂商能在有限空间内塞下更多算力。比如在“4 Pro + 4 Nano”的中端手机配置中,Pro核心既能应付日常任务,又能加速AI推理,性价比极高。

C1-Nano:低功耗的续航专家
Nano核心专为智能手表或入门手机设计,相比Cortex-A520能效提升26%,性能微增5.5%,芯片面积还缩小了2%。
它通过优化指令绑定和缓存访问,减少对内存的依赖,让设备续航轻松达到几天甚至一周,特别适合低功耗场景。

共享单元(DSU),C1的DynamIQ共享单元(DSU)就像核心间的“交通枢纽”,负责缓存一致性和内存调度。
新版DSU功耗降低11%,休眠模式下内存能耗降7%,带宽也大幅提升,支持多核心同时处理AI推理或视频渲染。
芯片厂商因此可以在扩展性能的同时,控制整体功耗。
C1集群通过四种核心的分工合作,覆盖了从旗舰到入门的各种需求。Ultra主攻性能,Premium优化成本,Pro平衡算力,Nano专注续航,而DSU让它们无缝协作。这种灵活设计不仅提升了性能和效率,还为未来的异构计算留下了想象空间。
Part 2
AI加速:
让每台设备都“聪明”起来
C1集群的最大亮点,莫过于SME2(Scalable Matrix Extension 2)的加入,矩阵计算引擎直接嵌入CPU指令集,让AI任务无需依赖外部芯片,速度更快、能耗更低。

相比上一代,SME2在功能、效率和兼容性上全面升级,支持更复杂的数据类型和运算,覆盖从机器学习到高性能计算的多种场景。
测试数据显示,语音识别延迟从1.5秒降到0.3秒,速度提升近5倍;在大语言模型Gemma3上,推理速度从84 Tok/s飙升到398 Tok/s。

能效方面,SME2让AI任务的功耗降低约三分之一,比如生成音频的耗时从27秒缩短到9.7秒,电量消耗也大幅减少。更重要的是,SME2让AI不再是旗舰设备的专属。
中端手机和入门设备也能通过C1-Pro或Nano核心运行语音助手、实时滤镜等AI功能。配合SVE2向量扩展和KleidiAI软件框架,开发者无需额外适配,就能在主流AI工具上获得加速,极大降低了开发门槛。
C1还加入了内存安全机制(MTE),保护语音助手、个性化推荐等敏感数据的隐私。
这对AR眼镜、实时视频处理等场景尤其关键,因为这些应用需要低延迟和高安全性。相比传统的NPU或DSP方案,SME2直接集成在CPU内核,省去了数据传输的开销,让实时交互更顺畅。
从市场角度看,C1的灵活配置让AI普及成为可能。
◎ 旗舰设备用“2 Ultra + 6 Pro”追求极致体验;
◎ 中端Chromebook用“4 Pro + 4 Nano”实现高性价比;
◎ 可穿戴设备用“2 Pro + 4 Nano”兼顾性能和续航。
这种分层设计,不仅提升了用户体验,也为芯片厂商提供了更多选择。

小结
Arm C1集群是移动计算迈向AI时代的设计,用Ultra、Premium、Pro和Nano四种核心,搭配升级的DSU,实现了性能、能效和成本的巧妙平衡。SME2的加入让AI推理速度和效率大幅提升,从旗舰手机到智能手表都能享受“聪明”体验。
原文标题 : 技术解析|Arm C1集群的性能:智能设备AI处理能力大幅提升!


分享














发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论