侵权投诉
搜索
更多>> 热门搜索:
订阅
纠错
加入自媒体

技术解析|Arm C1集群的性能:智能设备AI处理能力大幅提升!

2025-09-17 13:57
芝能智芯
关注

芝能智芯出品

AI时代的计算新引擎随着手机、平板和可穿戴设备越来越“聪明”,CPU架构的进化成了行业焦点。Arm技术日上详细介绍了Arm C1的CPU内容,

2025年,Arm推出的C1 CPU集群基于最新的Armv9.3架构,在单线程性能上大幅提升,通过全新矩阵扩展(SME2)让AI任务处理能力飞跃,覆盖从旗舰手机到智能手表的各种设备。

C1集群由Ultra、Premium、Pro和Nano四种核心加上一个共享单元(DSU)组成,灵活适配不同场景。

Part 1

核心设计:

从旗舰到入门的全能选手

C1集群的魅力在于它的“模块化”设计——不是单一的处理器,而是一个由四种核心和一个共享单元组成的灵活组合。这种设计让芯片厂商可以根据设备需求自由搭配,从高端旗舰到低功耗手表都能找到最佳方案。

C1-Ultra:性能王者

C1-Ultra 为旗舰设备打造。相比上一代的Cortex-X925,单线程性能提升了25%,得益于更宽的指令流水线、更聪明的乱序执行和升级的预取技术。无论是运行大型游戏还是处理复杂AI模型,Ultra都能保持流畅不降速。

它还首次全面支持SME2矩阵指令集,让AI推理速度大幅提升,比如语音识别和图像处理任务快了近5倍。

不过,Ultra追求的是极致性能,芯片面积和功耗都不低,适合旗舰手机的“性能担当”。

C1-Premium:旗舰的性价比之选 

Premium核心定位稍低,但性能接近Ultra,同时芯片面积缩小了35%,通过精简缓存和向量单元实现成本控制。

这让它成为次旗舰设备的理想选择,比如“2 Premium + 6 Pro”的配置,能在AI任务和多媒体处理中游刃有余,同时降低芯片制造成本和功耗。

C1-Pro:中端市场的多面手

C1-Pro是中高端设备的主力。相比Cortex-A725,它在同频率下性能提升16%,功耗降低12%,得益于更精准的分支预测和更高的内存带宽效率。

它还支持面积优化(AO)选项,让芯片厂商能在有限空间内塞下更多算力。比如在“4 Pro + 4 Nano”的中端手机配置中,Pro核心既能应付日常任务,又能加速AI推理,性价比极高。

C1-Nano:低功耗的续航专家

Nano核心专为智能手表或入门手机设计,相比Cortex-A520能效提升26%,性能微增5.5%,芯片面积还缩小了2%。

它通过优化指令绑定和缓存访问,减少对内存的依赖,让设备续航轻松达到几天甚至一周,特别适合低功耗场景。

共享单元(DSU),C1的DynamIQ共享单元(DSU)就像核心间的“交通枢纽”,负责缓存一致性和内存调度。

新版DSU功耗降低11%,休眠模式下内存能耗降7%,带宽也大幅提升,支持多核心同时处理AI推理或视频渲染。

芯片厂商因此可以在扩展性能的同时,控制整体功耗。

C1集群通过四种核心的分工合作,覆盖了从旗舰到入门的各种需求。Ultra主攻性能,Premium优化成本,Pro平衡算力,Nano专注续航,而DSU让它们无缝协作。这种灵活设计不仅提升了性能和效率,还为未来的异构计算留下了想象空间。

Part 2

AI加速:

让每台设备都“聪明”起来

C1集群的最大亮点,莫过于SME2(Scalable Matrix Extension 2)的加入,矩阵计算引擎直接嵌入CPU指令集,让AI任务无需依赖外部芯片,速度更快、能耗更低。

相比上一代,SME2在功能、效率和兼容性上全面升级,支持更复杂的数据类型和运算,覆盖从机器学习到高性能计算的多种场景。

测试数据显示,语音识别延迟从1.5秒降到0.3秒,速度提升近5倍;在大语言模型Gemma3上,推理速度从84 Tok/s飙升到398 Tok/s。

能效方面,SME2让AI任务的功耗降低约三分之一,比如生成音频的耗时从27秒缩短到9.7秒,电量消耗也大幅减少。更重要的是,SME2让AI不再是旗舰设备的专属。

中端手机和入门设备也能通过C1-Pro或Nano核心运行语音助手、实时滤镜等AI功能。配合SVE2向量扩展和KleidiAI软件框架,开发者无需额外适配,就能在主流AI工具上获得加速,极大降低了开发门槛。

C1还加入了内存安全机制(MTE),保护语音助手、个性化推荐等敏感数据的隐私。

这对AR眼镜、实时视频处理等场景尤其关键,因为这些应用需要低延迟和高安全性。相比传统的NPU或DSP方案,SME2直接集成在CPU内核,省去了数据传输的开销,让实时交互更顺畅。

从市场角度看,C1的灵活配置让AI普及成为可能。

 旗舰设备用“2 Ultra + 6 Pro”追求极致体验;

 中端Chromebook用“4 Pro + 4 Nano”实现高性价比;

 可穿戴设备用“2 Pro + 4 Nano”兼顾性能和续航。

这种分层设计,不仅提升了用户体验,也为芯片厂商提供了更多选择。

小结

Arm C1集群是移动计算迈向AI时代的设计,用Ultra、Premium、Pro和Nano四种核心,搭配升级的DSU,实现了性能、能效和成本的巧妙平衡。SME2的加入让AI推理速度和效率大幅提升,从旗舰手机到智能手表都能享受“聪明”体验。 

       原文标题 : 技术解析|Arm C1集群的性能:智能设备AI处理能力大幅提升!

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    通信 猎头职位 更多
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号