Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏 - OFweek通信网

更多>> 热门搜索：

当前位置： OFweek 通信网 > IT > 正文

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

2024-06-09 12:34

快科技6月7日消息，Intel官方宣布，旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2（Qwen2）的全球发布提供支持，已取得ModelScope、阿里云PAI、OpenVINO等诸多创新成果。

为了最大限度地提升诸通义千问2等大模型的效率，Intel进行了全面的软件优化，包括高性能融合算子、平衡精度和速度的先进量化技术等。

Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。

Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库、vLLM。

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

首先看Intel Gaudi AI加速器，专为生成式AI、大模型的高性能加速而设计，最新版的Gaudi Optimum可以轻松部署新号的大模型。

Intel使用Gaudi 2，对70亿参数、720亿参数的通义千问2模型的推理和微调吞吐量进行了基准测试，以下为详细性能指标和测试结果：

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

70亿参数通义千问2在单颗Gaudi 2加速器上的推理

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

720亿参数通义千问2在八颗Gaudi 2加速器上的推理

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

通义千问2 FP8在Gaudi 2加速器上的推理

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

通义千问2在Gaudi 2加速器上的微调

再看Intel至强处理器，作为通用平台具有广泛的可用性，适用于各个规模的数据中心，对于希望快速部署AI解决方案、没有专项基础设施企业非常理想。

至强处理器的每个核心都内置了Intel AMX高级矩阵扩展，可以处理多样化的AI工作负载，并加速AI推理。

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例，通义千问2的下一个推理token延迟情况。

最后是消费级的AI PC，可以在本地部署大模型，既然可以使用处理器内置GPU核显、NPU AI引擎，也可以搭配独立的锐炫显卡。

以下展示了AI PC运行15亿参数的通义千问2：

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

酷睿Ultra 7 165H上的通义千问2推理

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

酷睿 Ultra 7 165H上的通义千问2下一个token延迟

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

锐炫A770 16GB显卡上的通义千问2下一个token延迟

作者：上方文Q，来源：快科技

原文标题 : Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

立即登录即可访问所有OFweek服务

忘记密码

其他方式

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

最新活动更多

精彩回顾
立即查看>> 【在线直播】可视化神器！VisionSym 赋能汽车光学原型开发
精彩回顾
立即查看>> 【白皮书】电磁兼容解决方案-电能质量产品的应用
精彩回顾
立即查看>> 【限时免费】是德科技射频信号源白皮书
精彩回顾
立即查看>> 【线下会议】OFweek 2025（第十届）物联网产业大会
精彩回顾
立即查看>> 【白皮书】使用模拟源进行快速射频设备测试
精彩回顾
立即查看>> 芯智所向边缘无界—华邦电子与恩智浦联合技术论坛

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

通信猎头职位更多

高级软件工程师广东省/深圳市
自动化高级工程师广东省/深圳市
光器件研发工程师福建省/福州市
销售总监（光器件）北京市/海淀区
激光器高级销售经理上海市/虹口区
光器件物理工程师北京市/海淀区
激光研发工程师北京市/昌平区
技术专家广东省/江门市
封装工程师北京市/海淀区
结构工程师广东省/深圳市

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号