阿里推出“数字人”工具,最大的挑战是什么?
2023-08-18 17:26
根新未来
关注
文/陈根
近日,阿里云推出了数字人视频生成工具Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频。该功能可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。
阿里云推出AI视频生成工具是其大模型技术战略中必然要做事情,但从目前的实际情况来看,阿里云依然面临着比较大的挑战,也就是算法与算力的制约,当然更重要的还是算力的制约。
因为文本需要算力与音频、图文、视频需要算力是完全不同等级的概念,就以ChatGPT目前面临的困境来看,GPT-4迟迟无法获得更大的应用落地与突破,其中最核心的制约就在于算力。
同样,对于阿里的AI模型来说,如果在算法与算力上无法获得有效的突破,那么基于这种AI技术下所生成的数字人视频会存在两方面的问题:
一方面在算法层面无法生成精准表达图片内容的视频,或者就是简单的图片内容的视频化;另外一方面就是视频生成的精细化或存在问题,尤其是将基于图片的内容要生成为3D效果的时候,可能呈现的结果会与真实3D之间存在比较大的差异。
对于阿里而言,利用自身的电商销售优势数据,打造一个垂直化的专业型的AI客服,这或许是当前对于商家而言最现在的技术支持。
原文标题 : 陈根:阿里推出“数字人”工具,最大的挑战是什么?
声明:
本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
最新活动更多
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
7.30-8.1马上报名>>> 【展会】全数会 2025先进激光及工业光电展
-
精彩回顾立即查看>> 【线下论坛】华邦电子与莱迪思联合技术论坛
-
精彩回顾立即查看>> 【线下论坛】华邦电子与恩智浦联合技术论坛
-
精彩回顾立即查看>> 【线下巡回】2024 STM32 全球巡回研讨会
-
精彩回顾立即查看>> 2024先进激光技术博览展
-
3 拼多多,病入骨髓
-
10 云厂商双十一,无新可拉
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论