AI日报:商汤科技发布“日日新5.0”大模型,微软发布小语言模型 Phi-3 系列
今日,商汤科技(SenseTime)正式推出了其人工智能大模型“日日新5.0”,该模型具备高达200K的推理上下文窗口,旨在全面对标OpenAI的GPT-4 Turbo。
在国外,微软发布小语言模型 Phi-3 系列,这些模型在保持较小的参数规模的同时,通过精心设计的训练数据集和优化的算法,实现了与大型模型相美的语言理解和推理能力。
过去一天,国内AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。
/ 01 / 国内要闻
1)商汤科技发布“日日新5.0”大模型,对标GPT-4 Turbo
商汤科技(SenseTime)正式推出了其人工智能大模型“日日新5.0”,该模型具备高达200K的推理上下文窗口,旨在全面对标OpenAI的GPT-4 Turbo。这一升级版的大模型采用了混合专家架构(MoE),基于超过10TB的tokens进行训练,并覆盖了大量合成数据。
“日日新5.0”在多项能力上进行了增强,包括知识、数学、推理和代码能力,尤其在文科和理科能力方面均有显著提升。在文科能力方面,模型的创意写作、推理和总结能力得到了增强,能够为教育和内容产业等垂直应用场景提供辅助。理科能力方面,模型在数理、代码和推理能力上达到了业内领先水平,为金融和数据分析等场景提供了坚实的基础。
此外,“日日新5.0”在多模态能力上也取得了突破,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,并在多个知名多模态榜单中取得领先成绩。该模型支持高清长图的解析和理解、文生图交互式生成,并能实现复杂的跨文档知识抽取及总结问答展示,具备丰富的多模态交互能力。
2)AIGC第一股出门问问今日上市,市值达54.89亿港元
被誉为“AIGC第一股”的出门问问于今日在香港交易所正式挂牌上市。截至收盘,出门问问收报3.68港元,跌幅3.16%,港股市值54.89亿港元。
据配发结果公告显示,此次出门问问全球发售8456.8万股股份,国际发售4228.4万股股份,公开发售4228.4万股股份,其中,公开发售获117.39 倍认购。最终发售价每股3.8港元,全球发售净筹约2.67亿港元。
3)腾讯协作SaaS产品全面接入腾讯混元大模型
近日,腾讯宣布旗下协作SaaS产品全面接入腾讯混元大模型,除企业微信、腾讯会议、腾讯文档等“一门三杰”产品,腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品也都已实现智能化升级。
/ 02 / 海外动态
1)苹果悄然收购Datakalab,增强设备端AI能力
苹果公司刚刚完成了对Datakalab的收购,这是一家总部位于巴黎的AI初创公司,专注于数据压缩和图像分析,此举将增强苹果在设备端AI领域的能力。
2)微软发布小语言模型 Phi-3 系列
Phi-3 是微软研究院推出的一系列先进的小型语言模型,旨在保持较小的参数规模的同时,实现与大型模型相媲美的语言理解和推理能力。这个系列包括三个不同规模的版本 —— phi-3-mini、phi-3-small 和 phi-3-medium。
尽管 Phi-3 Mini 的体积很小,但它在某些基准测试中的表现已经与 Llama 2 相当,微软表示它的响应速度可以与比它大 10 倍的模型相媲美。目前尚不清楚这是否会成为未来 Copilot 更新的一部分,因为微软正寻求将更多功能集成到设备上,或者这将保持作为一个独立的项目。
3)Blockade Labs发布全新模型Model3
生成式AI平台Blockade Labs发布的全新模型Model3,该模型支持超高清8192x4096分辨率,提升了文本提示器描述生成世界的能力,减少了生成世界的灰度值,使内容更加高清、细腻。
原文标题 : 乌鸦AI日报:商汤科技发布“日日新5.0”大模型,微软发布小语言模型 Phi-3 系列
最新活动更多
-
11月22日立即报名>> 【线下论坛】华邦电子与莱迪思联合技术论坛
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
7.30-8.1马上报名>>> 【展会】全数会 2025先进激光及工业光电展
-
精彩回顾立即查看>> 【线下论坛】华邦电子与恩智浦联合技术论坛
-
精彩回顾立即查看>> 【线下巡回】2024 STM32 全球巡回研讨会
-
精彩回顾立即查看>> 2024先进激光技术博览展
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论