AI日报：OpenAI劲敌发布新模型，力压 GPT-4o

2024-06-24 13:51

乌鸦智能说

关注

OpenAI竞争对手Anthropic宣布推出Claude 3.5 Sonnet，这是Claude 3.5 系列中的首款产品。该模型在多项评估中均优于竞争对手及其前身Claude 3 Opus。

据外媒《华尔街日报》消息，苹果公司寻求与中国本土企业，包括百度、阿里巴巴集团、百川智能等合作，旨在中国市场提供其“苹果智能”服务，上述公司尚未作出公开回应。

过去一天，国内外AI行业还有哪些热点值得关注呢？让乌鸦君带你一起看看吧。

/ 01 / 大模型

1）OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

OpenAI竞争对手Anthropic发布了AI模型Claude 3.5 Sonnet，这是Claude 3.5系列中的首款产品。该模型在多项评估中均优于竞争对手及其前身Claude 3 Opus，同时保持了与中端型号相当的速度和成本。Claude 3.5 Sonnet在研究生水平推理、本科生水平知识和编码能力等方面创下新的行业基准，性能大幅提升。

2）苹果AI正寻求与中国本土企业合作，已与百度、阿里、百川等接触

据外媒《华尔街日报》消息，苹果公司寻求与中国本土企业，包括百度、阿里巴巴集团、百川智能等合作，旨在中国市场提供其“苹果智能”服务。这一举措可能是为了应对在中国市场的竞争压力。据Counterpoint Research，iPhone在中国市场份额降至第三。上述公司尚未作出公开回应。

3）大模型价格战调查：有客户调用量增5000倍，大模型落地的逻辑变了

5月中旬，超15家知名大模型厂商降价、免费，触发了大模型产业的价格战。市场反馈显示，用户新增数量大增，原有用户业务量放量，无论是互联网领域还是智能终端行业，大模型调用量大增。但降价同时也使部分厂商改变了原有的自研路线，转而更聚焦于AI应用。

4）Groq上线whisper-large-v3模型，支持语音转录和翻译、免费开放

Groq最新推出的Whisper Large-V3模型为用户提供语音转录和翻译功能，可在Playground或本地项目中使用API。用户体验高速转录，支持多种语言翻译成英文。Whisper API兼容OpenAI标准，提供语音转文本和翻译功能，便于集成到应用程序中。性能优越，采用先进的"whisper-large-v3"模型。

/ 02/ AI应用

1）快手可灵图生视频和视频续写新功能上线

据知情人士透露，快手可灵视频大模型上线“图生视频”和“视频续写”新功能。图生视频可以根据图片生成5秒视频，支持添加提示词控制图像运动。视频续写功能可对生成视频一键续写4~5秒，支持多次续写，最长3分钟，还可以通过微调提示词进行续写视频创作。另外，文生视频新增9:16和1:1视频尺寸选择。

2）Apple Intelligence 机型限制太多？苹果高管回应

Apple智能被限制在iPhone 15 Pro/Pro Max以及搭载M1或后续芯片的iPad和Mac设备上。苹果解释，这是因为大型语言模型的推理计算需求极高。分析师郭明錤认为，Apple智能是否兼容取决于设备的DRAM大小，而非AI算力。

3）腾讯元宝发布全新版本，接入微信搜索

腾讯元宝近期发布了全新版本，主要提升了对超长文本的处理能力及AI搜索和解析功能，增加了微信搜索接入。此次更新提升了处理超长文档效率，还丰富了文件格式支持、图表生成和图片解析功能。新版本增强了搜索功能，接入微信搜索等搜索引擎。

4）知网宣布推出CNKI AI学术研究助手4.0

中国知网最近推出了AI学术研究助手4.0版本，结合AI大模型技术和高质量数据，提升文献检索、研读和学术创作效率。新增功能包括可控生成、文献扩展、学者检索、全文翻译和学术拓展服务。突出升级是问答式增强检索和学者检索服务。

5）微信输入法上线“问AI”功能，答案由微信读书AI问书提供

微信输入法带来了全新的AI问答功能，AI问答答案由微信读书AI问书提供，点击链接将跳转微信读书中该文本引用的页面，让用户通过上下文更好地理解问题。目前，微信输入法暂未在iOS、Android版本上线AI问答功能。

6）复旦开源项目Hallo已适配ComfyUI插件

Hallo项目是一个根据音频和图片生成说话视频的开源项目，安装门槛高，为转绘和其他流程提供了更多可能性和乐趣。它采用端到端的扩散范式，引入分层的音频驱动视觉合成模块，实现音频输入与视觉输出的对齐精度，生成自然的说话视频。

7）环球音乐联手AI音乐公司SoundLabs 为歌手定制语音克隆模型

环球音乐集团与AI音乐技术公司SoundLabs合作推出MicDrop功能，让艺术家定制个性化语音模型，拥有完全控制权，突破语言障碍，保护艺术家权利。这一革命性技术将音乐创作带入全新的创意空间，推动AI在音乐领域的应用和发展。

/ 03 / 投融资情报

1）前Twitter工程师开发的一款AI新闻阅读器，获1090万美元融资

Particle获得Lightspeed Venture Partners领投的1090万美元A轮融资，本轮融资的投资方还包括全球媒体公司Axel Springer。Particle是由前Twitter工程师Sara Beykpour和Marcel Molina创立的初创公司，他们利用人工智能技术打造个性化新闻平台。

2）AI视频初创公司HeyGen融资6000万美元，估值超5亿美元

HeyGen在A轮融资中成功筹集6000万美元，公司估值超过5亿美元。其盈利能力强劲，年收入从100万美元增长至超过3500万美元，客户群体覆盖小型企业到财富500强公司。HeyGen计划扩大产品供应并投资于企业安全、AI伦理、信任和安全方面。

3）前GitHub CTO创业融资4亿美金做AI程序员，估值20亿美金

总部位于巴黎的生成式人工智能公司Poolside.ai，正在筹集4亿美元资金，估值为20亿美元。贝恩资本风投和DST正在就目前的轮次进行谈判。公司创始人&CEO Jason Warner曾是GitHub CTO，并领导过Heroku和Canonical的工程部门。

4）揭秘Ilya新公司：背靠5吨GPU，做核能级安全

Ilya与他人创立新公司SSI的新闻备受业界关注，Ilya表示专注于做核能级安全。据了解，他们在2023年斥资1亿美元，建立了名为Andromeda的AI算力集群，并用这些算力来换AI初创公司的股权。这一集群拥有包括近3000块英伟达H100 GPU在内的大量算力基础设施，光是GPU就重达近5吨。

5）软银准备全力押注AI？孙正义誓言不成功便成仁透露“新投资方向”

软银掌门孙正义准备将新的科技投资瞄准AI。孙正义表示，即便是失败，也别无选择，需要尝试。软银未透露投资具体细节，但将主要在美国扩大其发电业务，为人工智能项目供电；同时也在寻求高达1000亿美元的资金来投资一家芯片企业。目前，孙正义旗下的软银积累了6.2万亿日元的现金储备。

/ 04 / AI基础设施

1）Meta发布最新RAG评价基准，公认最强的GPT-4仅得40分

Meta发布RAG评价基准，GPT-4配合RAG仅获得40分（百分制）显示技术仍有提升空间；RAG技术通过增强LLM与外部知识的结合，试图解决LLM生成答案时的“幻觉”问题；CRAG评测基准设计包括多种任务和评估方法，旨在全面测试RAG系统在多样化和动态问答场景中的性能。

2）GaussianCube：高质量3D生成建模，性能飞跃74%！