Posted in

苹果正开发智能眼镜和第二代 Vision Pro;阿里通义开源音频语言模型 Qwen2-Audio 丨 AIGC 日报_AI阅读总结 — 包阅AI

包阅导读总结

1. 关键词:苹果、阿里通义、AIGC、智能眼镜、音频语言模型

2. 总结:

– 苹果正开发智能眼镜和平价版及第二代 Vision Pro。

– 阿里通义开源音频语言模型 Qwen2-Audio,相关论文入选顶会。

– 梅赛德斯-奔驰与火山引擎达成战略合作。

– 谷歌增强“圈选即搜”将支持听歌识曲功能。

– 科大讯飞将在华为运动健康领域开展合作。

3. 主要内容:

– 苹果相关

– 苹果专栏作家称苹果团队正试验开发多款智能眼镜产品,包括明年推出的平价版 Vision Pro。

– 苹果正在继续研发第二代 Vision Pro,发布时间未明确。

– 阿里通义相关

– 开源音频语言模型 Qwen2-Audio,可直接语音问答,理解分析音频信号。

– 推出新的音频理解模型测评基准,相关论文入选顶会 ACL 2024。

– 合作相关

– 梅赛德斯-奔驰(中国)投资有限公司与火山引擎将在技术领域开展合作。

– 科大讯飞与华为将在运动健康领域合作,此前在其他领域有深度合作。

– 谷歌相关

– 谷歌的“圈选即搜”即将引入“音频搜索”功能,实现听歌识曲。

思维导图:

文章地址:https://mp.weixin.qq.com/s/BMxzXZ-WlldNNP70ABOeKQ

文章来源:mp.weixin.qq.com

作者:创业邦

发布时间:2024/8/14 0:08

语言:中文

总字数:878字

预计阅读时间:4分钟

评分:88分

标签:智能眼镜,音频语言模型,战略合作,苹果,阿里通义


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

cover_image

苹果正开发智能眼镜和第二代Vision Pro;阿里通义开源音频语言模型Qwen2-Audio丨AIGC日报

创业邦


1.【苹果专栏作家古尔曼:苹果正开发智能眼镜和第二代Vision Pro】根据苹果专栏作家马克·古尔曼最新一期《Power On》,苹果团队正继续试验开发多款智能眼镜产品,包括预计明年推出的平价版Vision Pro。此外,苹果正在继续研发第二代Vision Pro,发布时间尚未明确。

2.【阿里通义开源音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024】阿里通义大模型继续开源,Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。

3.【梅赛德斯-奔驰与火山引擎达成战略合作】据火山引擎消息,梅赛德斯-奔驰(中国)投资有限公司与北京火山引擎科技有限公司近日签署战略合作备忘录,将在大模型、生成式人工智能和大数据等技术领域开展合作和探索。

4.【谷歌增强“圈选即搜”,将支持听歌识曲功能】科技媒体Android Authority8月13日报道,谷歌的“圈选即搜”(Circle to Search)即将引入“音频搜索”(Audio Search)功能,实现类似于SoundHound和Shazam等应用的“听歌识曲”功能。

5.【科大讯飞:将在华为在运动健康领域开展合作】据悉,华为与科大讯飞将在运动健康领域达成合作,依托华为强大的硬件基础和科大讯飞的以星火大模型为代表的人工智能技术,双方将共同开发前沿的运动健康解决方案。据了解,华为与科大讯飞在昇腾算力、智能终端以及鸿蒙生态等领域始终保持深度合作关系。此前,双方共同打造的“飞星一号”,是首个支撑万亿参数大模型训练的万卡国产算力平台。


更多AIGC资讯……

扫码订阅AIGC产业日报,
精选行业新闻,帮你省时间!👇

此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇

预览时标签不可点

微信扫一扫
关注该公众号

继续滑动看下一个
创业邦
向上滑动看下一个
    知道了
    微信扫一扫
    使用小程序
    取消允许

    视频小程序,轻点两下取消赞在看,轻点两下取消在看分享留言收藏