包阅导读总结
1.
关键词:AGI 、AI 技术、机器人、模型、创新
2.
总结:本文涵盖了多项 AI 领域的最新动态和技术突破,包括国产 AI 机器人的多能表现、多模态大模型的推出、语音模型的升级等,同时涉及企业动态、行业观点和热门活动。
3.
主要内容:
– 技术突破
– 国产星尘智能 Astribot S1 机器人能完成多种复杂任务
– 阿里发布 mPLUG-Owl3 通用多模态大模型
– 科大讯飞推出“星火极速超拟人交互”
– 昆仑万维发布 AI 短剧平台 SkyReels
– 微软提升 LLM 数学性能
– Half_illustration 能将照片变艺术大片
– 智源研究院的数据集提升模型能力
– 海光 DCU 提高向量数据库搜索性能
– 企业动态
– 阿里通义千问启用新域名并升级功能
– 麦当劳日本用 AI 美女制作薯条广告
– 特斯拉招募机器人训练员
– 地平线组建具身智能团队
– Consensus CEO 回怼奥特曼言论
– 谷歌或将停产 Fitbit 智能手表
– TargetPilot 模糊电商界限
– 行业观点
– 探讨 AI 泡沫恐慌
– 半数《财富》500 强企业视 AI 为风险因素
– 对 AI 辅助教学的担忧
– 邬贺铨院士谈 AI 大模型发展
– 热门活动
– AI Talk 沙龙第 3 期深圳站将举办
思维导图:
文章地址:https://mp.weixin.qq.com/s/SN6GQ5KeGOUZ8ZE02AHC4A
文章来源:mp.weixin.qq.com
作者:AGI??掘金知识库
发布时间:2024/8/20 5:59
语言:中文
总字数:4183字
预计阅读时间:17分钟
评分:88分
标签:AI机器人,多模态模型,语音交互,AI短剧,人形机器人
以下为原文内容
本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com
酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩!(https://sourl.co/G5Gpqh)
🌟 技术突破
🔗 国产 AI 机器人好超前…弹琴泡茶打咏春,还能撸猫??
Astribot S1 是由星尘智能开发的先进人形机器人,能独立完成弹琴、泡茶、烹饪、武术等复杂任务,展现其强大的学习和执行能力。机器人采用人形上半身和轮式底盘设计,具有高度仿人的身体指标和精细的操作能力。通过模块化设计,S1 能灵活适应不同需求。其 AI 算法和刚柔耦合传动机构设计,使其在复杂环境中具备出色的感知、认知和实时决策能力,同时确保操作安全。星尘智能致力于让更多人拥有 AI 机器人助理,推动”AI+机器人”技术革新。
🔗 4 秒看完 2 小时电影!阿里发布通用多模态大模型 mPLUG-Owl3
阿里巴巴集团的 mPLUG 团队推出了 mPLUG-Owl3,一款通用多模态大模型,能在 4 秒内处理 2 小时电影内容。该模型在图像处理和视频理解方面表现出色,具备高效的推理效率和准确性,无需牺牲性能。mPLUG-Owl3 通过 Hyper Attention 模块,实现了视觉与文本的深度融合,优化了模型的多模态能力。在多个 Benchmarks 上取得 SOTA 成绩,展示了其在单图、多图和长视频理解方面的先进性。模型的开源代码和 demo 提供了进一步研究和应用的可能性。
🔗 科大讯飞推出“星火极速超拟人交互”:可模仿孙悟空、蜡笔小新等音色、语气、人设
科大讯飞发布星火语音大模型的升级版,具备极速响应、情绪感知、灵活表达和多人设切换四大特性。新模型实现语音到语音的端到端建模,提升响应速度和流畅度,能识别并共鸣多种情绪,支持情感、风格和方言的个性化控制。用户可与孙悟空、蜡笔小新等角色进行互动。该技术计划于 8 月 30 日在讯飞星火 APP 上线,供全民体验。
🔗 “一人一剧”时代来临:AI 短剧平台 SkyReels 正式发布
昆仑万维集团发布全球首个 AI 短剧平台 SkyReels,集成剧本生成、角色定制、分镜、剧情、对白/BGM 及影片合成等全流程创作工具。SkyReels 利用自研技术和 AI 模型,实现一键生成高质量视频,大幅提高创作效率,降低成本,推动个性化内容创作。平台支持 1080P 60 帧高清视频输出,满足专业和非专业用户需求,预示着 AI 驱动的短剧创作与消费新时代的到来。
🔗 LLM 数学性能暴涨 168%,微软 14 人团队力作!合成数据 2.0 秘诀曝光
微软团队开发了 AgentInstruct 智能体框架,通过自动生成多样化的合成数据,显著提升了大型语言模型(LLM)的性能。Orca-3 模型在后训练后,在多个基准测试中表现卓越,数学能力提升高达 168%。AgentInstruct 利用生成式教学方法,通过强大的模型如 GPT-4 结合工具,创建了 2500 万对数据,覆盖文本编辑、创意写作等技能,有效提升了模型的阅读理解和数学问题解决能力,减少了模型幻觉,达到了与 GPT-4 相当的质量水平。
🔗 Half_illustration:基于 Flux.1 的 LoRA 模型,照片秒变艺术大片
Half_illustration 是一款基于 Flux.1 LoRA 模型的 AI 工具,能够将普通照片通过用户描述的场景和元素,如烟雾、花朵、火焰等,转化为具有视觉冲击力的艺术作品。用户只需添加特定风格提示词”in the style of TOK”,即可获得风格化的作品。该工具不仅适用于艺术创作,还能在时尚摄影、广告设计等领域发挥作用,并提供 API 接口和与 Diffusers 库的兼容性,方便开发者使用。
🔗 智源千万级指令微调数据集 Infinity-Instruct 持续迭代,Llama3.1 仅微调可接近 GPT-4
智源研究院推出千万级指令微调数据集 Infinity-Instruct,包含数学、代码、常识问答等领域数据,通过迭代更新,显著提升了 Llama3.1 等模型的综合能力。Infinity-Instruct-7M 和 Gen 版本分别强化了模型的基础能力和对话鲁棒性,使得微调后的模型在多个评测榜单上超越官方对话模型,接近 GPT-4 的对话能力。该数据集在 Hugging Face 等平台发布,支持开源微调工作,智源计划未来开源数据处理和模型训练代码,进一步推动 AI 对话技术发展。
🔗 faiss 向量数据库测试《三体》全集,这家国产 AI 加速卡,把性能提了 7 倍!
海光 DCU(Data Center Unit)作为国产 AI 加速卡,在向量数据库 Faiss 的搜索性能测试中表现出色。Faiss 是 Facebook AI Research 开发的用于大规模向量相似性搜索和聚类的开源库。测试选用《三体》全集文本数据,在 CPU 和 GPU 环境下对比搜索效率,结果显示使用海光 DCU 的 GPU 搜索性能比 CPU 提高了约 7 倍。测试环境基于 Ubuntu 22.04.1 LTS,通过 Embedding 模型将文本转换为向量数据,再利用 Faiss 进行搜索。随着数据量的增加,DCU 的加速效果将更加显著。
💫 企业动态
🔗 阿里通义千问启用新域名“tongyi.ai”,网页版聊天功能升级
阿里大语言模型“通义千问”宣布启用新域名“tongyi.ai”,并引入多项新特性。网页版聊天新增深度搜索功能,提供更专业和结构化的搜索结果,同时数字角标悬浮显示来源网页。App 端新增图片微动效支持多尺寸图片,并调整自定义唱演功能,支持 3:4 画幅并延长音频时长至 300 秒。此外,阿里云万网推出 AI 化域名产品服务,实现智能起名功能,用户可基于通义大模型一键生成创意域名。
🔗 麦当劳请了 11 个 AI 美女为薯条疯狂打 call:引发千万围观
麦当劳日本推出由 AI 艺术家 Kaku Drop 制作的薯条广告,11 位 AI 美女以不同风格展示产品,引发千万级观看和网友热议。广告中,AI 少女们以未来感和写实风格出现,展示麦当劳薯条。最后一名少女实际品尝薯条,视频质量获得网友称赞。同时,广告成本低于真人代言,但存在版权和道德争议。Luma AI 工作室透露 Dream Machine 新版本 1.5 即将发布,展示新模型生成的作品。
🔗 特斯拉招募机器人“老师”:每小时 48 美元,高薪重体力活
特斯拉以高薪招募“数据采集操作员”,通过动作捕捉服训练 Optimus 机器人,旨在让其胜任从工厂到家庭的多种工作。这一“人肉训练”方式引发业界争议,支持者认为它类似于自动驾驶汽车的训练,通过海量数据训练人工智能,而反对者则质疑仅凭动作数据难以让机器人真正理解人类行为。Optimus 的未来充满不确定性,技术成熟度、成本控制和伦理问题都是需要深入探讨的挑战。
🔗 人形机器人加入新玩家?消息称地平线公司组建约 50 人具身智能团队
自动驾驶计算方案公司地平线集团组建了一支约 50 人的具身智能团队,由副总裁余轶南领导。余轶南是地平线创始团队成员之一,曾任百度深度学习研究院科学家。新团队将专注于具身智能软硬件的研发,面向未来。地平线集团的长远使命是机器人,智能汽车被视为机器人的一个分支。公司通过智能汽车推动相关技术发展,如激光雷达成本的大幅降低,为机器人领域的发展打下基础。具身智能和人形机器人是科技领域的热点,地平线集团的这一举措显示了其在该领域的雄心和对未来的布局。
🔗 Consensus CEO 回怼奥特曼“碾压”初创言论:从“套壳”开始也能做出伟大产品
在 AI 领域,初创公司常被质疑为”套壳”应用,依赖大公司技术。奥特曼曾表示,OpenAI 等巨头会”碾压”这些公司。但 Consensus CEO Eric Olson 反驳,认为初创公司通过提供差异化服务和细节关注,也能成功。他指出,即使是科技巨头,起初也可能只是”套壳”,关键在于能否围绕核心功能不断增加附加价值,打造卓越产品。Olson 强调,专业化至关重要,初创公司可在巨头忽视的细分市场找到机会。他鼓励创业者不要害怕巨头的竞争,而应专注于打磨产品,解决用户问题。
🔗 谷歌或将停产 Fitbit 智能手表,专注 Pixel Watch 系列
据 TechRadar 报道,谷歌已确认不再生产 Fitbit Sense 和 Versa 系列智能手表,转而专注于健身追踪器和 Pixel Watch 系列。Pixel Watch 3 集成了谷歌软件和 Fitbit 健身追踪功能,标志着 Fitbit 智能手表时代的可能结束。尽管谷歌表示将继续推出 Fitbit 新产品,但未明确否认停产消息。Fitbit 手表功能逐渐被 Pixel Watch 所取代,但健身追踪技术和经验将延续。
🔗 AI+Marketplaces:Agent 如何模糊货架电商与兴趣电商的界限?
TargetPilot,一家国内出海项目,通过 AI 技术提升跨境独立站的购物体验。创始人 Vincent 及其团队利用 AI 搜索和推荐算法,为消费者提供个性化购物体验,同时为商家提供独立站托管服务。商业模式涵盖电商 AGI 推荐、SaaS 服务和 API 输出。TargetPilot 已获得微软和英伟达支持,并在 Shopify 等平台上架,MRR 达数万美元,致力于通过 AI 模糊货架电商与兴趣电商的界限。
✨ 行业观点
🔗 AI 泡沫恐慌:技术革新与市场调整
2024 年全球股市经历重挫,科技股领跌引发 AI 泡沫恐慌。市场对 AI 技术未来发展过于乐观,导致投资过剩。然而,与互联网泡沫相比,当前 AI 泡沫有限,且有实际价值支撑。AI 技术被视为下个时代的基建,投资回报周期长,但潜在经济效益巨大。尽管存在成本和应用挑战,AI 的效能提升和成本下降趋势明显,预示着其在经济生态中的重要作用。
🔗 调查显示过半《财富》世界 500 强企业将 AI 视为“风险因素”
最新调查显示,56%的《财富》世界 500 强企业将人工智能视为潜在风险因素,与 2022 年的 9%相比显著上升。尽管有 33 家公司认为 AI 能带来成本效率和创新,但多数企业担心无法跟上技术发展,面临竞争加剧风险。特别是在媒体、娱乐、电信、医疗和金融服务等行业,企业担心 AI 可能带来数据偏见或监管问题,影响收益和声誉。
🔗 ChatGPT 成 8 岁娃「导师」,外国家长们慌了!
全球多地学校开始推行 AI 辅助教学,如伦敦 David Game College 利用 ChatGPT 备考,加州可汗实验室学校引入 Khanmigo。韩国计划全国推广 AI 驱动教科书,旨在实现个性化教学,提高教育效率。然而,家长和部分教育者担忧 AI 可能带来的负面影响,如过度依赖数字设备、错误信息传播和削弱学生批判性思维能力。教育改革需平衡 AI 技术应用与学生全面发展。
🔗 邬贺铨院士:AI 大模型仍需“大力出奇迹”
中国工程院院士邬贺铨在 2024 北京人工智能生态大会上提出,人工智能作为新质生产力引擎,其大模型发展需通过巨大努力实现突破。他指出,算力、数据是 AI 发展的关键,当前中国算力枢纽利用率有提升空间,数据供给和应用潜力释放不足,需加快数据基础制度建设。邬院士认为,大模型性能与模型参数量、数据集大小、算力规模呈幂律关系,需多措并举提升对物理世界的模拟能力。他建议政府和企业营造 AI 生态,推动行业应用和模式创新。中小企业面临人才、技术、数据短缺,大模型落地需优化模型结构和训练策略。
🎡 热门活动
🔗 AI Talk 沙龙第3期-深圳站|2024.8.24 (周六)14:00-17:00
(https://agijuejin.feishu.cn/wiki/TejhwuzeuiMu67ksQKjcW0l5nNg)
❝
AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!
欢迎戳我加入 AGI 掘金飞书社群交流学习😊(https://sourl.co/G5Gpqh)
❞