包阅导读总结 1. 大模型、文本评估、偏好搜索算法、PairS、COLM 2. 首届大模型顶会 COLM 高分工作,分析 LLM 作为文本评估器的分数偏见问题,提出将评估转成偏好排序,设计 PairS 算法,在多个测试集上与人类判断一致性高,对比了多种基线方法,效果出色。 3. – 背景…
人工智能
商汤科技日日新大模型亮相巴黎,中国 AI 共赴奥运之约_AI阅读总结 — 包阅AI
包阅导读总结 1. 商汤科技、日日新大模型、巴黎奥运、AI 应用、智慧赛事 2. 商汤科技日日新大模型亮相巴黎奥运,为中国运动员提供多方面支持,包括篮球赛事的数据分析和策略优化,乒乓球、射箭的智慧赛事转播,还为观众带来有趣的交互活动。 3. – 商汤科技日日新大模型及应用参与巴黎奥运 &…
从现在起,GitHub 上超 1 亿开发者可直接访问全球顶级大模型,构建 AI 应用_AI阅读总结 — 包阅AI
包阅导读总结 1. `GitHub`、`AI 大模型`、`开发者`、`GitHub Models`、`转型` 2. GitHub 推出新功能「GitHub Models」,超 1 亿开发者可直接访问全球顶级大模型,能试用多种流行模型,还可导入到自己项目,降低部署门槛,提供“一条龙”服务,但个人用户访…
「越狱」事件频发,如何教会大模型「迷途知返」而不是「将错就错」?_AI阅读总结 — 包阅AI
包阅导读总结 1. 大模型、安全对齐、越狱攻击、Decoupled Refusal Training、DeRTa 2. 香港中文大学(深圳)贺品嘉团队和腾讯 AI Lab 提出 DeRTa 方法,旨在解决大模型易受越狱攻击的问题,提升安全性且不影响有用性,实验证明该方法有效。 3. – …
小扎对谈黄仁勋:AI 模型不开源,脏话我要骂出来_AI阅读总结 — 包阅AI
包阅导读总结 1. 扎克伯格、黄仁勋、AI 模型、开源、智能眼镜 2. 本文主要报道了扎克伯格与黄仁勋在 SIGGRAPH 2024 的对谈,包括对生成式 AI 应用、开源理念、AI Agent、智能眼镜等的交流,还介绍了英伟达的新动态,如发布 NIM 软件包等。 3. – 扎克伯格与黄…
New Computer 借助 LangSmith 将记忆检索召回率提升 50%_AI阅读总结 — 包阅AI
包阅导读总结 1. 关键词:New Computer、Dot、Memory Retrieval、LangSmith、Precision 2. 总结:New Computer 通过 LangSmith 改进了 Dot 的记忆检索系统,实现了更高的召回率和精度,还优化了对话提示,不断探索深化与用户的关系…
魔搭社区每周速递(7.27-8.3)_AI阅读总结 — 包阅AI
包阅导读总结 1. 魔搭社区、模型、数据集、创新应用、文章 2. 魔搭社区 7.27 – 8.3 进展:包括 155 个模型如 FLUX.1 系列、Gemma-2-2b 等,123 个数据集,68 个创新应用,5 篇文章。介绍了 FLUX.1 系列和 Gemma-2-2b 模型的特点及相…
贾扬清共一论文获 ICML 时间检验奖:首个开源版 AlexNet,著名框架 Caffe 前身,最佳论文奖也已公布_AI阅读总结 — 包阅AI
包阅导读总结 1. 关键词:贾扬清、ICML、时间检验奖、DeCAF、Caffe 2. 总结:ICML 2024时间检验奖出炉,贾扬清共同一作的论文获奖。该论文是10年前在UC伯克利完成,是AlexNet的首个开源版本及著名框架Caffe的前身,探讨了深度卷积激活特征在通用视觉识别中的应用。同时IC…
GPT-4o mini 实力霸榜,限时 2 个月微调不花钱!每天 200 万训练 token 免费薅_AI阅读总结 — 包阅AI
包阅导读总结 1. 关键词:GPT-4o mini、免费微调、LMSYS 排名、性能优势、训练成本 2. 总结:Llama 3.1 开源时,OpenAI 开放 GPT-4o mini 免费微调,每天 200 万训练 token 免费,限时 2 个月。GPT-4o mini 在 LMSYS 排名与 G…
GPT-4o 版「Her」终于来了!讲笑话、学猫叫,AI 女友能有多撩人?_AI阅读总结 — 包阅AI
包阅导读总结 1. `GPT-4o`、`语音功能`、`输出 token`、`预设语音`、`安全性测试` 2. GPT-4o 语音功能开启灰度测试,部分用户已体验。其输出 token 暴涨 16 倍至 64K,只提供 4 种预设语音,还进行了安全性等测试。网友分享了多种语音模式用例,预计秋季所有 Ch…