人工智能

包阅导读总结 1. “` Dify 知识库、多路召回、N 选 1 召回、检索策略、升级调整 “` 2. Dify 知识库将于 2024 年 9 月 1 日起停用“N 选 1 召回”策略，采用“多路召回”策略，以提升检索精确度。用户需相应调整，不同版本有不同操作，可通过设置调整…

人工智能

斯坦福 AI 方法加速目标材料发现，为「自动驾驶实验」奠定基础_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 斯坦福 AI 方法、材料发现、自动驾驶实验、数据采集策略、贝叶斯算法 2. 斯坦福大学和 SLAC 实验室的科学家开发了一种 AI 方法用于材料发现，能更有效地收集数据，为自动驾驶实验奠定基础，该方法在多个数据集上证明比现有技术高效。 3. – 传统材料发现过程耗时且…

人工智能

AI 芯片独角兽宣布杨立昆加盟！估值暴涨到 200 亿_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：Groq、AI芯片、杨立昆、融资、推理 2. 总结：AI芯片独角兽Groq获6.4亿美元D轮融资，估值达28亿美元。请来杨立昆担任技术顾问，其自研LPU号称世界最快推理，吸引众多开发者，面临激烈竞争，仍需证明商用实力。 3. – Groq的发展与现状 &#82…

人工智能

通义 App 推出角色扮演功能，可一键替换视频人物_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 通义 App、角色扮演、Motionshop、视频人物替换、AIGC 2. 8 月 6 日，通义 App 推出角色扮演功能，可一键替换视频人物。年初推出的 Motionshop 模型产品化加速落地，已上线通义 App 免费使用。该功能利用多种技术，提供高效路径追踪方案，未来有望应…

人工智能

英伟达对话模型 ChatQA 进化到 2.0 版本，上下文长度提到 128K_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：英伟达、ChatQA 2.0、上下文长度、LLM、RAG 2. 总结：英伟达的 ChatQA 进化到 2.0 版，扩展上下文窗口至 128K，与 GPT-4-Turbo 同等水平，并配备最佳长上下文检索器。通过指令微调等方法提升性能，在不同评估基准下表现出色，对比了 RA…

人工智能

Meta「分割一切」进化 2.0！跟踪运动物体，代码权重数据集全开源_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：Meta、分割一切 2.0、视频分割、开源、SAM2 2. 总结：Meta 的“分割一切 AI”二代 SAM2 在 SIGGRAPH 亮相，能力从图像分割拓展到视频分割，可实时处理任意长视频，能分割追踪新对象，代码、权重、数据集开源，解决了一些问题但仍有不足，训练成本等情…

人工智能

字节跳动科学家组团演讲，揭秘 AI 视频生成大招！_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 字节跳动、AI 视频生成、数据缩放、教师模型、训练 2. 字节跳动科学家组团演讲揭秘 AI 视频生成大招。研究人员进行数据缩放，汇总多个数据集和大量图片训练模型，还在标记图像上单独训练教师模型并处理所有图像。 3. – 字节跳动科学家揭秘 AI 视频生成大招 &#82…

人工智能

魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 魔搭社区、NVIDIA TensorRT-LLM、大语言模型、推理加速、模型即服务 2. 魔搭社区是中国最大的模型开源社区，提出“模型即服务”理念。上线 NVIDIA TensorRT-LLM 加速开源大语言模型推理，解决了 LLM 模型推理面临的诸多挑战，为开发者提供更优方案，…

人工智能

统一多场景自动编译加速——支持动态 shape 场景，一套架构搞定训推需求_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 飞桨、编译器技术、模型优化、动态 shape、性能提升 2. 飞桨为让开发者掌握技术动态、企业落地更高效，推出系列技术稿件及直播课程。本文介绍飞桨神经网络编译器，其分为前端和后端，满足训推需求和动态 shape 场景，通过优化技术提升性能，还引入自动调优模块，能生成最优策略。 3…

人工智能

Ollama+Qwen2，轻松搭建支持函数调用的聊天系统_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：Ollama、Qwen2、聊天系统、函数调用、模型部署 2. 总结：本文介绍通过Ollama结合Qwen2搭建支持函数调用的聊天API，包括模型部署、生成函数参数、调用函数等步骤，还给出了单模型文件下载、创建自定义模型及运行模型的方法，并通过示例展示了相关操作。 3. 主…

分类

知识库召回功能更新：使用“多路召回”替代 “N 选 1 召回”_AI阅读总结 — 包阅AI

斯坦福 AI 方法加速目标材料发现，为「自动驾驶实验」奠定基础_AI阅读总结 — 包阅AI

AI 芯片独角兽宣布杨立昆加盟！估值暴涨到 200 亿_AI阅读总结 — 包阅AI

通义 App 推出角色扮演功能，可一键替换视频人物_AI阅读总结 — 包阅AI

英伟达对话模型 ChatQA 进化到 2.0 版本，上下文长度提到 128K_AI阅读总结 — 包阅AI

Meta「分割一切」进化 2.0！跟踪运动物体，代码权重数据集全开源_AI阅读总结 — 包阅AI

字节跳动科学家组团演讲，揭秘 AI 视频生成大招！_AI阅读总结 — 包阅AI

魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理_AI阅读总结 — 包阅AI

统一多场景自动编译加速——支持动态 shape 场景，一套架构搞定训推需求_AI阅读总结 — 包阅AI

Ollama+Qwen2，轻松搭建支持函数调用的聊天系统_AI阅读总结 — 包阅AI