包阅AI · 知识分享 – 第 1145 页 – 包阅AI

包阅导读总结 1. 关键词：英伟达、ChatQA 2.0、上下文长度、LLM、RAG 2. 总结：英伟达的 ChatQA 进化到 2.0 版，扩展上下文窗口至 128K，与 GPT-4-Turbo 同等水平，并配备最佳长上下文检索器。通过指令微调等方法提升性能，在不同评估基准下表现出色，对比了 RA…

人工智能

Meta「分割一切」进化 2.0！跟踪运动物体，代码权重数据集全开源_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：Meta、分割一切 2.0、视频分割、开源、SAM2 2. 总结：Meta 的“分割一切 AI”二代 SAM2 在 SIGGRAPH 亮相，能力从图像分割拓展到视频分割，可实时处理任意长视频，能分割追踪新对象，代码、权重、数据集开源，解决了一些问题但仍有不足，训练成本等情…

人工智能

字节跳动科学家组团演讲，揭秘 AI 视频生成大招！_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 字节跳动、AI 视频生成、数据缩放、教师模型、训练 2. 字节跳动科学家组团演讲揭秘 AI 视频生成大招。研究人员进行数据缩放，汇总多个数据集和大量图片训练模型，还在标记图像上单独训练教师模型并处理所有图像。 3. – 字节跳动科学家揭秘 AI 视频生成大招 &#82…

人工智能

魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 魔搭社区、NVIDIA TensorRT-LLM、大语言模型、推理加速、模型即服务 2. 魔搭社区是中国最大的模型开源社区，提出“模型即服务”理念。上线 NVIDIA TensorRT-LLM 加速开源大语言模型推理，解决了 LLM 模型推理面临的诸多挑战，为开发者提供更优方案，…

人工智能

统一多场景自动编译加速——支持动态 shape 场景，一套架构搞定训推需求_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 飞桨、编译器技术、模型优化、动态 shape、性能提升 2. 飞桨为让开发者掌握技术动态、企业落地更高效，推出系列技术稿件及直播课程。本文介绍飞桨神经网络编译器，其分为前端和后端，满足训推需求和动态 shape 场景，通过优化技术提升性能，还引入自动调优模块，能生成最优策略。 3…

人工智能

Ollama+Qwen2，轻松搭建支持函数调用的聊天系统_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：Ollama、Qwen2、聊天系统、函数调用、模型部署 2. 总结：本文介绍通过Ollama结合Qwen2搭建支持函数调用的聊天API，包括模型部署、生成函数参数、调用函数等步骤，还给出了单模型文件下载、创建自定义模型及运行模型的方法，并通过示例展示了相关操作。 3. 主…

人工智能

9.11 和 9.9 谁大？我们实测 15 个大模型，超半数翻车_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 大模型、数学比较、评测、错误回答、原因分析 2. 文章围绕大模型对“9.11 和 9.9 谁大”的回答进行评测，超半数翻车。分析了错误原因，包括模型架构和分词器处理方式等，还提到部分模型二次回答能改正，提高数学能力需高质量数据支持。 3. – 评测起因 –…

人工智能

苹果让大模型学会偷懒：更快吐出第一个 token，准确度还保住了_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：LazyLLM、LLM 推理、token 剪枝、预填充、准确度 2. 总结：苹果和 Meta AI 团队提出 LazyLLM 方法，可在保证准确度不明显下降的同时加速 Llama 2 预填充阶段的推理速度。该方法基于输入 token 注意力分数稀疏的观察，通过动态和渐进式…

人工智能

单卡搞定 Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. “` Llama 3.1、大模型压缩、LLMC、量化精度、工具包 “` 2. 北航、商汤、南洋理工等团队联合推出大模型压缩工具LLMC，能让单卡搞定Llama 3.1 405B，解决其内存需求大的问题，支持多种算法、具有多种优势，工具和论文地址已给出。 3…

人工智能

实测 7 款「Sora 级」视频生成神器，谁有本事登上「铁王座」？_AI阅读总结 — 包阅AI

by baoyueai10 9 月, 2024

包阅导读总结 1. 关键词：AI 视频、Sora 级、生成神器、测评、铁王座 2. 总结：本文对 7 款“ Sora 级”AI 视频生成工具进行实测，包括文生视频和图生视频，分析了各自在不同提示词下的表现，指出 Runway Gen-3 整体表现不错，可灵稳定，即梦色彩驾驭强等，还介绍了付费情况。 …

包阅AI · 知识分享

分类

英伟达对话模型 ChatQA 进化到 2.0 版本，上下文长度提到 128K_AI阅读总结 — 包阅AI

Meta「分割一切」进化 2.0！跟踪运动物体，代码权重数据集全开源_AI阅读总结 — 包阅AI

字节跳动科学家组团演讲，揭秘 AI 视频生成大招！_AI阅读总结 — 包阅AI

魔搭社区利用 NVIDIA TensorRT-LLM 加速开源大语言模型推理_AI阅读总结 — 包阅AI

统一多场景自动编译加速——支持动态 shape 场景，一套架构搞定训推需求_AI阅读总结 — 包阅AI

Ollama+Qwen2，轻松搭建支持函数调用的聊天系统_AI阅读总结 — 包阅AI

9.11 和 9.9 谁大？我们实测 15 个大模型，超半数翻车_AI阅读总结 — 包阅AI

苹果让大模型学会偷懒：更快吐出第一个 token，准确度还保住了_AI阅读总结 — 包阅AI

单卡搞定 Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了_AI阅读总结 — 包阅AI

实测 7 款「Sora 级」视频生成神器，谁有本事登上「铁王座」？_AI阅读总结 — 包阅AI