人工智能 – 第 53 页 – 包阅AI

包阅导读总结 1. 关键词：Andrej Karpathy、Eureka Labs、AI 教育、LLM101n、创业 2. Andrej Karpathy 官宣创办人工智能+教育公司 Eureka Labs，其首个产品是课程 LLM101n。他曾在特斯拉、OpenAI 等任职，如今全身心投入教育，谷…

人工智能

消费级显卡，17G 显存，玩转图像生成模型 FLUX.1！_AI阅读总结 — 包阅AI

by baoyueai2 9 月, 2024

包阅导读总结 1. “` FLUX.1、图像生成模型、消费级显卡、stable diffusion、ComfyUI “` 2. FLUX.1 是由 stable diffusion 部分核心开发者推出的全新图像生成模型，与 SD3 有相似处和区别。它在多种能力上效果良好，提供…

人工智能

Mistral 新旗舰决战 Llama 3.1！最强开源 Large 2 123B，扛鼎多语言编程全能王_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. 关键词：Mistral Large 2、Llama 3.1、开源模型、多语言、性能 2. 总结：Mistral 发布新旗舰模型 Large 2，参数量为 123B，不到 Llama 3.1 的三分之一。它在编码、数学和多语言等领域表现出色，支持单节点部署，可与 SOTA 模型竞争…

人工智能

什么是 “认知架构”？_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. 关键词：认知架构、LLM 应用、自主性级别、系统思维、架构选择 2. 总结：本文介绍了“认知架构”的含义，将其与系统思维相关联，并对应不同自主性级别的 LLM 应用举例。还提到选择认知架构时应考虑任务需求，LangChain 和 LangGraph 变得更灵活可定制以适应不同架构…

人工智能

重构标签将零样本文本分类性能提升 30%_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. 关键词：零样本分类、嵌入模型、标签重述、分类任务、性能提升 2. 总结：本文探讨零样本文本分类，指出其现实场景和可行性，介绍了基线方法，提出改进策略及相关实验，包括利用语言模型生成样本和重述标签以提升性能等。 3. 主要内容： – 零样本分类的设定与问题 &#8211…

人工智能

算法、系统和应用，三个视角全面读懂混合专家（MoE）_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. “` 混合专家（MoE）、大型语言模型、稀疏门控、算法分类、系统设计 “` 2. 混合专家（MoE）是提升大型语言模型效率的重要方法，历经多年发展。其基于模型不同部分专注不同任务的思想，分为密集和稀疏两类。文中从算法、系统和应用三方面介绍了MoE，包括门控…

人工智能

OpenAI 突发新模型，GPT-3.5 退役，大模型成本 2 年骤降 99%_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. “` OpenAI、GPT-4o mini、大模型成本、模型竞争、新进展 “` 2. OpenAI 推出新模型 GPT-4o mini，取代 GPT-3.5，成本两年骤降 99%。GPT-4o mini 能力接近 GPT-4，价格便宜，在多项测试中表现出色…

人工智能

击败 GPT-4o 的开源模型如何炼成？关于 Llama 3.1 405B，Meta 都写在这篇论文里了_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. “` Llama 3.1 、开源模型、Meta 、GPT-4o 、性能提升 “` 2. Llama 3.1 昨夜正式发布，将上下文长度扩展，有多个版本。405B 版性能接近 GPT-4o，Meta 公布相关论文揭示研究细节，包括数据、规模、推理优化等方面的…

人工智能

RLHF 不够用了，OpenAI 设计出了新的奖励机制_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. 关键词：OpenAI、RBR、语言模型、安全政策、强化学习 2. 总结：OpenAI 为解决传统语言模型安全训练中人类反馈的低效和过时问题，提出基于规则的奖励（RBR）机制，其能适应安全政策变化，减少人工数据需求，实验表明训练效果良好，也存在局限，未来计划更广泛研究。 3. 主要…

人工智能

LoRA 综述来了! 浙大《大语言模型的 LoRA 研究》综述_AI阅读总结 — 包阅AI

by baoyueai30 8 月, 2024

包阅导读总结 1. 关键词：LoRA、大语言模型、参数高效微调、跨任务泛化、联邦学习 2. 总结：LoRA 是一种参数高效微调方法，在大语言模型中表现出色，本文综述了其进展，包括改进性能的变体、跨任务泛化、计算效率提升、数据隐私保护及应用，还探讨了未来研究方向，如在生成即服务等领域的发展。 3. 主…