Posted in

解放双手:借助 AI 完成浏览器自动化! | 开源日报 No.313_AI阅读总结 — 包阅AI

包阅导读总结

1.

“`

AI、浏览器自动化、语言模型、开源项目、在线课程

“`

2.

文本主要介绍了多个开源项目,包括实现浏览器自动化的 skyvern、Python 官方实现 cpython、生成式 AI 框架 NeMo、语言模型 DeepSeek-V2 以及关于构建 AI 机器人的在线课程 llm-zoomcamp,并提及了它们的一些特性和优势。

3.

– 解放双手

– Skyvern

– 借助 AI 和计算机视觉自动化浏览器工作流程

– 能解析实时视口项目并交互,抵御网站布局更改

– Python

– 官方实现 cpython

– 支持多种构建选项和配置

– NVIDIA/NeMo

– 可扩展的生成式 AI 框架

– 为研究人员和开发人员构建

– DeepSeek-V2

– 强大、经济高效的混合语言模型

– 节省训练成本,提升生成吞吐量

– DataTalksClub/llm-zoomcamp

– 免费在线课程

– 关于构建能回答知识库问题的 AI 机器人

思维导图:

文章地址:https://mp.weixin.qq.com/s/ijfMfxsnIeipH8rIClN4Ng

文章来源:mp.weixin.qq.com

作者:帅比柒

发布时间:2024/7/29 16:36

语言:中文

总字数:696字

预计阅读时间:3分钟

评分:91分

标签:AI自动化,开源项目,生成式AI框架,Python语言,混合语言模型


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

picture

Skyvern-AI/skyvernhttps://github.com/Skyvern-AI/skyvern

Stars: 5.5k License: AGPL-3.0

picture

skyvern 是使用 LLMs 和计算机视觉自动化基于浏览器的工作流程。

  • 添加了计算机视觉和 LLMs 来解析实时视口中的项目,并与之交互
  • 抵抗网站布局更改,没有预先确定的 XPaths 或其他选择器系统正在寻找导航时

python/cpythonhttps://github.com/python/cpython

Stars: 61.3k License: NOASSERTION

cpython 是 Python 编程语言的官方实现。该项目的主要功能、关键特性、核心优势包括:

  • 支持各种构建选项和配置,并提供了相关的构建说明文档

NVIDIA/NeMohttps://github.com/NVIDIA/NeMo

Stars: 11.0k License: Apache-2.0

NeMo 是一个可扩展的生成式 AI 框架,专为研究大型语言模型、多模态和语音 AI(自动语音识别和文本到语音)的研究人员和开发人员构建。NeMo 的主要功能、关键特性和核心优势包括:

deepseek-ai/DeepSeek-V2https://github.com/deepseek-ai/DeepSeek-V2

Stars: 3.1k License: MIT

picture

DeepSeek-V2 是一个强大、经济高效的专家混合语言模型。该项目主要功能、关键特性和核心优势包括:

  • 拥有 236B 总参数,其中每个标记激活了 21B
  • 相较于 DeepSeek 67B,DeepSeek-V2 在提升性能的同时节省了 42.5% 的训练成本,并将最大生成吞吐量提升至 5.76 倍
  • 提供模型下载、评估结果、模型架构以及 API 平台等信息

DataTalksClub/llm-zoomcamphttps://github.com/DataTalksClub/llm-zoomcamp

Stars: 2.5k License: NOASSERTION

picture

llm-zoomcamp 是一个关于构建能够回答有关知识库问题的 AI 机器人的免费在线课程。

  • 10 周学习如何构建能够回答有关知识库问题的 AI 机器人
  • 计划涵盖 LLMs 和 RAG 介绍、自托管 LLMs、向量数据库与检索技术等内容