Posted in

比其他工具快 10 到 100 倍!Rust 编写的 py 代码格式化工具 | 开源日报 No.339_AI阅读总结 — 包阅AI

包阅导读总结

1. 关键词:Rust、代码格式化、开源项目、LLM、漏洞利用

2. 总结:本文介绍了多个开源项目,包括用 Rust 编写的快速 Python 代码格式化工具 ruff,能将 URL 转换为 LLM 友好输入的 picturereader,挖掘多模态视觉语言模型潜力的 MiniGemini,实现程序自主改进的 auto-code-rover,以及适用于多个 Linux 内核版本的提权漏洞利用程序 CVE-2024-1086。

3. 主要内容:

– ruff:

– 用 Rust 编写的 Python 代码检查器和格式化工具。

– 比现有工具快 10 到 100 倍,具备相同功能接口兼容性,支持自动修复错误。

– 在多个主要开源项目中应用。

– picturereader:

– 将任何 URL 转换为 LLM 友好输入。

– 有标准、流媒体模式,支持多种输出格式。

– 代码基于 Node v18 构建,后端采用 Firebase CLI 管理。

– MiniGemini:

– 挖掘多模态视觉语言模型潜力。

– 支持多种大型语言模型,具有图像理解、推理和生成功能。

– auto-code-rover:

– 自动化软件工程师,结合 LLMs 解决 GitHub 问题。

– 具有程序结构感知的代码搜索 API,能利用测试套件提高修复率。

– CVE-2024-1086:

– 通用本地提权漏洞利用程序。

– 适用于多数 Linux 内核版本和发行版,在 KernelCTF 镜像中成功率高。

思维导图:

文章地址:https://mp.weixin.qq.com/s/HqRxgAZbUw924wGn1RNTDQ

文章来源:mp.weixin.qq.com

作者:帅比柒

发布时间:2024/8/23 16:28

语言:中文

总字数:956字

预计阅读时间:4分钟

评分:89分

标签:Rust,Python,代码格式化,开源社区,开源工具


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

astral-sh/ruffhttps://github.com/astral-sh/ruff

Stars: 29.8k License: MIT

ruff 是一个用 Rust 编写的极快的 Python 代码检查器和格式化工具。Ruff 的主要功能、关键特性和核心优势包括:

  • 比现有的代码检查器(如 Flake8)和格式化工具(如 Black)快 10 到 100 倍
  • 和 Flake8、isort 和 Black 具备相同功能接口兼容性
  • 支持自动修复错误,例如自动删除未使用的导入语句等功能

Ruff 致力于比替代工具更快,并在单个通用界面中集成更多功能。它可以取代 Flake8、Black、isort 等多个工具,并且执行速度比任何单独工具都要快几十到几百倍。Ruff 在 Apache Airflow、Apache Superset、FastAPI 等主要开源项目中得到广泛应用。

jina-ai/readerhttps://github.com/jina-ai/reader

Stars: 6.0k License: Apache-2.0

picture

reader 是一个将任何 URL 转换为 LLM 友好输入的项目。该项目可以通过简单的前缀 https://r.jina.ai/,将任何 URL 转换为 LLM 友好 输入,提供更好的输出结果给您的 agent 和 RAG 系统。主要功能和优势包括:

  • 可以在标准模式下使用,只需在任何 URL 前加上 https://r.jina.ai/
  • 支持流媒体模式,在处理大型页面或需要立即内容交付时非常有用
  • 提供 JSON 模式,并可通过 accept-header 控制输出格式
  • 代码基于 Node v18 构建,并且部署到 https://r.jina.ai 后端采用 Firebase CLI 进行管理。

dvlab-research/MGMhttps://github.com/dvlab-research/MGM

Stars: 3.1k License: Apache-2.0

picture

MiniGemini 是用于挖掘多模态视觉语言模型潜力的官方实现。

  • 支持从 2B 到 34B 的一系列密集和 MoE 大型语言模型,同时具有图像理解、推理和生成功能。
  • 提供了包括演示、代码、模型和数据在内的 Mini-Gemini 发布内容。
  • 框架简单:使用双视觉编码器提供低分辨率视觉嵌入和高分辨率候选项;提出补丁信息挖掘以在高分辨率区域与低分辨率视觉查询之间进行补丁级别挖掘;LLM 用于将文本与图像结合起来,同时进行理解和生成。

nus-apr/auto-code-roverhttps://github.com/nus-apr/auto-code-rover

Stars: 2.5k License: NOASSERTION

picture

auto-code-rover 是一个自动化软件工程师,旨在实现程序的自主改进。

  • 通过结合 LLMs 与分析和调试功能来解决 GitHub 问题(修复错误和添加功能)。
  • 在 SWE-bench lite 上,AutoCodeRover 解决了约 22% 的问题,提高了 AI 软件工程师当前最先进效果。
  • 程序结构感知的代码搜索 API。不是简单地通过字符串匹配在文件中搜索,而是在抽象语法树中搜索相关代码上下文(方法/类)。
  • 当测试套件可用时,AutoCodeRover 可以利用测试案例来实现更高的修复率,并进行统计故障定位。

Notselwyn/CVE-2024-1086https://github.com/Notselwyn/CVE-2024-1086

Stars: 2.2k License: MIT

CVE-2024-1086 是一个通用的本地提权漏洞利用程序,适用于大多数 Linux 内核版本(从 v5.14 到 v6.6),包括 Debian、Ubuntu 和 KernelCTF。在 KernelCTF 镜像中成功率为 99.4%。

  • 攻击范围广泛,适用于多个 Linux 内核版本和发行版