音乐去除人声神器：精准分离，专业之选 | 开源日报 No.282_AI阅读总结

包阅导读总结

1. 音乐人声去除、深度学习、Python、高性能推断、语音识别

2. 本文介绍了几款开源项目，包括音乐去除人声的 ultimatevocalremovergui、深度学习推断的 TensorRT、贝叶斯建模的 pymc、高性能 GPU 处理的 warp 以及用于 iOS 和 macOS 的语音识别工具 WhisperKit。

– ultimatevocalremovergui

– 基于深度神经网络的人声去除器的图形用户界面

– 开发者训练模型，支持 Windows 和 MacOS 系统，无需预先安装依赖项

– TensorRT

– NVIDIA GPU 上的高性能深度学习推断 SDK

– 包含开源组件，提供示例应用，支持预构建 Python 包

– pymc

– Python 中的贝叶斯建模和概率编程工具

– 具有变分推断等功能，依赖 PyTensor 优化

– warp

– 高性能 GPU 模拟和图形处理的 Python 框架

– 可 JIT 编译 Python 函数，适用于多种计算，支持 CUDA-capable NVIDIA GPU

– WhisperKit

– 用于 iOS 和 macOS 的 Swift 本地语音识别工具

– 使用 OpenAI 的 Whisper 模型和苹果 CoreML 框架，可通过 Swift Package Manager 集成

思维导图：

文章地址：https://mp.weixin.qq.com/s/YyV1rpslvMJjXL0vOYq4mg

文章来源：mp.weixin.qq.com

作者：帅比柒

发布时间：2024/6/20 1:06

语言：中文

总字数：702字

预计阅读时间：3分钟

评分：81分

标签：音频处理,深度学习,开源

以下为原文内容

本内容来源于用户推荐转载，旨在分享知识与观点，如有侵权请联系删除联系邮箱 media@ilingban.com

Anjok07/ultimatevocalremoverguihttps://github.com/Anjok07/ultimatevocalremovergui

Stars: 15.8k License: MIT

ultimatevocalremovergui 是一个使用深度神经网络的人声去除器的图形用户界面。该项目提供了以下主要功能、关键特性和核心优势：

UVR 的核心开发者训练了所有在此软件包中提供的模型（除了 Demucs v3 和 v4 4-stem 模型）
可以在 Windows 和 MacOS 系统上安装和运行
不需要预先安装任何依赖项，软件包含 UVR 接口、Python、PyTorch 等必要组件

NVIDIA/TensorRThttps://github.com/NVIDIA/TensorRT

Stars: 9.7k License: Apache-2.0

TensorRT 是 NVIDIA GPU 上进行高性能深度学习推断的 SDK。

包含 TensorRT 插件和 ONNX 解析器的开源软件组件
提供示例应用程序，演示了 TensorRT 平台的使用和功能
支持预构建的 TensorRT Python 包，方便安装

pymc-devs/pymchttps://github.com/pymc-devs/pymc

Stars: 8.3k License: NOASSERTION

pymc 是一个用于在 Python 中进行贝叶斯建模和概率编程的工具。该项目主要功能、关键特性、核心优势包括：

变分推断：快速近似后验估计以及针对大数据集的小批量变分推断
依赖 PyTensor 提供计算优化和动态 C 或 JAX 编译等功能

NVIDIA/warphttps://github.com/NVIDIA/warp

Stars: 2.7k License: NOASSERTION

warp 是一个用于高性能 GPU 模拟和图形处理的 Python 框架。该项目主要功能、关键特性、核心优势包括：

将常规的 Python 函数 JIT 编译成可在 CPU 或 GPU 上运行的高效内核代码
适用于空间计算，提供丰富的原语，方便编写物理模拟、感知、机器人技术和几何处理程序
内置微分功能，可与 PyTorch 和 JAX 等框架一起用作机器学习流水线中的一部分
支持 CUDA-capable NVIDIA GPU，并提供了安装指南和示例代码以及 USD 文件生成等功能。

argmaxinc/WhisperKithttps://github.com/argmaxinc/WhisperKit

Stars: 2.6k License: MIT

WhisperKit 是一个用于 iOS 和 macOS 应用程序的 Swift 本地语音识别工具。

使用 OpenAI 的 Whisper 语音识别模型
集成了苹果的 CoreML 框架，可在 Apple 设备上进行高效、本地推理
可以通过 Swift Package Manager 轻松集成到 Swift 项目中
提供了生成自定义模型和使用 Swift CLI 进行测试与调试的能力

分类

音乐去除人声神器：精准分离，专业之选 | 开源日报 No.282_AI阅读总结 — 包阅AI