Posted in

音乐去除人声神器:精准分离,专业之选 | 开源日报 No.282_AI阅读总结 — 包阅AI

包阅导读总结

1. 音乐人声去除、深度学习、Python、高性能推断、语音识别

2. 本文介绍了几款开源项目,包括音乐去除人声的 ultimatevocalremovergui、深度学习推断的 TensorRT、贝叶斯建模的 pymc、高性能 GPU 处理的 warp 以及用于 iOS 和 macOS 的语音识别工具 WhisperKit。

3.

– ultimatevocalremovergui

– 基于深度神经网络的人声去除器的图形用户界面

– 开发者训练模型,支持 Windows 和 MacOS 系统,无需预先安装依赖项

– TensorRT

– NVIDIA GPU 上的高性能深度学习推断 SDK

– 包含开源组件,提供示例应用,支持预构建 Python 包

– pymc

– Python 中的贝叶斯建模和概率编程工具

– 具有变分推断等功能,依赖 PyTensor 优化

– warp

– 高性能 GPU 模拟和图形处理的 Python 框架

– 可 JIT 编译 Python 函数,适用于多种计算,支持 CUDA-capable NVIDIA GPU

– WhisperKit

– 用于 iOS 和 macOS 的 Swift 本地语音识别工具

– 使用 OpenAI 的 Whisper 模型和苹果 CoreML 框架,可通过 Swift Package Manager 集成

思维导图:

文章地址:https://mp.weixin.qq.com/s/YyV1rpslvMJjXL0vOYq4mg

文章来源:mp.weixin.qq.com

作者:帅比柒

发布时间:2024/6/20 1:06

语言:中文

总字数:702字

预计阅读时间:3分钟

评分:81分

标签:音频处理,深度学习,开源


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

picture

Anjok07/ultimatevocalremoverguihttps://github.com/Anjok07/ultimatevocalremovergui

Stars: 15.8k License: MIT

picture

ultimatevocalremovergui 是一个使用深度神经网络的人声去除器的图形用户界面。该项目提供了以下主要功能、关键特性和核心优势:

  • UVR 的核心开发者训练了所有在此软件包中提供的模型(除了 Demucs v3 和 v4 4-stem 模型)
  • 可以在 Windows 和 MacOS 系统上安装和运行
  • 不需要预先安装任何依赖项,软件包含 UVR 接口、Python、PyTorch 等必要组件

NVIDIA/TensorRThttps://github.com/NVIDIA/TensorRT

Stars: 9.7k License: Apache-2.0

TensorRT 是 NVIDIA GPU 上进行高性能深度学习推断的 SDK。

  • 包含 TensorRT 插件和 ONNX 解析器的开源软件组件
  • 提供示例应用程序,演示了 TensorRT 平台的使用和功能
  • 支持预构建的 TensorRT Python 包,方便安装

pymc-devs/pymchttps://github.com/pymc-devs/pymc

Stars: 8.3k License: NOASSERTION

pymc 是一个用于在 Python 中进行贝叶斯建模和概率编程的工具。该项目主要功能、关键特性、核心优势包括:

  • 变分推断:快速近似后验估计以及针对大数据集的小批量变分推断
  • 依赖 PyTensor 提供计算优化和动态 C 或 JAX 编译等功能

NVIDIA/warphttps://github.com/NVIDIA/warp

Stars: 2.7k License: NOASSERTION

warp 是一个用于高性能 GPU 模拟和图形处理的 Python 框架。该项目主要功能、关键特性、核心优势包括:

  • 将常规的 Python 函数 JIT 编译成可在 CPU 或 GPU 上运行的高效内核代码
  • 适用于空间计算,提供丰富的原语,方便编写物理模拟、感知、机器人技术和几何处理程序
  • 内置微分功能,可与 PyTorch 和 JAX 等框架一起用作机器学习流水线中的一部分
  • 支持 CUDA-capable NVIDIA GPU,并提供了安装指南和示例代码以及 USD 文件生成等功能。

argmaxinc/WhisperKithttps://github.com/argmaxinc/WhisperKit

Stars: 2.6k License: MIT

picture

WhisperKit 是一个用于 iOS 和 macOS 应用程序的 Swift 本地语音识别工具。

  • 使用 OpenAI 的 Whisper 语音识别模型
  • 集成了苹果的 CoreML 框架,可在 Apple 设备上进行高效、本地推理
  • 可以通过 Swift Package Manager 轻松集成到 Swift 项目中
  • 提供了生成自定义模型和使用 Swift CLI 进行测试与调试的能力