TTS-Voice-Wizard:VRChat头像语音转文本工具

TTS-Voice-Wizard

3.5 | 65 | 0
类型:
开源项目
最后更新:
2025/10/07
资源描述:
TTS-Voice-Wizard将语音转换为文本,用于VRChat头像,并将文本作为OSC消息发送。支持多种声音、翻译和集成。
分享:
语音转文本
VRChat头像
OSC
语音控制
无障碍

TTS-Voice-Wizard 概述

TTS-Voice-Wizard:让每个人在VRChat中都能发声

TTS-Voice-Wizard 是一款开源工具,旨在增强 VRChat 和其他应用程序中的可访问性和互动性。它允许用户将语音转换为文本,然后再转换回语音,并通过 OSC 消息在他们的 VRChat 头像上显示文本。该工具提供了广泛的自定义选项和集成,使其成为任何 VTuber 或 VRChat 爱好者工具包中的多功能补充。

什么是 TTS-Voice-Wizard?

TTS-Voice-Wizard 是一款语音转文本再转语音的应用程序,它将文本作为 OSC 消息发送到 VRChat,并在头像上显示。它支持各种语音识别和文本转语音方法,提供 100 多种不同的声音和自定义选项。该工具还包括显示当前在 Spotify 上或通过浏览器播放的歌曲的功能,以及通过 XSOverlay 显示追踪器和控制器电池电量。

TTS-Voice-Wizard 如何工作?

该应用程序的工作原理是捕获音频输入,使用语音识别将其转换为文本,然后使用选定的声音将文本转换回语音。然后,可以将此文本作为 OSC 消息发送到 VRChat,在那里使用 KillFrenzyAvatarText 或 Frosty's Billboard 等系统将其显示在用户的头像上。此外,TTS-Voice-Wizard 可以将语音翻译成 50 多种语言。

主要特点:

  • 语音转文本和文本转语音转换: 使用各种方法将语音转换为文本,然后再转换回来。
  • OSC 消息发送: 将文本作为 OSC 消息发送到 VRChat 以进行头像显示。
  • 多语言翻译: 将语音从一种语言翻译成 50 多种其他语言。
  • 语音自定义: 从 100 多种不同的声音中选择,并提供自定义选项。
  • Spotify 集成: 显示当前在 Spotify 上或通过浏览器播放的歌曲。
  • XSOverlay 集成: 显示追踪器和控制器电池电量。
  • Pulsoid/HRtoVRChat_OSC 集成: 在 VRChat 的聊天框中显示心率。
  • 语音命令: 使用语音命令控制 VRChat 头像参数。
  • 交互式计数器: 显示 VRChat 接触接收器触摸的可自定义计数器。

如何使用 TTS-Voice-Wizard?

  1. 下载: 从提供的链接下载 TTS Voice Wizard。
  2. 安装: 按照快速入门指南或教程视频中的说明进行操作。
  3. 配置: 根据您的需要设置 TTS Voice Wizard 的基本功能。

可以通过 scoop 进行替代安装:

scoop bucket add extras

scoop install extras/tts-voice-wizard

为什么选择 TTS-Voice-Wizard?

TTS-Voice-Wizard 因其全面的功能集和易用性而脱颖而出。它为增强 VRChat 中的通信和交互提供了一个多功能的解决方案,具有广泛的自定义选项和集成。免费版本和具有高级功能的专业版本的可用性满足了广泛的用户需求。

TTS-Voice-Wizard 适合哪些人?

  • VTuber: 通过实时语音转文本和语音自定义来增强您的直播。
  • VRChat 用户: 改善 VRChat 内的通信和可访问性。
  • 内容创作者: 使用语音命令和交互式元素创建引人入胜的内容。
  • 开发人员: 将语音转文本功能集成到自定义应用程序中。

VoiceWizardPro 的优势:

对于寻求更高级功能的用户,VoiceWizardPro 提供了多项优势,包括:

  • 即时访问高级语音: 享受来自 Microsoft Azure、Amazon Polly、Google Cloud 和 IBM Watson 的数百种声音。
  • 多语言魔法: 将语音翻译成 70 多种支持的语言。
  • 清晰的转录: 通过 DeepGram 的 Nova-2 模型访问语音识别。

系统要求是什么?

  • Windows 10/11(不保证与旧版本 Windows 的兼容性)

支持项目:

用户可以通过以下方式支持该项目:

  • 留下一个 Github 星星 ⭐
  • 订阅 Ko-Fi 或 Patreon
  • 解锁 VoiceWizardPro 的优势

外部链接:

通过使用 TTS-Voice-Wizard,用户可以显著增强他们的 VRChat 体验,使其对每个人都更具可访问性和吸引力。

"TTS-Voice-Wizard"的最佳替代工具

X Detector
暂无图片
87 0

X Detector 是一款免费的先进多语言 AI 内容检测器,能够准确识别 ChatGPT、Claude 和 Gemini 生成的文本,支持 20 多种语言。适合学生、教师和作家使用,以确保真实性和维护学术诚信。

AI内容检测
学术诚信工具
TranscribeMe
暂无图片
123 0

TranscribeMe 是一个免费 AI 机器人,可即时将 WhatsApp 和 Telegram 语音笔记转换为文本。只需将其添加到联系人,转发音频即可获取转录文本,无需下载或数据存储。功能包括翻译、ChatGPT 集成和提醒。

语音转录
消息机器人
AI 提醒
KoboldCpp
暂无图片
94 0

KoboldCpp:使用 KoboldAI UI 轻松运行 GGUF 模型,进行 AI 文本和图像生成。单文件,零安装。支持 CPU/GPU、语音转文本、文本转语音和 Stable Diffusion。

文本生成
图像生成
GGUF
DialogAi
暂无图片
108 0

DialogAi 是一款创新的 AI WhatsApp 聊天机器人,使用 OpenAI 技术将语音笔记转换为文本,并通过 ChatGPT 提供智能回答。只需向 +44 7893 943425 发送消息,即可即时开始聊天,享受无缝的 AI 移动助手。

WhatsApp语音转录
Transcriptal
暂无图片
277 0

Transcriptal:免费的AI驱动平台,可将YouTube视频和其他语音内容转录成100多种语言的文本。快速获得准确的摘要,无需注册。

YouTube文字稿
AI文字稿
Speechnotes
暂无图片
114 0

Speechnotes 是一款免费的 AI 驱动语音转文本工具,支持实时语音打字和快速音频/视频转录。准确、私密且易用,适用于笔记、访谈等场景。

语音听写
音频转录
实时语音识别
Wavve AI
暂无图片
206 0

Wavve AI 轻松地从音频录制、转录、总结和生成内容。将语音笔记转换为文本,用于会议记录、电子邮件、文章等。免费开始!

音频转文本
语音转录
自动摘要
ElevenLabs
暂无图片
286 0

ElevenLabs是一个逼真的AI语音平台,为创作者、开发者和企业提供文本转语音、语音克隆、配音和音乐生成功能。

文本转语音
语音克隆
AI音频
Lugs.ai
暂无图片
226 0

Lugs.ai 可以在没有互联网连接的情况下,准确地为您的计算机和麦克风上的所有音频添加字幕和转录。由听障人士打造,具有无与伦比的准确性。

实时字幕
离线转录
无障碍工具
Textie.ai
暂无图片
326 0

Textie.ai:一体化AI解决方案,用于增强日常任务。生成文本、与AI聊天、翻译等,以节省时间并提高效率。

AI工具
文本生成
内容创作
OutSkill
暂无图片
281 0

Outskill 是一款 AI 桌面语音助手,让你通过语音命令控制桌面。提高生产力,管理任务,并增强你的游戏体验。

桌面助手
语音控制
AI生产力
AssemblyAI
暂无图片
161 0

AssemblyAI提供行业领先的语音AI模型,用于准确的语音转文本转换和语音数据洞察。轻松构建突破性的语音AI应用程序。

语音转文本API
语音AI
转录
Transcriptmate
暂无图片
230 0

Transcriptmate只需两次点击即可提供快速、准确且经济实惠的音频转文本服务。转录音频文件或YouTube视频,并提供说话人分离和AI驱动的内容创作选项。

音频转文本
转录
语音识别
Klyra AI
暂无图片
84 0

Klyra AI 是终极全能平台,使用先进AI工具创建视频、配音、图像、博客、音乐等。无缝内容自动化和强大功能提升生产力。

内容生成
视频创作
声音克隆
Deepgram
暂无图片
239 0

Deepgram的语音AI平台为企业语音解决方案提供STT、TTS和语音代理API。 实时、准确且可扩展。 免费获得 200 美元信用额度!

语音转文本
文本转语音
语音AI