#
TTS
SillyTavern 有广泛的 TTS 选项。本页面解释设置和使用。
#
它是什么?
TTS 用于让语音叙述您聊天的部分内容。
#
配置 TTS
#
TTS 提供商选择框
用于选择您想要使用的 TTS 服务。
- ElevenLabs - 需要付费订阅,目前可用的最高质量语音。
- Silero - 免费,在您的 PC 上运行,质量可能差异很大
- System - 使用您的操作系统 TTS 引擎(如果存在)。质量可能因操作系统而异。
- Edge - 免费,通过 Azure 运行,通常相当快,语音感觉自然但干涩无情感。就像听晚间新闻或广播播音员。当选择"Plugin"作为提供商运行时,您还需要安装此服务器插件,否则 TTS 将无法工作。
- Coqui-TTS - 免费,目前没有 API 实现。高性能 Text2Speech 模型(Tacotron、Tacotron2、Glow-TTS、SpeedySpeech)以及 Bark。
- Novel - 需要付费的 NovelAI 订阅,由 NovelAI 的 TTS 引擎生成
- RVC - 免费,语音克隆
#
复选框
- 启用 - 打开/关闭 TTS 播放
- 自动生成 - 让 TTS 在新消息进入聊天时自动开始播放
- 仅叙述"引号内容" - 限制 TTS 播放仅包括
"引号内"的文本。这将*包括星号行内的"引号内容"*(内部变量名 =narrate_quoted_only) - 忽略星号内的文本,即使是"引号内容" - TTS 不会播放
*星号内*的任何文本,即使是"引号内容"(内部变量名 =narrate_dialogues_only) - 同时勾选"仅叙述引号内容"和"忽略星号"复选框将导致 TTS 只读取不在星号内的"引号内容",并忽略其他所有内容。
- 仅叙述翻译文本 - 这将使 TTS 仅叙述翻译文本。
给定示例文本:*Cohee approaches you with a faint "nya"* "Good evening, senpai", she says.
以下表格显示文本将如何根据 忽略星号内的文本,即使是"引号内容" 和 仅叙述"引号内容" 的布尔状态进行修改:
#
滑块
这些将根据您选择的 API 而变化。
(解释即将推出)
#
按钮
- 应用 - 设置 TTS API 和编辑语音映射后必须单击此按钮。
- 可用语音 - 加载一个弹出窗口,其中包含您所选 API 的所有可用语音,并让您使用示例对话预览它们。
#
使用 TTS
- 单击"启用"复选框,否则什么都不会发生。
- 如果您希望 TTS 在每次新消息到达聊天时自动开始,请单击"自动生成"复选框。
- 可选地,单击任何消息右上角的扩音器图标以按需播放。
- 单击右下角的"停止"按钮(在魔杖菜单内找到)以停止任何播放。
#
语音映射
您必须为 TTS 提供语音映射,否则它将不知道应该为每个角色使用什么语音。
这些必须采用下面所述的确切格式:
角色名称:TTS语音,角色名称2:TTS语音2
对于 Coqui-TTS,格式需要包括来自 WebGUI 的说话者和语言:
角色名称:TTS语音[说话者ID][语言ID]
或
Aqua:tts_models--multilingual--multi-dataset--your_tts\model_file.pth[2][1]
#
Bark ZeroShot 语音克隆说话者
如果使用 Bark,您必须创建一个带有语音文件的语音文件夹以进行克隆。确保将语音添加到 homedir\tts\bark_v0\speakers\。在 Windows 上,可能是 C:\Users\USERACCOUNT\AppData\Local\tts\bark_v0\speakers\,在 Windows 资源管理器中键入 %appdata%,然后向上导航到 local 目录,您应该会看到 tts。
目录应该看起来像这样:
- homedir
- tts
- bark_v0
- speakers
- customvoice1
- speaker.wav
- speaker.npz
- robinwilliams
- speaker.mp3
- me
- speaker.mp3
- customvoice1
- speakers
- bark_v0
- tts
首次加载此模型和语音时,bark 将克隆语音并创建 .npz 文件,这是更快的 TTS 所必需的。