文字转语音(Text to Speech,简称 TTS)是把文字变成语音的 AI 工具。你把稿子打好,它帮你念成自然的人声,省下租录音室、找配音员、自己对着麦克风重录好几次的时间。常被拿来做视频旁白、Podcast、有声书、社交短视频,以及无障碍朗读。
这两年最大的变化是音质。早期 TTS 一听就是机械音,现在的 ElevenLabs、Murf 这类工具已经能做到接近真人,还能复制特定声音、生成多人对白。下面把主要工具、免费与付费的区别、繁体中文与台湾口音、商用授权要注意的地方整理清楚。
文字转语音(TTS)是什么
核心很简单:输入文字,选一个声音,生成语音文件。差别在三个地方:
- 音质自然度:新一代模型接近真人,旧款偏机械音。
- 语言与口音:同样是中文,普通话、台湾普通话、香港粤语差很多。
- 进阶功能:语音克隆(复制某个声音)、多人对白、情绪语气控制。
这个领域 2026 年仍在快速变动,价格、免费额度、支持语言、商用条款常常改,看的时候务必以官方当下信息为准。
主要工具一览
| 工具 | 定位 | 免费方案 | 付费起价 | 中文/繁中 |
|---|---|---|---|---|
| ElevenLabs | 国际拟真、语音克隆、多人对白 | 10,000 credits/月(约 10 分钟) | Starter US$6/月 | 中文/普通话官方确认;繁中待实测 |
| Murf AI | 商用配音 Studio | 免费试用(不能下载) | Creator 约 US$19/月 | 含 Chinese (Taiwanese) |
| 雅婷 Yating | 台湾口音 TTS | 有免费体验 | 待查证 | 主打台湾口音 |
| VoAI 绝好声创 | 台湾口音配音员最多 | 有免费试用 | 待查证 | 主打台湾口音、可多人对白 |
| TTSMaker | 免费可下载、可商用 | 永久免费(每周约 2 万字符) | Pro 待查证 | 含繁体中文 |
| PlayAI(Play.ht) | 多人对白、API | 免费试用 | 待查证 | 含台湾中文 |
(ElevenLabs 与 Murf 的数字来自官方页;雅婷、VoAI 的付费价格官方页未明列,标「待查证」。PlayAI 官方页 2026-05 出现服务终止字样但仍有产品入口,状态待查证。实际以官方为准。)
「免费」要拆成三种意思
很多人看到「免费」就以为能直接拿来用,踩坑常常在这。免费至少要分三层问清楚:
- 能不能听:几乎都能,免费试听通常没问题。
- 能不能下载:这里开始分歧。Murf 免费试用不能下载;NaturalReader 免费版能听但不能转 mp3。
- 能不能商用:最容易忽略。Narakeet 免费版官方写明不能商用;TTSMaker 则官方标明可商用、不强制标示来源。
所以「免费配音」要先确认你要的是试听、下载,还是商用。需要免费又能下载商用,TTSMaker 是目前少数官方就这样写的。
繁体中文与台湾口音
中文 TTS 最大的雷是:工具标了「Chinese」不代表台湾普通话自然。很多标「Chinese」的声音是大陆普通话腔,念起台湾口语会怪。
要做台湾内容,建议优先试听这几个:
- 雅婷 Yating、VoAI 绝好声创:台湾本土服务,官方都主打台湾口音,VoAI 还强调「全球最多台湾口音 AI 配音声优」。
- Murf 的 Chinese (Taiwanese)、Narakeet 的 Taiwanese Mandarin、TTSMaker 的繁体中文:国际工具里有把台湾普通话单独列出来的。
最准的方法是用同一段台湾口语文案,在几个工具各生成一次,直接比听感。规格表写得再好听,不如自己耳朵听一遍。
做 Podcast、多人对白
如果要做双人 Podcast 或有对话的视频,重点看「多人对白」能力:
- ElevenLabs v3:官方标示对话最优化、支持多人对白。
- VoAI 文字 MP3 专业版:官方写支持多人对话配音、配音员数量多。
- PlayAI(Play.ht):有多角色对白(PlayDialog)功能,但官方服务状态待查证,先别当主力。
一样建议用同一段两人对白文案各家试一次,听角色切换和语气衔接自不自然。
搭配:用 NotebookLM 先把资料变成逐字稿
配音前你得先有稿。如果手上只有零散资料、还没有可以念的文字,可以先用 NotebookLM 来「转文字」:上传来源(PDF、网页、笔记)后,直接跟它说「生成逐字稿」或「整理成口播脚本」,它会把资料整理成可念的文字稿,你再拿去上面的 TTS 工具配音。
它本身是把资料整理成文字/逐字稿的工具,不是配音器,所以摆在配音流程的「前一步:先生稿」最合适。想深入看 NotebookLM 完整教程。
基本流程
- 先想清楚用途:视频旁白、Podcast、有声内容,要不要商用。
- 选工具与声音:在意台湾口音先试雅婷/VoAI,要国际拟真试 ElevenLabs。
- 贴文字、调语速与语气,生成试听。
- 不满意就换声音或调参数重做。
- 下载前确认:免费版能不能下载、能不能商用、要不要标示来源。
商用授权要先看
这是最该讲清楚的一块。免费方案常见限制就是不能商用、不能下载,或下载要付费。发布前一定要对着官方条款确认:
- 商用权:ElevenLabs、Murf 的付费方案官方标示可商用;TTSMaker 免费就标明可商用;Narakeet 免费版不能商用。
- 声音克隆的合规:复制别人的声音涉及肖像权与人格权,务必取得授权,别拿名人或他人声音乱用。
- 发布披露:用 AI 生成的语音内容,建议标明 AI 生成、遵守平台规范。
怎么选
- 想要国际拟真、语音克隆、多人对白 → ElevenLabs。
- 做商用配音、要稳定的 Studio 流程 → Murf。
- 在意台湾口音、繁中自然度 → 先试雅婷、VoAI。
- 要免费又能下载商用 → TTSMaker。
各家价格、免费额度与台湾可用性变动快,挑之前先确认官方当下信息,并用自己的文案实际试听。
延伸阅读
整理:Penna|小企鹅 Penchan。价格与功能以各平台官方公告为准。