ElevenLabs 评论:2024 年仍然很棒吗?
8分钟读
发表于
阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多
我的 ElevenLabs 评论可以帮助您更好地了解这个人工智能驱动的语音平台。有些人认为它是 TTS(文字转语音),但在我看来,还有更多。公司用它来启动和完成他们的复杂项目。它甚至包括语音到语音选项。
那么,让我们来看看吧?
十一实验室是什么?
十一实验室 是一个 语音人工智能平台,允许用户创建语音 有数十种语言的数千种声音。它融合了各种功能和最好的人工智能模型之一,使输出听起来自然且质量极高。
特征
我的 ElevenLabs 评论的核心是主要功能的概览。这些是该公司从 2022 年的初创公司一跃成为行业领导者的主要原因。
语音合成
ElevenLabs 的主要功能称为 语音合成。它可以做两件事:
- 将文本转换为语音
- 将语音转换为语音
这里有 几个AI模型 无论您寻求什么输入,您都可以从中进行选择。他们最适合用英语,但他们也 支持其他28种语言.
可用的声音标有几个不同的参数:
- 口音
- 音色
- 潜在的用例。
口音非常酷,也可能是 ElevenLabs 声音胜过所有竞争对手的部分。除了标准的美式和英式之外,还有许多其他有用的选项,例如美式意大利式或英式埃塞克斯式。
如果您想让音频故事生动起来,您必须 选择一个合适的 音色。它可以是深刻的、残破的、强大的,或者任何你能想象到的东西!
最后,它非常人性化,您可以选择专门为游戏、旁白或纪录片构建的声音。
最重要的是:
如果您对任何预制选项不满意,您可以 创建你自己的声音。免费计划提供此功能,因此您无需支付任何费用即可测试它。稍后会详细介绍这一点。
其他语音设置包括:
- 稳定性
- 清晰度+相似性
- 风格夸张。
如果您打算多次使用同一个声音,则应该加大力度 稳定性 几乎达到最大。这可能会使声音单调,但不同代之间的输出不会有所不同。
清晰度+相似性 设置允许您增强输出,但存在伪影的风险。如果您使用额外的音效或背景音乐,请保持低调。
风格夸张 可以带来更有活力的演讲。另一方面,它也会导致生成时不稳定,所以要谨慎使用。
很高兴知道:AI 语音分类器可以识别语音是否是由 ElevenLabs 生成的。您必须上传音频文件(小于10MB),系统会给你分析。音频仅限一分钟。
语音实验室
我已经暗示过你可以 创建你自己的声音 在十一实验室。 VoiceLab 功能允许您克隆现有语音并用它快速生成语音。
重要:您可以使用自己的声音,也可以在获得他人许可的情况下使用他人的声音。
首先,区分两件事很重要:
- 即时语音克隆 (IVC)
- 专业语音克隆 (PVC)
IVC 用于 较短的样本 和它 不包括AI模型训练.
所提供的数据必须包含一名没有背景噪音的说话者。长度应超过一分钟。
PVC包括 AI模型训练, 结果,你得到了一个超现实的模型。你必须 最多等待一个月 得到结果,这需要认真的计算。
不过,等待还是值得的,因为 你会得到一个与你训练时相同的声音。
或者,您可以从以下选项中选择一个: 人工智能语音库。它们是由其他 ElevenLabs 用户创建的公开可用的自定义声音。
该库组织良好,您可以轻松地按以下条件进行筛选:
- 产品类别
- 性别
- 年龄
- 口音。
配音
如果您用一种语言制作内容但想要 提供更多语言版本,您可以使用ElevenLabs配音功能。
AI 配音有很多用例,但最流行的包括:
- 社交媒体内容
- 营销
- 电子学习。
与许多其他解决方案不同,ElevenLabs 支持多扬声器 音频和视频文件。这意味着它也适用于采访、播客和其他内容。
首先,您必须提供输入,可以是:
- MP3、MP4、WAV 和 MOV 文件
- Youtube
- TikTok
- X(推特)
- Vimeo的。
ElevenLabs 还支持其他 URL,但列出的 URL 确实可以工作。
提交配音文件后,选择 源语言和目标语言.
还有一个选项 选择 发言人数。如果您打算使用该平台进行配音,我建议您选择它以提高输出质量。
项目
项目是一种先进的方法 处理复杂的任务 在一个环境内。 前面提到的所有功能都可用。唯一的区别是您可以使用一些高级设置。
如果您正在寻找一个平台 创建音频版本 你的书的,这是一个很好的起点!当您想要包含多个声音时也可以使用它。
你可以在角色之间无缝切换,调整他们的声音,并重新生成他们,直到满意为止。
有一个选项可以将内容分为 章 并为你的工作带来很多结构。
总而言之,ElevenLabs 中的项目结合了在一个平台上完成大量任务所需的所有功能。与其他解决方案不同,您不必使用多种工具并浪费时间 - 它们已经设置好了。
低延迟API
如果您是一名开发人员,您一定会喜欢这个。 ElevenLabs 承诺 高级文本转语音 API,响应时间低于 400 毫秒!
实际上,这意味着您可以 生成实时语音 不到一秒钟。这适用于聊天机器人、销售和其他项目。
此外,您可以调整延迟和优化设置。这 API文档组织良好,所以设置应该很容易。
这里有 提供 1000 种语言的 29 种语音!
最酷的事情是将其与其他人工智能模型相结合,例如 ChatGPT。请记住,ElevenLabs 可以处理将文本转换为语音,但您可能需要一个模型来首先生成文本。
通过 API 访问,您可以使用 即时语音克隆 和 专业语音克隆 正如我之前提到的。
如果这听起来令人兴奋,但您不是开发人员,请查看 用于编码的最佳自定义 GPT 以开始浏览网页。
总的来说,动态创建一个 人工智能语音 根据手头的数据。
如何使用ElevenLabs?
现在您对这个平台有了更多的了解,让我们学习如何使用它吧!作为 ElevenLabs 评论的一部分,我将向您展示它的一些主要功能:
- 前往 十一实验室 和 注册.
如果您已有帐户,请登录。 - 在默认情况下 语音选项卡,选择所需的输入。
它可以是文本或语音。 - 单击下面的下拉菜单 个人设置 并选择 模型.
如果您要使用英语,我建议使用 Eleven Turbo v2。 - 点击 语音下拉菜单 并选择合适的声音。
您可以通过单击“播放”按钮来测试它们。 - (可选)你可以尝试一下 语音设定.
我建议您将它们保留为默认值,并在生成第一个输出后使用它们。 - 添加 文本 并击中 产生 按钮。
这是我得到的结果:
前往语音库查看其他 ElevenLabs 用户如何调整设置以获得所需的输出。
与任何人工智能驱动的平台一样, 一切都是为了尝试。我建议您根据需要测试尽可能多的声音,直到找到合适的声音。
定价
定价是 基于字符的 但按月订阅收费(捆)。这意味着每次您使用 ElevenLabs 时,您也会使用这些字符,无论您是否下载输出。
这里有 您可以订阅六个计划:
- 免费(0 美元/永久)
- 入门版(5 美元/月)*
- 创作者(22 美元/月)*
- 独立出版商(99 美元/月)
- 不断增长的业务($330/月)
- 企业(自定义定价)
*Starter 和 Creator 计划的第一个月提供 80% 的折扣。价格不含税,这意味着您可能需要支付更多费用,具体取决于您居住的地方。
免费计划每月为您提供 10,000 个字符。 您还可以使用 API 访问和我介绍的其他功能。但是,您无法使用项目功能。最后,您必须使用 ElevenLabs 属性将输出发布到某处。
以下是计划在最重要参数方面的比较:
计划 | 自由的 | 启动级 | 创造者 | 独立出版商 | 不断发展的业务 |
---|---|---|---|---|---|
产品特性 | 10,000 | 30,000 | 100,000 | 500,000 | 2,000,000 |
自定义声音 | 3 | 10 | 30 | 160 | 660 |
API访问 | 支持 | 支持 | 支持 | 支持 | 支持 |
商业许可证 | 没有 | 支持 | 支持 | 支持 | 支持 |
即时语音克隆 | 没有 | 支持 | 支持 | 支持 | 支持 |
语音操作限制 | 不适用 | 65 | 95 | 290 | 1040 |
专业语音克隆 | 没有 | 没有 | 支持 | 支持 | 支持 |
附加字符 (PAYG) | 没有 | 没有 | 支持 | 支持 | 支持 |
分析仪表盘 | 没有 | 没有 | 没有 | 支持 | 支持 |
我排除了企业计划,因为它的限制和定价是自定义的。
字符是 每月更新 但不会转移到下一个 如果您未能使用它们。
还有一个限制 多少 您可以在一个请求中使用的字符:
- 如果您使用免费套餐,则为 2,500
- 如果您是付费客户,则为 5,000。
您可以随时取消您的 ElevenLabs 订阅。计费周期结束后,系统会自动将您的帐户降级为免费套餐。
总的来说,免费计划很慷慨,因为免费角色每月都会更新。我相信这足以开始使用,一旦您的需求增长,您可以订阅付费计划。
ElevenLabs 审查 – 结论
2024年了,它还好吗?绝对地!
还会继续增长吗?最有可能的是,考虑到用户生成的声音的数量。
我想通过说这是最好的来结束我的 ElevenLabs 评论 人工智能语音平台 我用过。它拥有很大的潜力。让语音设置恰到好处可能很棘手,但一旦你做到了,你会对输出印象深刻。
奖金:如果您使用的是 Google Chrome 和 ChatGPT,您可以尝试 Talk-To-ChatGPT 扩展。它利用与 ElevenLabs 的 API 连接,让您与最流行的生成人工智能对话。