在数字内容创作日益繁荣的今天,音频作为重要的媒介形式,其创作门槛却始终较高。Meta于2023年11月30日发布的Audiobox,正是为了解决这一痛点而生的AI音频生成模型。
网站介绍
Audiobox是Meta推出的免费开源AI音频生成模型,旨在通过语音输入和自然语言文本提示,帮助用户轻松创建逼真的自定义音频。
功能特点
- 语音克隆:用户可录制自己的声音,Audiobox将根据用户的声音风格生成语音。
- 文本描述生成人声:通过文本描述声音特征和声学环境,生成相应的人声。
- 更改声音风格:结合声音和文本描述,轻松更改现有的声音风格。
- 文本描述生成音效:根据输入的声音特征文本描述,生成相应的声音效果。
- 噪音消除:提供Magic Eraser功能,消除录音中的瞬态噪声。
- 声音填充:根据文本描述,用新的声音替换音频中的一部分。
- 音频故事制作器:利用Audiobox Maker制作原创有趣的音频故事。
相关项目
在AI音频生成领域,除了Audiobox,还有以下值得关注的项目:
- Voicebox:Meta于2023年6月推出的语音生成模型,Audiobox正是其继任者。
- Riffusion:一款实时音乐创作工具,专注于生成丰富多样且富有感染力的音乐作品。
- Stable Audio:Stability AI最新推出的音乐生成工具,支持多种风格的音乐创作。
优点评价
Audiobox的推出,标志着音频生成技术迈入了新的发展阶段。其多模态统一的特性,使得语音、音效和环境音的生成更加便捷。高控制性和逼真的效果,使其适用于短视频、播客、游戏开发等多种场景。此外,Meta在安全与责任方面的考量,如音频水印和语音认证等措施,体现了其对技术负责任的态度。
是否收费
目前,Audiobox提供在线演示,用户可免费体验生成功能,但仅限研究用途。模型和代码未开源,需申请研究访问权限。未来若开放商业化,可能采用订阅或按生成量计费模式,但目前无具体信息。
总结
Audiobox的发布,为音频创作领域带来了新的可能性。无论是专业人士还是业余爱好者,都能通过这一工具,轻松创作出高质量、个性化的音频内容。随着技术的不断发展,期待Audiobox在未来能够为更多用户带来便利和创意。