Audiobox

4天前更新 880,140 0 30.8K

Meta于2023年11月30日发布了全新的AI音频生成模型Audiobox,支持语音和文本输入,用户可轻松创建逼真的自定义音频,适用于多种场景。

收录时间:
2025-05-20
AudioboxAudiobox

在数字内容创作日益繁荣的今天,音频作为重要的媒介形式,其创作门槛却始终较高。Meta于2023年11月30日发布的Audiobox,正是为了解决这一痛点而生的AI音频生成模型。

网站介绍

Audiobox是Meta推出的免费开源AI音频生成模型,旨在通过语音输入和自然语言文本提示,帮助用户轻松创建逼真的自定义音频。

功能特点

  • 语音克隆用户可录制自己的声音,Audiobox将根据用户的声音风格生成语音。
  • 文本描述生成人声:通过文本描述声音特征和声学环境,生成相应的人声。
  • 更改声音风格:结合声音和文本描述,轻松更改现有的声音风格。
  • 文本描述生成音效:根据输入的声音特征文本描述,生成相应的声音效果。
  • 噪音消除:提供Magic Eraser功能,消除录音中的瞬态噪声。
  • 声音填充:根据文本描述,用新的声音替换音频中的一部分。
  • 音频故事制作器:利用Audiobox Maker制作原创有趣的音频故事。

相关项目

在AI音频生成领域,除了Audiobox,还有以下值得关注的项目:

  • Voicebox:Meta于2023年6月推出的语音生成模型,Audiobox正是其继任者。
  • Riffusion:一款实时音乐创作工具,专注于生成丰富多样且富有感染力的音乐作品。
  • Stable Audio:Stability AI最新推出的音乐生成工具,支持多种风格的音乐创作。

优点评价

Audiobox的推出,标志着音频生成技术迈入了新的发展阶段。其多模态统一的特性,使得语音、音效和环境音的生成更加便捷。高控制性和逼真的效果,使其适用于短视频、播客、游戏开发等多种场景。此外,Meta在安全与责任方面的考量,如音频水印和语音认证等措施,体现了其对技术负责任的态度。

是否收费

目前,Audiobox提供在线演示,用户可免费体验生成功能,但仅限研究用途。模型和代码未开源,需申请研究访问权限。未来若开放商业化,可能采用订阅或按生成量计费模式,但目前无具体信息。

总结

Audiobox的发布,为音频创作领域带来了新的可能性。无论是专业人士还是业余爱好者,都能通过这一工具,轻松创作出高质量、个性化的音频内容。随着技术的不断发展,期待Audiobox在未来能够为更多用户带来便利和创意。

相关导航