快科技 11 月 26 日讯,英伟达近日展示了其最新研发的东说念主工智能模子—— Fugatto。 Fugatto 是一款基于生成式 Transformer 架构的东说念主工智能模子,其完好版配备了 25 亿个参数,并在由 32 个 NVIDIA H100 Tensor Core GPU 构成的 NVIDIA DGX 系统上进行了磨真金不怕火。 这款模子的主邀功能在于豪迈修改和生成声息成果,专为音乐、电影和视频游戏制作主说念主狡计,英伟达将其形象地称为"声息的瑞士军刀"。 据 NVIDIA 应...

快科技 11 月 26 日讯,英伟达近日展示了其最新研发的东说念主工智能模子—— Fugatto。
Fugatto 是一款基于生成式 Transformer 架构的东说念主工智能模子,其完好版配备了 25 亿个参数,并在由 32 个 NVIDIA H100 Tensor Core GPU 构成的 NVIDIA DGX 系统上进行了磨真金不怕火。
这款模子的主邀功能在于豪迈修改和生成声息成果,专为音乐、电影和视频游戏制作主说念主狡计,英伟达将其形象地称为"声息的瑞士军刀"。
据 NVIDIA 应用音频究诘司理 Rafael Valle 炫耀,Fugatto 的研发初志是创建一个豪迈像东说念主类雷同贯通和生成声息的模子。
它维持多种音频生成和转换任务,是首个展示艰难属性的基础生成式 AI 模子,这获利于其各类磨真金不怕火能力的交互以及组合开脱步调指示的能力。
Fugatto 的功能很是刚劲,豪迈凭证文本刻画生成音效和音乐,举例将钢琴演奏转换成东说念主声讴歌,或改变灌音的口音和心思。
关于音乐制作主说念主而言,Fugatto 不错匡助他们快速制作原型或裁剪歌曲创意,尝试不同的作风、声息和乐器,同期添加成果并普及现存轨说念的合座音频质料。
告白代理商则不错欺骗 Fugatto 快速定位多个地区或情况的现存告白举止,将不同的口音和心思应用于画外音。
视频游戏设置东说念主员则不错使用该模子修改游戏中事先录制的素材,或凭证文本讲明和可选的音频输入动态创建新素材。
另外,Fugatto 的新颖性主要体当今以下方面:
领先,在推理经由中,该模子弃取了称为 ComposableART 的技能,豪迈组合在磨真金不怕火时间只可单独看到的指示。
举例,通过组合教唆,不错条款模子以法国口音说出带有追到心思的文本。
此外,该模子在指示之间进行插值的能力使用户豪迈对文本指示进行深广铁心,如重音的千里重进度或追到的进度。
其次,Fugatto 还豪迈生成随时辰变化的声息,NVIDIA 将这一功能称为时辰插值。
举例,它不错模拟暴雨穿过区域的声息,雷声渐渐增强,然后冉冉隐藏在远方。这一功能使用户豪迈深广地铁心音景的演变面目。
终末,与大大批只可重现所战役的磨真金不怕火数据的模子不同,Fugatto 允许用户创建当年从未见过的音景。
举例,它不错模拟雷雨跟着鸟儿的歌声温存为清晨的场景。
一言以蔽之,Fugatto 凭借其功能各类性和窜改性,在音频领域具有雄壮的发展空间。
云开体育