前不久,开启「二次创业」的他刚向咱们展现了十年磨一剑的最强 AR 眼镜 Meta Orion,虽然这只是一款押注异日的原型机械,却抢光了苹果 Vision Pro 的风头。
官方传播正正在踊跃地与文娱行业的专业人士和创作家举办疏通和团结,估计将正在来岁某个工夫将其整合到 Meta 己方的产物和任职中。
细分来说,Movie Gen 拥有视频天生、本性化视频天生、准确视频编纂和音频天生四大成效。
文生视频成效早已成为视频天生模子的标配,只是,Meta Movie Gen 可能遵照用户的需求天生差异长宽比的高清视频,这正在业内尚属始创。
其余,Meta Movie Gen 供应了高级的视频编纂成效,用户只需通过大略的文本输入即可完成丰富的视频编纂使命。
从视频的视觉气概,到视频片断之间的过渡功效,再到更周密的编纂操作,这一点,该模子也给足了自正在。
用户可能通过上传己方的图片,应用 Meta Movie Gen 天生既本性化但又保留人物特色和行动的视频。
虽然本年持续已有不少视频模子接踵亮相,但公共只可天生「哑剧」,食之无聊弃之怅然,Meta Movie Gen 也没有「重蹈覆辙」。
用户可能通过供应视频文献或文本实质超越,让 Meta Movie Gen 遵照这些输入天生相对应的音频。(PS:注视滑板落地的配音)
而且,它不只能能创筑单个的声响功效,还可能创筑配景音笑,乃至为全数视频筑造完美的配笑超越,从而极大地晋升视频的举座质地和观多的观望体验。
很多网友再次「拉踩」OpenAI 的期货 Sora,但更多翘首以待的网友仍旧先导等候测试体验资历的盛开了。
个中,Movie Gen Video 是一个 30B 参数的基本模子,用于文本到视频的天生,可能天生高质地的高清视频,最长可达 16 秒。
模子预锻练阶段利用了大批的图像和视频数据,可能知道视觉全国的各样观念,席卷物体运动、交互、几何、相机运动和物理纪律。
为了进步视频天生的质地,模子还举办了监视微调(SFT),利用了一幼个人周到挑选的高质地视频和文本题目。
讲述显示,后锻练(Post-training)流程则是 Movie Gen Video 模子锻练的首要阶段,可能进一步进步视频天生的质地,越发是针对图像和视频的本性化和编纂成效。
值得一提的是超越,考虑团队也将 Movie Gen Video 模子与主流视频天生模子举办了比照。
因为 Sora 目前尚未盛开,考虑职员只可利用其公然拓布的视频和提示来举办比力。关于其他模子,如 Runway Gen3、LumaLabs 和 可灵 1.5,考虑职员遴选通过 API 接口来自行天生视频。
且因为 Sora 发表的视频有差异的区别率和时长,考虑职员对 Movie Gen Video 的视频举办了裁剪,以确保比力时视频拥有沟通的区别率和时长。
而 Movie Gen Audio 模子则是一个 13B 参数的模子,用于视频和文本到音频的天生,可能天孕育达 45 秒的高质地和高保真的音频,席卷声响功效和音笑,并与视频同步。
该模子采用了基于 Flow Matching 的天生模子和扩散变换器(DiT)模子架构,并增加了格表的前提模块来供应限度。
乃至,Meta 的考虑团队还引入了一种音频扩展本领,应许模子天生超越初始 45 秒限定的连贯音频,也便是说,无论视频多长,模子都可能天生立室的音频。
Meta Movie Gen 方今利用文本提示词天生一个视频往往需求恭候数特别钟,极大影响了用户的体验。
Meta 欲望进一步进步视频天生的结果,以及完成尽疾正在转移端上推出该视频任职,以便能更好地餍足消费者的需求。
实在假使从产物形状上看,Meta Movie Gen 的成效计划主打一个大而全,并没有像其他视频模子那样的「瘸一条腿」。
也许你会说超越,一如当下的 Sora 被国产大模子赶超,比及 Meta Movie Gen 推出之时,视频天生界限的比赛式样也许又会变换一番光景。Sora又被超越Meta AI视频模子深夜炸场自带惊艳BGM让视频编纂比P图还轻易