在9月底的缔造者大会上,Meta刚刚炸场,发布了十年磨一剑的家具——全息AR眼镜Orion,堪称“于今为止起初进的眼镜”,拉动股价至历史新高。北京时候10月4日晚,Meta再次投下重磅炸弹,发布类Sora的视频生成模子Movie Gen,官方称这是“迄今为止起初进的媒体基础模子”。
斥逐10月5日收盘,Meta涨2.26%,股价达到595.94好意思元的历史新高。自本年级首以来,Meta股价已上升高出70%,现在最新总市值来到了1.51万亿好意思元。跟着Meta股价的捏续攀升,其CEO马克·扎克伯格(Mark Zuckerberg)初次独特亚马逊首创东谈主贝索斯,成为寰球第二大富豪,仅次于马斯克。
在官方博客中,Meta示意,全新发布的 Meta Movie Gen是先进的千里浸式叙事模子系列,领有视频生成、个性化视频生成、精准视频剪辑和音频生成四大功能。从Meta演示的视频来看,其在画面好意思感、细节、东谈主物当作畅通度、物理律例等方面齐作念到了可以的斥逐。
在具体功能方面,用户可以通过上传图片,应用 Meta Movie Gen 生成既个性化但又保捏东谈主物特征和当作的视频。用户也可以通过提供视频文献或文本实质深爱五月,让 Meta Movie Gen 生成相对应的音频。Movie Gen搭救生成 1080P、16 秒、每秒 16 帧的高清长视频,以及简略生成最长 45 秒的高质料音频。
不外,如同Sora一样,Movie Gen亦然“期货”家具,现在尚未对外绽放,也莫得明确的时候表。官方称正在积极地与文娱行业的专科东谈主士和创作家进行疏浚和和谐,预计将在来岁某个时候将其整合到 Meta 我方的家具和奇迹中。
据外媒,Meta 副总裁 Connor Hayes 潜入了延伸推出的蹙迫原因,他示意Meta Movie Gen 现时使用文本指示词生成一个视频频频需要恭候数十分钟,极大影响了用户的体验。Meta 但愿进一步普及视频生成的遵守,以及完结尽快在转移端上推出该视频奇迹,以便能更好地得志破钞者的需求。
Meta称Movie Gen是在授权和公开数据集的组合上检会。关于背后的手艺细节,Meta AI 磋议团队也在酬酢媒体上公开了一份长达 92 页的论文。据先容,Meta 的 AI 磋议团队主要使用两个基础模子来完结这些平常的功能,包括Movie Gen Video 以及 Movie Gen Audio 模子。
Movie Gen Video 是一个 30B 参数的基础模子,用于文本到视频的生成,简略生成高质料的高清视频,最长可达 16 秒。而 Movie Gen Audio 模子则是一个 13B 参数的模子,用于视频和文本到音频的生成,简略生成长达 45 秒的高质料和高保真实音频,包括声息斥逐和音乐,并与视频同步。
据悉,模子预检会阶段使用了多量的图像和视频数据,简略厚实视觉全国的多样见识,包括物体剖析、交互、几何、相机剖析和物理律例。为了普及视频生成的质料,模子还进行了监督微调(SFT),使用了一小部分全心挑选的高质料视频和文本标题。陈说炫耀,后检会(Post-training)历程则是 Movie Gen Video 模子检会的蹙迫阶段,简略进一步普及视频生成的质料,尤其是针对图像和视频的个性化和剪辑功能。
直播勾引在手艺论文中,磋议团队公布了 Movie Gen Video 模子与主流视频生成模子的对比数据。由于 Sora 现在尚未绽放,磋议东谈主员只可使用其公缔造布的视频和指示来进行比拟。关于其他模子,如 Runway Gen3、LumaLabs 和可灵 1.5,磋议东谈主员聘请通过 API 接口来自行生成视频。
通过进行胜率比拟,Movie Gen Video 在合座质料上显贵优于 Runway Gen3和 LumaLabs,对 OpenAI Sora有微小的上风,与国内的可灵 1.5 极端。
一度在元寰宇限度遭受窘境的Meta,在2024年凭借生成式AI顺利逆转运谈。在8月初,摩根大通发表陈说将Meta谋划价由480好意思元升至610好意思元,陈说指出,Meta近期证据邃密,战胜已在要道的永恒规划上顺应投资,尤其是AI。9月底,摩根大通再次晓谕看好Meta,将其谋划价从610好意思元上调至640好意思元。
本年8月,Meta发布的2024年Q2财报炫耀,公司营收为390.71亿好意思元,同比增长22%,净利润为134.65亿好意思元,同比增长73%,均超出华尔街分析师预期。Meta示意,公司在东谈主工智能方面的深广投资有助于普及其在线告白平台的证据,这是营收增长的一大原因。
现在Meta已联贯四个季度收入增幅高出20%。Meta预计深爱五月,2024年第三季度该公司的总营收将可达到385亿好意思元至410亿好意思元之间,这一瞻望相似超出分析师预期。