加拿大pc28官网信誉平台潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证

pc28

加拿大pc28开奖api

你的位置：pc28 > 加拿大pc28开奖api > 加拿大pc28官网信誉平台潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

加拿大pc28官网信誉平台潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

发布日期：2024-12-29 05:52 点击次数：90

剪辑部发自凹非寺加拿大pc28官网信誉平台

量子位 | 公众号 QbitAI

奥特曼说，Sora代表了视频生成大模子的GPT-1时刻。

从开年到当今，国表里、初创独角兽到互联网大厂，齐纷纷参加视频生成畛域，带来一个个崭新模子的同期，视频、影视行业也随之发生剧变。

不可否定，当下的视频生成模子还碰到诸多问题，比如对空间、对物理王法的连结，咱们齐期待着视频生成的GPT-3.5/4时刻到来。

在国内，有这么一家从加快试验启程的初创公司，正在为此极力。

它即是潞晨科技，首创东说念主尤洋博士毕业于UC伯克利，后赴新加坡国立大学担任校长后生教授。

本年潞晨科技在加快研讨畛域以外，建造视频生成模子VideoOcean，为行业带来更具性价比的聘请。

在MEET 2025现场，尤洋博士也向咱们共享这一年关于视频生成畛域的连结与默契。

MEET 2025智能将来大会是由量子位主理的行业峰会，20余位产业代表与会商议。线下参会不雅众1000+，线上直播不雅众320万+，赢得了主流媒体的豪迈更动与报说念。

中枢不雅点梳理视频生成模子应该兑现缜密化文本限定、任性机位/任性角度、变装一致性、格调定制化3年后大概就能迎来视频生成的GPT-3.5/GPT-4时刻视频生成大模子的一个凯旋哄骗价值即是破损试验的舍弃，极大裁减果然场景复现难度。

（为更好呈现尤洋的不雅点，量子位在不转换情愿的基础上作念了如下梳理）

3年后或是视频大模子的GPT-3.5时刻

今天很是开心来到量子位大会，很是开心和公共疏导，今天讲一下咱们在视频大模子畛域作念的一些职责。

最初是我和我的创业公司潞晨科技的先容。我从UC伯克利毕业到新加坡国立大学任教，很荣幸创办了潞晨科技。

咱们之前是作念算力优化的。2018年谷歌打造了天下上第一个千卡集群TPU Pod，其时天下上最大的模子仍是BERT。咱们匡助谷歌，将（其时）天下上最大模子的试验时辰从3天压缩到76分钟。

也很荣幸，旧年华为盘古大模子的一个职责亦然咱们统共来作念的，并赢得了ACL最好论文。咱们的时代匡助华为盘古大模子在试验中更高效。微软、英伟达等公司团队也使用了咱们的时代作念一些散播式试验，咱们但愿让大模子试验更快、本钱更低。

步入今天的话题，来要点先容一下视频生成大模子。

特斯拉股价飙升背后，是一系列利好消息在资本市场传播。12月24日，有消息称，目前新款特斯拉Model Y日产能已爬到日均200辆左右，预计最快2025年1月份就能下单。另外于今年5月份开工的特斯拉上海储能超级工厂完工在即，预计在2024年年底前完成建设。

注：中百集团今日再度上演地天板行情（截至12月25日收盘）

咱们打造了一个家具叫Video Ocean，当今正处在测试阶段。先来先容一下家具，背面再探讨我以为视频大模子将会如何发展。

最初，我以为视频大模子第一个重大的方面是，它应该能够兑现缜密化的文本限定。

其实咱们今天齐在用AI去生成大模子了，咱们细目但愿它能够精确反应出思要的东西。但很缺憾，比如当今用文生图APP去生成图瞬息，仍是会发现好多图片实质无法作念到精确限定，是以我认为这方面还有很大的发展空间。

在Video Ocean模子试验流程中，咱们作念了一些初步探索。一个比拟好的例子，咱们能够精确地提供一些形色，戴着墨镜，长的胡茬的欧洲男东说念主。不言而喻这个视频内部确乎是咱们思要的阿谁嗅觉，蓝天、海岸、沙滩、背光、单手抓相机、玄色T恤，也有对着镜头言语。

我认为AI视频大模子将来3年可能最重大的仍是兑现视频大模子的Scaling Law。

这个流程不需要很是炫酷的家具智商，最重大的是把它的模子与试验天下的连结智商作念到极致。我以为最终形态即是东说念主们说一段话、给一段形色，它能精确地把形色以视频的花式展示出来。

是以我以为将来3年，AI视频大模子就像山姆·奥特曼说的那样，今天是Video的GPT-1时刻，可能3年后到视频大模子的GPT-3.5、GPT-4时刻。

这里展示一下Video Ocean的Demo，咫尺咱们作念到了这么的水平。

潞晨科技

，赞687

第二点是将来视频大模子如何能够兑现任性机位、任性角度。

当今拍电影、拍记载片可以拿入部属手机、录像机接续地晃，思如何晃就如何晃，这么是对镜头有果然限定的。将来AI视频大模子，最初应该作念到这少许，相似的形色，换一下角度、换一个镜头，它的形象是不应该转换的，它即是相似一个物体。

更进一步讲，将来AI视频大模子还能颠覆好多行业。比如当今看足球、看篮球赛，咱们看到的镜头是现场编导给咱们看的镜头。他给咱们看出路、近景。

将来能不可依靠AI视频大模子，东说念主来限定镜头，决定思要看哪，卓著于在通顺场里可以一刹出动，出动到教悔席、临了一转、第一转。任性机位、任性角度的限定。我以为将来AI视频大模子在这方面也诟谇常要道的，天然天然Video Ocean当今作念了一些尝试，初步后果仍是可以的。

我以为第三点重大的是变装一致性。

因为作念出AI视频大模子，最终细目是需要产生营收、兑现变现的。谁会开心为这个付费，比如告白职责室、告白商、电商博主、影视行业。淌若深远这些行业的话，一个要道点是变装一致性。

比如一个家具的告白，细目重新到尾这个视频中的一稔、鞋、车，面孔不可有太大变化，物体变装保抓一致性。

拍一部电影，从伊始到结果，主演的面孔、要道构陷的面孔细目也不可变化，在这方面Video Ocean也作念一些很好的探索。

再一个是格调的定制化。咱们知说念当今演员东说念主工本钱诟谇常贵的，说念具本钱也很高。

将来3年之内，淌若AI视频大模子普通发展，我嗅觉会有一种需求，比如一个导演可以让一个演员在游池塘里拍一段戏，然后拿到素材通过AI将它转成泰坦尼克场景下的游水，转成阿凡达场景下的游水，这种智商反而是AI最擅长的。赋予电影感、艺术感的画面。

总之大模子一个凯旋的哄骗价值即是破损试验的舍弃，能够极大裁减果然场景复现的难度。

可能之前公共听过一个段子，好莱坞导演思制造一个爆炸镜头，他算了一下预算，第一种决议是盖一个城堡把它炸掉，第二个决议是用研讨机模拟这个画面。本钱算下来之后，发现这两种决议的本钱齐很高，其时用研讨机模拟的本钱更高，当今AI即是要大幅裁减大模子关于生成电影的本钱。

淌若这少许兑现后，咱们可以不受场地、天气等外部身分的舍弃，并减少对果然演员的依赖。这倒不是抢演员的饭碗，因为一些要道镜头诟谇常危境的，比如演员跳飞机、跳楼，演员去救助行将引爆的炸弹之类，这种镜头将来只需要演员的身份和肖像权，AI可以把这么的镜头作念好，是以对电影行业能够极大作念到降本增效。

正如昆仑万维方汉淳厚刚才说的，固然咱们的研讨资源有限，可是咱们发现通过更好的算法优化确乎能够训出更好的后果，比如Meta使用6000多个GPU试验30B的模子，最近咱们会在一个月内发一个10B版的模子，咱们仅用了256卡。

Video Ocean前身是咱们团队先打造了一个Open-Sora的开源家具，这个开源家具是十足免费的，在Github上，后果很是可以，比如好意思国独角兽Lambda labs作念了一个火爆的哄骗数字乐高，其实这个数字乐高即是基于Open-Sora作念的。

本年级首Sora出来之后，多样短视频巨头齐对视频大模子这一块比拟酷好，比如中国的快手、抖音，好意思国即是Instagram、TikTok、SnapChat，这可以看到SnapChat的视频模子也在早些时候发布了，叫Snap Video，这是它的官方论文，他们就援用了咱们试验视频大模子的时代，是以说这些时代也匡助一些巨头真确把视频大模子训得更快，精度更高，智能进度更高。

谢谢公共！

点击https://video.luchentech.com可体验Video Ocean更多细心智商

— 完 —

量子位 QbitAI · 头条号签约

更动咱们加拿大pc28官网信誉平台，第一时辰获知前沿科技动态

上一篇：加拿大pc28官网信誉平台山东2025年艺体生老成！《当代训诫》艺体专刊征订仅剩三天！

下一篇：加拿大pc28官网信誉平台一口封神！盘货昌平那些厚味的“深宵食堂”