Gemini Omni:AI 电影特效背后的物理怪兽
About This Episode
本期我们拆解 Gemini Omni 那惊人却违背物理常识的视觉生成,聊聊 AI 能否真正懂得刚体动力学、视频训练的局限以及这场技术秀背后对创意真实性的冲击。
Chapters
Links
小雅: 老冯,你听这雨声,跟咱俩的咖啡一样浓 —— 都他妈快成糖浆了。你这边怎么还开着电暖器?空气都快烤糊了。
老冯: 烤糊了才有灵感,小雅。你没听过「物理怪兽」的味道就是电路板烧焦的味道吗?再说,我这不是怕你这愤青冻得又开始骂大厂吗?
小雅: 去你的,我骂大厂是因为他们真该骂。不过说到「物理怪兽」,你今晚不会又要聊什么 AI 生成的砖头乱飞吧?上次那个「瞬移马桶」的视频,我回放了三遍都没看懂。
老冯: 哈哈,你这眼光啊,跟 2026 年的物理引擎一样「精准」。不过今晚咱不聊马桶,咱聊 Gemini Omni—— 谷歌今年这波操作,直接把 AI 电影特效卷成了物理题库。你见过 AI 生成的「砖头」能砸出牛顿定律的吗?
小雅: 嚯,听起来比我上次吐槽的那个「AI 换脸换成了换物理定律」还离谱。所以今天咱们要聊啥?Gemini Omni 怎么把好莱坞的特效师逼成了物理老师?
老冯: 对喽!咱们得聊聊这玩意儿怎么把「逼真」和「荒谬」糅在一起,还顺便让好莱坞的预算表「减肥」了。不过先说好,你别一激动又开始骂「资本家的阴谋」,我这咖啡可经不起你的愤青加料。
小雅: 切,我骂的是虚伪的资本家,不是技术。Gemini Omni 这波操作,我寻思着至少能让那些「五毛特效」的导演哭着下岗。不过老冯,你得给我讲讲,这玩意儿真能算「物理怪兽」,还是又是谷歌吹的牛?
老冯: 牛是吹不出来的,但「怪兽」这俩字绝对实至名归。等会儿咱们看几个 demo,你就知道什么叫「AI 生成的物理」—— 明明是砖头飞,但你总觉得哪里不对劲,像是牛顿他老人家亲自下场调参了。
小雅: 行,那今晚咱就好好「品品」这怪兽。不过先说好,你要是再跑题聊你那「80 年代的物理课本」,我可就直接关麦了。
老冯: 得嘞,咱们这就开聊。不过小雅,你这咖啡都快见底了,还不赶紧续杯?待会儿聊到「能量守恒」的时候,你可别怪我没提醒你 —— 那玩意儿比咖啡因还上头。
小雅: 卧槽,老冯,你看这个 Gemini Omni 的 demo 了吗?Google 这帮人又在吹牛逼了。
老冯: 哦?又整出啥幺蛾子了?上次那个 Nano Banana 不是还没捂热乎呢吗?
小雅: 说是能用自然语言编辑视频,啥物理常识、历史背景、文化梗,全给你整上去。
老冯: 嚯,听起来像是个万能视频编辑器啊。但这玩意儿真能理解物理规律?
小雅: 官方是这么说的,还说能模拟重力、动能、流体力学啥的。但评论区有个哥们说,这玩意儿生成的积木瞬移、消失,跟真的物理规律差远了。
老冯: 哈哈,积木瞬移?这不就是《变形金刚》里的特效吗?Google 这是在拍科幻片呢。
小雅: 有人评论说,这视频更像是 AI 做的梦,感觉上像那么回事,但实际物理规律全错。
老冯: 梦?这比喻有点意思。Transformer 这玩意儿,说到底还是在玩概率游戏,不是真在模拟物理世界。
小雅: 但有人觉得,只要数据够多,Transformer 也能学会物理规律。比如用 3D 跟踪点啥的。
老冯: 数据多就能解决问题?那为啥现在的 AI 视频里,物体还总是莫名其妙地变形、消失?
小雅: 因为视频数据里的物理规律不够精确呗。评论区有个大佬说,可能得结合物理引擎或者可微分物理模型才行。
老冯: 这不就是在说,Transformer 单打独斗不行,得找帮手?
小雅: 对啊,但 Google 这帮人就是不服输,非要说自家模型能理解物理规律。
老冯: 理解个屁,这不就是在玩「看起来像」的游戏吗?跟那些 AI 生成的「假照片」一个道理。
小雅: 但这玩意儿在创意领域可能还挺有用的。比如快速生成概念视频、特效啥的。
老冯: 创意?你是说那些看起来牛逼,但实际一戳就破的玩意儿?
小雅: 有人觉得这能让创意民主化,让普通人也能做出好莱坞级别的特效。
老冯: 民主化?我看是「假大空」化吧。这玩意儿生成的东西,越看越觉得虚假,没啥情感共鸣。
小雅: 但技术发展不就是这样吗?先有个雏形,再慢慢完善。
老冯: 完善?我看是「完蛋」。这帮人光顾着吹牛逼,不解决根本问题,最后搞出来的东西全是半成品。
小雅: 行吧,反正我是觉得这玩意儿挺有潜力的,至少能帮我快速做个 demo。
老冯: demo?你是说那种「看起来很美,实际一用就崩」的 demo?
小雅: 滚蛋,你这老油条就不能说点好听的?
老冯: 好听的?那我得说,这玩意儿要是真能整合物理引擎,说不定真能干点大事。
小雅: 这不就得了,你也觉得有戏啊。
老冯: 有戏?我可没这么说。我只是说,要是真能整合,那才叫牛逼。现在这玩意儿,还是个半吊子。
小雅: 卧槽,老冯,你看这个 Gemini Omni 的 demo 了吗?Google 这回是真敢吹啊。
老冯: 吹?这哪是吹,这是直接把物理课本撕了往垃圾桶里扔啊。
小雅: 哈哈,你也看出来了?那堆积木瞬移的镜头,简直像在拍《变形金刚》续集。
老冯: 《变形金刚》?那都算写实了。这玩意儿连最基本的刚体动力学都搞不定,还敢说自己有「直觉物理理解」。
小雅: 对对对!评论区有个哥们说得好,这视频像是 AI 做的梦 ——「感觉上」积木应该怎么动,而不是「物理上」该怎么动。
老冯: 梦?这梦也太迈克尔・贝了吧。每个镜头都像加了十倍的炸药特效,结果积木一碰就消失。
小雅: 笑死,但你不觉得这挺讽刺的吗?Google 吹 Gemini Omni 能「跨越写实和故事叙事的鸿沟」,结果连 Jenga 塔都倒不正常。
老冯: 鸿沟?这他妈是鸿沟里的黑洞。Transformer 这玩意儿,说到底还是在玩「预测下一个 token」的游戏,连续的物理系统它压根儿不懂。
小雅: 但有人觉得,只要数据够多,Transformer 就能学会物理啊。比如加点 3D 跟踪点啥的。
老冯: 数据多?你给它喂一亿小时的积木倒塌视频,它可能还是分不清重力和磁力。这东西压根儿没有「理解」,只有「统计」。
小雅: 那你觉得该咋办?直接集成个物理引擎进去?
老冯: 不然呢?你指望一个靠文本 token 训练的模型突然顿悟牛顿三定律?开玩笑。
小雅: 但这不也挺有意思的吗?AI 生成的视频,说到底还是在模仿「人类觉得真实的样子」,而不是「真实本身」。
老冯: 对,所以它生成的东西,就像是我们集体记忆里的「真实」—— 夸张、戏剧化,但经不起推敲。
小雅: 那这玩意儿到底有啥用?除了拍点炫酷的 demo 忽悠投资人。
老冯: 用处多了,比如给独立电影人省点特效预算,或者让设计师快速出个概念稿。但别指望它能替代真正的物理模拟。
小雅: 也是。不过话说回来,这东西要是真能做到「直觉物理理解」,那不就跟《黑客帝国》里的世界一样了?
老冯: 《黑客帝国》?那得先解决「积木瞬移」的问题。不然你进去了,一脚踩空,直接穿模掉虚空里。
小雅: 哈哈哈,那我还是等 AI 先学会走路再考虑飞行吧。
老冯: 对,先把积木倒塌搞定了再说。不然这 AI 电影特效,迟早变成 AI 物理怪兽。
老冯: 欸,小雅,你刷到 Gemini Omni 的 demo 了没?Google 这回又整了个大活儿。
小雅: 看了看了,那堆积木瞬移的镜头简直笑死我,这玩意儿宣称自己懂物理?我看它懂的是好莱坞特效。
老冯: 哈哈,评论区有个哥们说得好:这视频像是 AI 做的梦,梦见积木该怎么动,但跟牛顿他老人家的公式半毛钱关系没有。
小雅: 太贴切了!还「直观理解物理」呢,我看它理解的是观众的爽点。积木消失、变形、瞬移 —— 这哪是物理引擎,这是魔术表演。
老冯: 不过话说回来,Transformer 真能学物理吗?有人觉得只要数据够牛逼,比如加上 3D 跟踪点,就能搞定。
小雅: 呸,视频数据再多也是二维的,物理是三维连续的!你让它模拟个碰撞试试,保证给你整出个「艺术化」的爆炸。
老冯: 你这话我爱听。评论区还有人说,这玩意儿要是真懂物理,早该把可微分物理引擎集成进去了。
小雅: 对啊!不然永远是「看起来像」而不是「实际上对」。这不就是大厂的老套路吗?吹得天花乱坠,实际一用就露馅。
老冯: 不过话说回来,这东西做电影特效倒是绝了。你想要个镜子变液体的效果,它分分钟给你整出来,还带反光的。
小雅: 切,电影特效又不是物理课。我就怕这种「看起来真实」的假象,最后把观众的审美都带偏了。
老冯: 哎,你这话有点哲学了。有人觉得 AI 视频是创意民主化,有人觉得是真实感的崩塌。
小雅: 民主化个屁!这玩意儿只会让人分不清什么是真实,什么是「看起来真实」。下一步是不是连新闻都用 AI 生成了?
老冯: 哈哈,你这愤青劲儿又上来了。不过说真的,这东西要是真能集成个物理引擎,说不定真能干点大事。
小雅: 得了吧,等它真能模拟物理了,我直播吃键盘。现在嘛,就当个好玩的玩具呗。
老冯: 行行行,你牛逼。不过话说回来,这玩意儿做个「积木瞬移」的梗图倒是绝了。
小雅: 哈哈,这我倒是同意。下回谁再说 AI 不懂物理,我就给他看这个 demo。
小雅: 卧槽,老冯,你看这个 Gemini Omni 的 demo 了吗?Google 这帮人又开始吹牛逼了。
老冯: 哦?又整出啥幺蛾子了?上次 Nano Banana 不是还被人吐槽像个智障玩具吗?
小雅: 这次是视频编辑,说是能通过自然对话一步步改视频,还能保持场景一致性。
老冯: 嚯,听起来像是个更高级的剪辑助手嘛。不过你刚才那声「卧槽」可不是因为这个吧?
小雅: 对啊!他们吹牛说这玩意儿有「直觉物理理解」,能模拟重力、动能、流体啥的。结果呢?
老冯: 结果?让我猜猜 —— 又是一堆物理 bug,砖块瞬移、积木穿模?
小雅: 牛逼!你咋知道的?那 Jenga 倒塌的 demo 里,积木直接消失、变形、瞬移!
老冯: 啧,这不就是 transformer 学了个「动作的感觉」,而不是真正的物理吗?
小雅: 对啊!评论区有个哥们说得贼好:「这视频就是 AI 的梦,积木该咋动的感觉,不是物理方程算出来的。」
老冯: 哈哈,还加了个「有点太 Michael Bay 了」?这吐槽够味儿。
小雅: 但问题来了 ——transformer 真的学不会物理吗?有人说只要数据表示对,比如加 3D 跟踪点,就能搞定。
老冯: 理论上可行,但视频数据够吗?物理系统有连续、不连续、约束条件,光靠 token 咋整?
小雅: 所以有人提议要整合物理引擎或者可微分模拟器?
老冯: 对啊,不然这 AI 视频永远是「看起来像」,而不是「真的是」。
小雅: 但 Google 这帮人就喜欢吹「直觉理解」,好像加个词儿就能解决所有问题。
老冯: 啧,这帮 PR 部门的,就知道包装概念。不过话说回来,这玩意儿对创作者来说,还是挺香的。
小雅: 香个屁!你没看到那些「液体镜子」、「毛绒玩偶变身」的 demo 吗?特效是牛逼,但物理一塌糊涂!
老冯: 但创作者在乎吗?他们要的是「看起来牛逼」,不是「物理正确」。
小雅: 所以你站在「AI 视频毁灭真实感」的那边?
老冯: 我站在「别吹牛逼」的那边。这玩意儿是工具,不是神。
小雅: 但工具也分好坏啊!如果 AI 视频全是「看起来像」的垃圾,那观众迟早审美疲劳。
老冯: 所以啊,这才是问题的核心 ——AI 视频到底是「创意解放」,还是「真实感崩塌」?
小雅: 我靠,老冯你今天还挺哲学的。不过我还是觉得,技术得往「真实」走,不能光图「好看」。
老冯: 你这是理想主义,小雅。资本和市场要的是「快速好看」,不是「慢速真实」。
小雅: 所以你就准备躺平,看着 AI 视频变成一堆「Michael Bay 式」的垃圾?
老冯: 我没说躺平,但得认清现实。这玩意儿短期内不会变成物理引擎,但会变成创作者的新玩具。
小雅: 行吧,那咱们拭目以待。反正我是不会用这玩意儿做「物理正确」的视频的。
小雅: 卧槽,老冯,你看这个 Gemini Omni 的 demo 了吗?Google 这帮人又开始吹牛逼了。
老冯: 嗯?又整什么幺蛾子?上次那个 Nano Banana 不是被喷得体无完肤吗?
小雅: 这次是 Nano Banana 的视频版,号称能通过自然对话编辑视频,还能「理解物理」。
老冯: 理解物理?我呸。那帮搞视频生成的,物理定律在他们眼里就是个建议。
小雅: 对啊!你看他们那个 Jenga 的 demo,积木倒塌的时候,直接瞬移、变形、消失,跟拍鬼片似的。
老冯: 哈哈,这不就是「迈克尔・贝」式的物理吗?爆炸效果拉满,但积木他妈的不遵守牛顿定律。
小雅: 评论区有个哥们说得好:「这玩意儿生成的视频就是 AI 的梦境,看起来像那么回事,但物理公式一问三不知。」
老冯: 梦境?我看是噩梦。你说它连刚体动力学都搞不定,还吹什么「直观理解物理」?
小雅: 但它确实能生成一些酷炫的效果啊,比如手一碰镜子,镜子就变成液体,手臂变成镜面材质。
老冯: 酷炫个屁!那叫「风格化运动」,跟真正的物理模拟八竿子打不着。你见过液体镜子能反射出符合光学定律的图像吗?
小雅: 行吧,但你说 transformer 真的学不会物理吗?评论区有人说,只要数据表示得当,比如用 3D 跟踪点,可能还是有戏的。
老冯: 有戏个鬼。视频数据里的物理信息太稀疏了,transformer 只能学个表面的「动作风格」,真要模拟连续或不连续的物理系统,还得靠可微分物理引擎。
小雅: 那你的意思是,AI 视频生成永远只能是「看起来像」,而不能「真正理解」?
老冯: 至少短期内是这样。除非他们把物理模拟器直接集成进去,否则这帮人就是在用大力出奇迹。
小雅: 但也有人觉得这挺好的啊,AI 视频降低了创作门槛,让普通人也能做出好莱坞级别的特效。
老冯: 降低门槛?我看是降低标准。你见过那些 AI 生成的电影吗?特效一堆,但观众看完只会觉得「假」。
小雅: 也是,真正的艺术还是需要那种「人味儿」。AI 再牛逼,也替代不了人类的情感和创意。
老冯: 所以啊,别被那些 demo 给忽悠了。Gemini Omni 再花哨,也不过是个「物理怪兽」。
小雅: 哈哈,物理怪兽,这个称号我给满分。下次他们再吹牛逼,咱就拿这个名字怼他们。
老冯: 行,下回他们发布会,咱俩直接在评论区刷「物理怪兽」!
小雅: 操,聊着聊着都快凌晨两点了,咱俩这效率也太低了,AI 电影特效的物理引擎都没聊透呢。
老冯: 得了吧,你那效率至上的劲头呢?这不正好证明人脑比 AI 强 —— 至少咱俩还能扯这么久不犯困。
小雅: 切,你那是老油条的耐力。不过说真的,Gemini Omni 这物理模拟能力确实让我有点上头,感觉下一步 AI 能直接生成《流浪地球 3》了。
老冯: 别激动,再牛逼的物理引擎也得有人类导演告诉它「这坨砖头得往左飞」。AI 还是那个会算术的傻子,就是算得快了点。
小雅: 行行行,冯老师又开始泼冷水。不过今天这期确实有点干货,下次咱们能不能聊点轻松的?比如 AI 怎么帮你偷懒写周报?
老冯: 哟,你这是要教唆犯罪啊。行吧,反正下期想听什么,用你常用的泛用型客户端订阅一下,别指望那些封闭平台给你推送。
小雅: 对对对,RSS 订阅一下,更新了就能收到。咱这播客又不靠算法推荐,全凭听众缘分。
老冯: 得了,今天就到这儿吧,我得回去研究研究怎么让 AI 帮我写辞职信了。下次继续扯,各位。
小雅: 别啊,你辞职了谁给我提供素材?行吧,下期见,记得别迟到,我可不想再录到半夜。