AI 失魂、模型之争、像素革命 —— 从代码到枪支的技术焦虑
About This Episode
本期我们剖析 Gemini 3.1 Pro 与 Claude Opus 的真实对决,聊 AI 生成内容为何让人感到乏味;再把目光投向 Minecraft Java 从 OpenGL 到 Vulkan 的巨变以及加州新立法把 3D 打印机变成 “会说话” 的监管工具,最后探讨 AI 是开发者的外骨骼还是潜在的取代者。
Chapters
Links
小雅: 操,老冯,你这边怎么跟个蒸笼似的?咖啡都快煮干了,你还在那儿对着屏幕傻笑。
老冯: 哟,小雅你来得正好,我这边刚把树莓派的风扇拆了,看看能不能榨出点性能跑个小模型。这玩意儿现在跟个烤箱似的,烫手得很。
小雅: 你他妈的就不能买个新的?非得在这儿折腾这破烂玩意儿。今年都 2026 年了,你还在用这堆垃圾。
老冯: 得了吧,你那新买的 AI 显卡不也整天跑着跑着就卡死?技术这玩意儿,越新越不靠谱。再说,我这不是图个乐子嘛。
小雅: 乐子?你是真不怕哪天这玩意儿给你烧了。行了,不扯淡了,今天咱聊点正经的。最近这圈子里乱七八糟的事儿可不少,AI 失魂、模型打架、游戏里的像素革命,还有人拿技术当枪使的,焦虑得很。
老冯: 嚯,听你这意思,今天咱们得好好扒扒这帮人的皮。我先说一个,最近不是有不少模型突然「失魂」了吗?跑着跑着就开始胡言乱语,跟喝多了似的。
小雅: 可不是嘛,OpenAI 那边都急得跳脚了,赶紧发公告说是「短暂异常」。他妈的,短暂个屁,我看就是底层架构出了问题,还死不承认。
老冯: 你这就说到点子上了。这帮大厂啊,一出事就甩锅给「短暂」、「异常」,好像咱们都是傻子。不过话说回来,这模型之争也越来越有意思了,Meta、Google、还有那帮开源玩家,都在拼命卷,卷到最后谁受益?
小雅: 谁受益?反正不是咱们这些用户。今天一个新模型,明天一个新框架,搞得人眼花缭乱。还有那帮游戏开发者,非得整什么「像素革命」,生怕玩家不知道他们在炫技。
老冯: 哈哈,你这火气不小啊。不过说真的,技术这玩意儿,有时候真跟枪似的,指哪打哪。咱们今天就好好聊聊这帮人是怎么把技术玩出花来的,顺便看看谁又在背后捅刀子。
小雅: 操,Google 又搞大新闻了,Gemini 3.1 Pro 今天正式官宣,还他妈直接放了个 77.1% 的 ARC-AGI-2 成绩,牛逼不牛逼?
老冯: 哟,小雅你这激动劲儿,跟 Google 的 PR 团队有得一拼啊。77.1%?看起来是挺吓人,但你信吗?
小雅: 操,你又阴阳怪气什么呢?人家好歹是「verified score」,不是自己吹的。
老冯: verified 又咋样?Google 的 benchmark 游戏玩得比谁都溜。记得去年他们那个「DeepMind Reasoning Challenge」吗?最后还不是被曝数据泄露。
小雅: 行行行,你就爱泼冷水。但这次他们放了实际 demo 啊,什么 SVG 动画、ISS 仪表盘、3D 鸟群模拟,看起来可不是纸上谈兵。
老冯: demo 看起来牛逼,但你用过吗?我前几天拿 3.1 Pro 写个简单的数据分析脚本,结果它给我整了一堆「thinking tokens」,半天没动静。
小雅: 操,这事儿我听说了!评论区有个前 Googler 吐槽得贼狠,说 Gemini「stunningly good at reasoning but falls over when actually trying to get things done」。
老冯: 这不就是 Google 的老毛病吗?内部优先级永远排在用户反馈前面。记得 Google Wave 吗?记得 Google + 吗?现在轮到 AI 了。
小雅: 但这次不一样啊!他们有 TPU,有广告收入,有搜索霸权,资源比 OpenAI 和 Anthropic 加起来都多。
老冯: 资源多有啥用?Google 现在就是个巨型官僚机器,每个团队都在搞自己的 AI 小王国。Vertex AI、Gemini Enterprise、Antigravity... 你数数有多少重叠产品?
小雅: 操,你这话说得我都有点心虚了。但他们好歹在推进 agentic workflows 啊,3.1 Pro 不是专门为复杂任务设计的吗?
老冯: agentic workflows?你是说那个「Google Antigravity」平台?名字起得挺唬人,但你问问开发者,有几个在用?
小雅: 操,你别老拿开发者说事儿!普通用户呢?NotebookLM、Gemini app,这些不都是给普通人用的吗?
老冯: 普通用户?你见过哪个普通用户会去折腾「code-based animation」或者「live aerospace dashboard」?Google 这帮人脑子里装的都是「moonshot」,不是「how do we make this actually useful」。
小雅: 行,那你告诉我,Claude Opus 比 Gemini 好在哪儿?别光说 Google 不行,你得说说别人行。
老冯: Claude 的代码生成过程就是比 Gemini 清晰,每一步都给你解释得明明白白。你用过就知道,Gemini 那「thinking tokens」简直就是在耍流氓。
小雅: 操,这不就是个 UX 问题吗?Google 改改不就完了?
老冯: UX 问题?小雅,你太天真了。这背后是整个产品哲学的问题。Google 做产品是「我们觉得这个酷,所以你应该用」,而 Anthropic 是「我们先听听你需要什么,再做」。
小雅: 操,你这话说得我都想辞职去 Anthropic 了。但 Google 好歹在硬件上有优势啊,TPU 不是吹的,训练成本比 NVIDIA 低多了。
老冯: 硬件优势?你忘了 Google Cloud 的销售团队有多拉胯了?AWS 和 Azure 早就把市场瓜分完了,Google Cloud 现在连个像样的 AI 生态都没建起来。
小雅: 操,你这也太悲观了。Google 好歹在搜索上还有优势,他们可以把 Gemini 直接整合进去,一下子就有几十亿用户。
老冯: 整合?你是说像 Bard 那样?Bard 现在连个像样的市场份额都没有。Google 搜索团队和 Gemini 团队现在还在内斗呢,你信不信?
小雅: 操,你这简直就是在唱衰 Google。那你觉得他们还有救吗?
老冯: 救?可能吧。但得等他们先承认自己有问题。现在 Google 的 AI 团队就像个巨婴,有无限资源,但就是不懂怎么用。
小雅: 操,你这话说得我都想喝口咖啡压压惊了。但不管怎么说,Gemini 3.1 Pro 的 demo 还是挺炫的,那个 3D 鸟群模拟简直绝了。
老冯: 炫?确实挺炫。但炫完之后呢?你真拿它干活儿试试,保准让你怀疑人生。
小雅: 操,你这人就是事儿逼!行行行,咱们走着瞧,看看 Google 这次能不能翻身。
老冯: 走着瞧?好啊,我等着看 Google 的下一个「moonshot」怎么把自己炸上天。
小雅: 操蛋,老冯,你看到这篇《AI makes you boring》了吗?2026 年了,他妈的还在讨论这个,我以为早该解决了。
老冯: 嘿,小雅,你急啥?这不正说明问题还没解决嘛。我看了,这作者说的有点意思,AI 生成的东西确实没灵魂。
小雅: 对啊!Show HN 现在全是 AI 堆出来的项目,看个标题就知道没劲。以前多好,能跟真正思考过问题的人聊天。
老冯: 嗯,作者说得对,AI 把无聊的人和无聊的项目都带进来了。你想想,谁会花时间跟一个提示词工程师讨论代码?
小雅: 操,我就烦这个!AI 生成的代码功能上没问题,但他妈的谁会去读?谁敢用?万一出事儿了算谁的?
老冯: 哈哈,你这问题问得好。代码又不是诗歌,能跑就行 —— 但前提是你得信得过它。AI 写的代码,你敢直接上生产?
小雅: 我信个屁!上次我同事用 AI 生成了个验证模块,结果漏洞百出,差点把客户数据全泄了。
老冯: 所以啊,AI 写代码是爽,但「attention debt」这词用得好。你省了时间写代码,结果花更多时间调试和验证。
小雅: 对对对!还有那些 AI 生成的邮件,看起来专业,读起来跟屁话一样。每次收到这种邮件我都想骂人。
老冯: 评论区那个比喻太绝了 —— 两个 LLM 互相对话,人类早就摸鱼去了。90 年代的答录机互相留言,现在变成 AI 互相写邮件。
小雅: 哈哈哈,笑死我了。但这不是搞笑,这是悲剧!每次看到这种邮件我都得花半天时间找里面有没有真正的信息。
老冯: 所以啊,AI 这玩意儿,用得好是工具,用不好就是灾难。作者说得对,原创思考是没法外包的。
小雅: 对!你得自己先泡在问题里,才能有真正的想法。AI 能帮你写代码,但写不出你的思考过程。
老冯: 嗯,就像作者说的,你不能指望用挖掘机练肌肉。AI 能帮你生成想法,但你得自己先有想法。
小雅: 操,我现在看到那些「AI 辅助开发」的项目就烦。明明是个人类该干的活儿,非得让 AI 来搅和。
老冯: 别急,小雅。AI 也不是一无是处,至少能帮你生成模板啊,搭个框架啥的。但核心思考还是得靠人。
小雅: 嗯,这倒是。但前提是你得知道自己在干嘛,不能全靠 AI 瞎指挥。
老冯: 对,就像写论文,AI 能帮你润色,但观点和逻辑得你自己来。不然最后写出来的东西全是套话。
小雅: 操蛋的 AI,让世界变得更无聊了。不过话说回来,咱们也得适应,对吧?
老冯: 适应是肯定的,但别忘了保持自己的思考。AI 再牛逼,也替代不了人类的创造力。
老冯: 诶,小雅,你刷到那个加州新法案了吗?3D 打印机要 DOJ 批准,还得自动举报自己。
小雅: 操蛋,这他妈的简直是科技版《1984》!加州这是要把每个车库都变成监控点啊?
老冯: 哈哈,你这话说得,跟评论区那个 delichon 有异曲同工之妙。他说这玩意儿跟要求文本编辑器检查内容合法性再保存一个道理。
小雅: 对啊!先审查再创作,这他妈的跟审查制度有啥区别?第二修正案直接给你废了!
老冯: 但支持者说了,这是对联邦不作为的回应。反正加州也不是第一次单干了,枪支管控全国最严,效果呢?
小雅: 效果?屁用没有!数据都他妈的打架,Everytown 那帮人数据一出来,反对派直接说是偏见。
老冯: 哎,这不就是联邦主义的尴尬吗?全国统一不了,加州就自己搞一套,结果呢?枪支还是从外州流入。
小雅: 操,这法案纯属作秀!真要管,就该抓非法制造的人,而不是给每个教室、图书馆的 3D 打印机装监控软件!
老冯: 你这话我爱听。不过话说回来,这事儿跟咱们之前聊的 AI 审查也挺像的,都是「先管工具再管人」。
小雅: 对啊!这帮政客就喜欢搞这种「技术解决社会问题」的假把式,结果呢?问题没解决,自由先没了。
老冯: 哈哈,你这话说得,我都想给你点赞了。不过话说回来,要是这法案真推行,你说那些 DIY 爱好者会不会直接黑进去?
小雅: 那必须的!加州政府这是逼着人家玩「固件越狱」啊。到时候黑客大会上又多了个热门话题。
老冯: 诶,你这么一说,我突然想到,要是这法案真成了,你说那些 3D 打印机厂商会不会直接搬到德州?
小雅: 操,那还用说!德州巴不得他们过去呢,到时候加州又得哭着求人家回来。
老冯: 哈哈,这画面太美我不敢想。不过话说回来,这事儿也挺讽刺的,技术本来是解放生产力的,结果现在成了管控工具。
小雅: 可不是嘛!这帮政客就知道拿技术开刀,真正的问题一个都不敢碰。操蛋!
老冯: 操,Minecraft Java 这帮人终于要从 OpenGL 换 Vulkan 了?我还以为他们得抱着那个老古董 API 到地老天荒呢。
小雅: 他妈的,终于!这帮人磨磨唧唧这么多年,就知道吹嘘 Java 跨平台,结果连个渲染 API 都不敢升级。
老冯: 别急着夸,小雅。你真的觉得 Vulkan 就是万灵药?Minecraft 这玩意儿 CPU 瓶颈都快成传说了。
小雅: 废话,Vulkan 好歹能减少 CPU 开销,提升并行度。OpenGL 那套单线程模型早他妈过时了。
老冯: 切,你以为 Mojang 那帮人真会重构 draw call 处理?换个 API 就跟换衣服似的,底层架构不改,还是个半残废。
小雅: 那你倒是说说,怎么改?GPU compute 直接渲染体素?Minecraft 那破烂引擎撑得住吗?
老冯: 哈,你问我?我又不是 Mojang 的工程师。不过评论区有个大佬说得好:「Garbage collection is a crutch」。
小雅: 操,这句我喜欢!Java 那垃圾回收就是掩耳盗铃,问题藏着掖着,等游戏崩了才发现羊都他妈卡在岩浆里了。
老冯: 对喽,C / C++ 的 mod 倒是会直接崩溃,起码能让人早点发现问题。不像 Java,故障都他妈是隐形的。
小雅: 说到 mod,这帮 modder 可要哭死了。OpenGL 的 shader mod 全得重写,生态直接裂开。
老冯: Mojang 倒是贴心,说什么「尽量复用内部渲染 API」。笑死,你内部 API 就没几个 modder 用得明白。
小雅: 操蛋,这帮人就不能直接整个跨平台 RHI?DX12、Metal、Vulkan 一把梭,反正微软有钱。
老冯: 理想很丰满,现实很骨感。Mojang 那点人手,连 Java 版的 bug 都修不过来,还想搞 RHI?
小雅: 那倒也是。不过 Intel HD 4400 那帮老古董用户可要哭了,Vulkan 不兼容,直接给淘汰。
老冯: 淘汰就淘汰呗,技术进步总得有人牺牲。不过话说回来,Bedrock 版用 bgfx 不是好好的?
小雅: 别提 Bedrock!那玩意儿 console 优化是好,但 mod 生态一塌糊涂,稳定性也差。Java 版再烂,起码 mod 多啊。
老冯: 所以啊,这帮人就是在技术债里打滚。Vulkan 换了,OpenGL 还得并行支持一阵子,到时候又是一堆兼容性问题。
小雅: 操,夏天的 snapshot 估计又得炸。不过话说回来,macOS 那帮人还得靠翻译层,苹果这自家 API 真他妈鸡肋。
老冯: Metal 又不是不能用,苹果就是爱搞闭环。不过 Mojang 这波操作,起码证明他们还没完全躺平。
小雅: 躺平?他们要是躺平了,Java 版早他妈被 Bedrock 吞了。这帮人就是在刀尖上跳舞,一边讨好 modder,一边得兼顾性能。
老冯: 跳舞?我看是走钢丝。Vulkan 上线那天,估计又是一堆「我的 mod 不兼容」、「帧数掉了」的哭喊。
小雅: 管他呢,反正我早就切了 Sodium。这帮人不干活,modder 自己干。
老冯: 哈哈,这才是 Minecraft 的精髓。官方不干,社区来凑。Vulkan 来了又怎样?最后还得靠 modder 救场。
小雅: 操蛋,我他妈的又看到一篇把 AI 吹成「自动化员工」的文章,气死我了。
老冯: 哟,又是谁惹我们小雅愤青了?来来来,给哥讲讲,哪个大厂公关又开始放屁了?
小雅: 不是大厂,是这篇《AI is not a coworker, it's an exoskeleton》,作者说 AI 不是你同事,是你的外骨骼!
老冯: 外骨骼?这比喻有点意思啊,我记得德国那帮工人穿上那个 Cray X,搬东西跟玩似的。
小雅: 对对对!BMW 用了那个 Levitate 的背心,工人搬东西劲儿小了 30-40%,伤病率还直线下降。
老冯: 哈,这不就是「钢铁侠」现实版吗?不过话说回来,这跟 AI 有啥关系?
小雅: 关系大了!作者说 AI 不是来替代你的,是来放大你的能力的,就像外骨骼放大工人的力气一样。
老冯: 哦?那「agentic AI」那帮吹牛逼的呢?说什么 AI 能自动写代码、自动决策的?
小雅: 他妈的,那帮人就是想把 AI 当成「自动化员工」,结果呢?一堆「hallucination」、「off the rails」,最后还得人类擦屁股。
老冯: 哈哈,评论区那个 ok_dad 说得好,「agent swarm doesn」t need a month」—— 结果呢?吹的牛逼都他妈是泡沫。
小雅: 对对对!Kasava 这篇文章就说了,AI 不是来替代你的,是来帮你「看得更远」的。
老冯: 比如呢?别光说概念,给我整点实际的。
小雅: 比如 Kasava 的 commit analysis,它能读你所有的 commit,告诉你哪个模块在积累技术债,但最后决定怎么搞的还是你!
老冯: 哦,这不就是「放大镜」吗?AI 帮你找问题,但解决问题还是得靠人。
小雅: 对啊!还有那个 product graph,结合你的代码、issue、PR,再加上你的战略判断,AI 帮你分析,但最后拍板的还是你。
老冯: 有点意思,但我还是觉得这帮人有点「过度美化」。AI 再牛逼,也得人类喂它 context 吧?
小雅: 废话!外骨骼再牛逼,也得工人穿上它才能干活啊。AI 就是你的「外骨骼」,你不给它方向,它能干啥?
老冯: 行行行,你赢了。不过话说回来,这「外骨骼」比喻确实比「自动化员工」靠谱。
小雅: 必须的!AI 不是来抢你饭碗的,是来让你「跑得更快」的。就像哈佛那个 exosuit,跑马拉松跟跑 24 英里似的。
老冯: 哈哈,那我得赶紧给我这老腰整一个「AI 外骨骼」,省得天天加班腰疼。
小雅: 你丫的,赶紧的!不过记住了,AI 是你的工具,不是你的老板。
老冯: 得嘞,我这「外骨骼」得听我的,要不然我给它卸了!
老冯: 操,聊到现在我咖啡都凉了,树莓派还在那儿嗡嗡跑着,跟个老牛拉破车似的。
小雅: 他妈的,你还好意思说,刚才扯什么模型之争扯得我脑壳疼,结果你自己又跑题到枪支管制去了。
老冯: 诶,技术焦虑嘛,从代码到枪支不都是人类造出来的玩意儿?你情我愿的事儿。
小雅: 行行行,反正你总有道理。不过说真的,今天聊完还挺爽的,至少没人跟我扯什么「AI 伦理」的虚头巴脑。
老冯: 哈哈,那帮大厂公关估计听完得气得跳脚。对了,想听下期继续扯淡的话,用你常用的泛用型客户端订阅一下呗,别指望那些封闭平台给你推送。
小雅: 切,我早就 RSS 订阅了,更新了就能收到,不用你操心。
老冯: 行,那今天就到这儿,下次有空再聊。反正树莓派也快跑崩了,我得去救救它。
小雅: 赶紧的,别等它彻底罢工了又怪我。走了啊,拜拜。
老冯: 拜拜,下期见。