文章编号:1045时间:2024-03-24人气:
作者|刘正无需赘述,2024开年大事件就是Sora,几乎所有人都见识了Sora带来的震撼:极为细腻,真实渲染,情节连续可持续60秒的视频,如同这不可能存在的冬日樱花一样,模糊了真实和虚幻的边界。仿佛回到ChatGPT问世的那一天,OpenAI又一次震撼了世界。在碾过一整条赛道AI初创公司的同时,连带着助力NVIDA拿下美股史上最大涨幅(以市值计算)。看着这一片欣欣向荣的狂欢,仿佛这次真的要被西方先进生产力按在地上摩擦了。所以真的有这么可怕吗?从技术上看,Sora恐怕是过誉了经过数日的挖坟,业界逐渐了解到Sora是基于纽约大学助理教授谢赛宁和学生BillPeebles(如今任职于OpenAI)共同发表的DiffusionTransformer(DiT)的思路来开发的。Diffusion是常见的文生图算法,通过给已标注的图片加噪点直至扩散成完全的白噪音状态,那么将这一操作倒过来就实现了按标注从白噪音中生成与文本对应的图片。在这一点上,Sora和StableDiffusion,Midjourney以及OpenAI自家的DALLE工具没有太多差别。Sora的独到之处,是用GPT中常用的Transformer替换此前常用的UNet模型,来生成下一帧图片。还有,为了把在ChatGPT上玩得炉火纯青的Transformer应用到视频上,OpenAI采用了独特的时空补片(SpacePatch)方法(对应大语言模型中的Token)。通过把视频理解为三维空间(二维图像+一维时间)里堆叠的立方体,将其拆解成隐空间里一个个按时间排序的patch,再套用GPT的Transformer模型进行概率预测分析,最后将其解码回来即可获取后续帧的排列方式。在生成过程里,不断重复这一步骤1440次,就得到了连续流畅,时空一致性极高的60秒视频。无论用了多少工程上的trick,究其本质,Sora所做的仍然是开局一张图,后续全靠猜,不断输出下一帧像素的最大可能性组合。只不过OpenAI调教下的Transformer大力出奇迹,效果之好令人震惊。但OpenAI并没有发明全新的框架,所以仅仅过了两周,StableDiffusion3就正式发布了,用了和Sora同款的DiT框架,在进度上咬得紧紧的。可见,只要显卡管够,算法之下众生平等。这里并不存在去年ChatGPT刚问世时的技术代差。Sora还不具备理解因果律的能力OpenAI宣称Sora是作为世界模拟的视频生成模型,听起来神乎其神的。如在下面这个视频里,在不同角度的镜头切换中,人物和背景的细节一致性好的出奇,仿佛Sora是先在内部构建了人物和场景的3D模型,再对其进行模拟拍摄而产生的画面。其实,这是人类自欺欺人的幻觉。很多人都发现Sora生成视频中有些不合理之处,如这个考古挖掘的视频中,椅子完全不受刚性和重力影响,凭空出现,随风飘扬和变形。任何一个人都能看出这里的诡异之处。师从丘成桐的顾险峰教授深刻讨论了这些bug背后的真相:Sora其实完全不理解真实世界的物理因果律,它只是寻找到了几何上足够平滑的点云分布。而且找到的这个分布基本是局部的最优解,缺乏对长程物理关系本质及表观的体现。比如在下面这个视频中,老太太做了吹蜡烛的动作,但蜡烛却没有被吹灭。这是因为吹熄蜡烛是三维世界里以看不见的空气为中介隔空发生的物理作用。而在二维画面中,蜡烛和人物分属于隐空间中两个无关的patch,但没有任何像素来自看不见的空气,所以Sora无法在蜡烛和人物的画面间建立起因果关系,也就预测不出也画不出吹熄这个效果。这就回到我们一开始所说的,Sora的本质是预测下一帧像素的最大可能性组合。但这种基于归纳的相关性统计方法,无法真正理解具有解析解的物理演绎逻辑。语言或许可以表征人类能表达出的所有的知识和社会建构,所以大语言模型
Blind Game again[OVA:BAD LUCK]Blind Game again かなりキレてるDollいつまでも変わらない夜をぶち壊せざわめく风に めぐるライトが音を立てて 记忆とばす きっと知らぬはずもない诱惑心を乱す君のペースじゃ 何も残せず夜が明けるまだ见えぬ终着は幻覚Don\t Let me Down いつも媚びてるだけCry for the sun 何も见えやしない自分の中で谁が叫ぶ?Blind Game again かなりキメてるDoll届かない梦ならいっそ 脱ぎ舍てろDrastic Game a Game かなりキレてるDollいつまでも変わらない夜をぶち壊せ流れる涙 はびこる嘘に 自分をそめて梦を逃す空に舞う 灰色の情热Don\t Let me Down きっと気付きゃないCry for the sun 君と壊れたいぜ全てを燃やす 瞬间を止めろBlind Game again しけた瞳のDoll意味もなく涙流した夜が明けるDrastic Game a Game ためいきだけのDollどこまでも変わらない夜をぶち壊せBlind Game again かなりキメてるDoll届かない梦ならいっそ脱ぎ舍てろDrastic Game a Game かなりキレてるDollいつまでも変わらない夜をぶち壊せBlind Game again 发狂的玩偶破坏那一成不变的夜晚吧!b沙沙作响的风声中 警戒灯响起了声音当记忆起飞之时 那绝对是早就知道的诱惑除了扰乱我的你的脚步声之外什麼都不留 天就这样亮了还看不到的终点是幻觉在自己心中,是谁在呼喊著:「别让我失望沮丧!你只不过老是在对他献媚!」「为太阳哭泣吧!我根本什麼都看不见!」Blind Game again 下定决心的玩偶如果是无法到达的梦,倒不如舍弃它吧!Drastic Game a Game 发狂的玩偶破坏那一成不变的夜晚吧!流下的眼泪在谎言横行的世界里,错过了自己一昧沉浸其中的梦想黯淡的热情在空中飞舞Don\t Let me Down 一定会注意到的Cry for the sun 想和你一起坏死呢把一切燃烧殆尽吧 把这瞬间停留下来Blind Game again 有著忧郁眼神的玩偶没什麼特别原因的就这样流泪到天明Drastic Game a Game 只是在叹气的玩偶破坏那任何地方都一样的夜晚吧!Blind Game again 下定决心的玩偶如果是无法到达的梦,倒不如舍弃它吧!Drastic Game a Game 发狂的玩偶破坏那一成不变的夜晚吧!Blind Game AgainBlind Game again kanari kireteru Dollitsuma demo kawaranai yoru o buchikowasezawameku kaze ni meguru raito(light) gaoto o tatete kioku tobasu kitto shiranu hazumonai yuwakukokoro o midasu kimi no beis ja nani mo nokosezu yoru ga akerumada mienu shuuchaku wa genkakuDont Let me Down itsumo kobiteru dakeCry for the sun nani mo mie yashinaijibun no naka de dare ga sakebu ?Blind Game again kanari kimeteru Dolltodokanai yume naraitsu nugi suteroDrastic Game a Game kanari kireteru Dollitsuma demo kawaranai yoru o buchikowasenagareru namida habikoru uso ni jibun o somete yume o nisusora ni mau haiiro no jounetsuDont Let me Down kitto kitsu kyashinaiCry for the sun kimi to kowaretai zesubete o moyasu toki o tomeroBlind Game again shiketa hitomi no Dollimi mo naku namida nagashita yoru ga akeruDrastic Game a Game tomeidake no Dolldokoma demo kawaranai yoru o buchikowaseBlind Game again kanari kimeteru Dolltodokanai yume naraitsu nugi suteroDrastic Game a Game kanari kireteru Dollitsuma demo kawaranai yoru o buchikowase
下一篇:热议热议是什么意思
内容声明:
1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违法信息,如您发现违法内容,请联系我们进行举报处理!
4、本文地址:https://link.52hwl.com/article/61a6b1515128c42b0a0b.html,复制请保留版权链接!
苹果推出iOS17.5.1版本后,引起了许多果粉的关注,苹果官方表示这个小版本更新主要修复了照片复活bug,虽然更新涉及的内容较小,但许多老果粉发现系统在许多方面都得到了优化,下面将分享iPhone14Plus用户升级至iOS17.5.1后的真实体验感受,以便更好地了解这次更新带来的优化效果,我们来关注系统的流畅度,在iOS17.5系...。
2024-05-28 20:34:11
根据报道,截至5月27日,正源股份股价为0.68元,股,已连续第十七个交易日收盘价低于1元,股,即使接下来三个交易日涨停,股价也无法回到1元,股以上,上海证券交易所股票上市规则,规定,上市公司连续20个交易日的每日收盘价低于1元,股,触及交易类强制退市情形,此次可能触及退市风险的公司为正源股份,业内人士指出,交易类强制退市是常态化退...。
2024-05-28 17:34:59
在本文中,作者探讨了Linux系统以及Android系统之间的关系,作者指出,准确来说,Linux仅仅是系统内核,而不是整个系统,一般来说,Linux系统主要是基于Linux内核而运行的整体系统和软件环境,因此,可以将Android也看作是Linux系统的一种,因为它是基于Linux内核上运行的一个Java虚拟机环境,不过,Andro...。
2024-03-25 20:08:03
Linux查找网络配置命令主要有以下几个,ifconfig,显示和配置网络接口,ip,可以查看和配置网络接口、路由表、ARP表、统计信息等,netstat,显示网络状态,包括正在监听的端口、连接状态、路由表等,route,用于查看和配置IP路由表,ping,测试与网络上另一台主机的连通性,traceroute,跟踪数据包从本机到目标主...。
2024-03-25 19:34:32
Linux常用命令详细分析,1.pwd命令,pwd的英文解释是printworkingdirectory,用来打印当前工作目录的路径,当输入pwd命令时,Linux会显示当前所在的目录,2.cd命令,cd命令用于改变当前所在目录,例如,cd,将切换到根目录,cd~将切换到,home,user用户目录,cd,usr将切换到根目录下的us...。
2024-03-25 19:32:53
本文详细解释了四川省长期规划的城际铁路——绵遂内铁路取得的重大进展,根据四川省发改委批复,新建绵阳至遂宁至内江铁路绵阳至遂宁段设计速度目标为250公里,小时,全长136.21公里,计划今年全线开工,该铁路的建成将改善成都、绵阳、遂宁半小时通勤圈,解决了三台县和射洪市缺乏铁路交通的问题,同时构建起绵阳至遂宁至武汉、长三角、重庆、贵阳、大...。
2024-03-11 19:28:19
深度学习如何在安卓系统开发中发挥作用深度学习技术是一种人工智能的分支,其模拟人脑神经网络的工作方式,利用大量数据训练模型来实现复杂的任务,在安卓系统开发中,深度学习可以发挥重要作用,为用户带来更智能、更个性化的体验,下面将从不同方面探讨深度学习在安卓系统开发中的应用,1.图像识别与处理在安卓应用中,图像识别与处理是一个常见的需求,借助...。
2024-02-19 00:47:14
安卓系统开发,深度探讨用户体验优化策略安卓系统开发一直是移动应用开发领域的热点话题之一,而用户体验优化策略则是确保应用在安卓系统上顺利运行并受用户欢迎的重要手段,本文将从多个角度对安卓系统开发中的用户体验优化策略进行深度探讨,帮助开发者更好地理解和应用这些策略,一、界面设计优化安卓应用的界面设计对用户体验至关重要,要确保界面简洁明了,...。
2024-02-19 00:42:25
近日,上游新闻举办了一场以传统中国春节为主题的摄影作品展,展示了摄影师秦廷富在北碚地区拍摄的一系列作品,这些作品记录了北碚地区在2024年春节期间举办的龙登缙云活动,展现了浓厚的年味和传统文化魅力,在北碚地区的缙云山三花石游客中心,从2月10日到2月17日举办了一系列以龙登缙云为主题的活动,其中包括年味集市、年俗故事、舞龙巡游等多个文...。
2024-02-13 12:57:02
你是否越长大越不快乐?病真的是由“心”生吗?内向是性格缺陷吗?拒绝“语言暴力”回避“情感吸血鬼”你敢承认自己自私吗?长期压抑滋生病态心理怀旧也是一种“心理病”谁制造了抑郁“病毒”?不完美也是一种美角度决定世界的面目让痛苦逼出最大的潜能创富心理简明修炼法“乐观”是可以练成的有些事儿,不用找心理医生,《做自己的心理医生》帮您全面了解自己,克服心理障碍。学做自己的心理医生,强大内心,做最好的自己!本书由鲁芳著。
2021-05-06 10:53:29
限以前领过社保卡的招行老用户参与 打开地址跳转到招商银行APP参与-小程序进入返回就行了-再做个阅读文章任务-返回抽奖必中 活动地址: https://tb3.cn/AHLQs0
2021-04-30 17:21:01