Sora持续火爆多只概念股涨停 国内企业竞相布局AI警惕过度炒作

作者 | 《财经》新媒体 撰稿人 王婧雅 编辑 | 高素英  

2024年02月20日 20:49  

本文2879字,约4分钟

多角度流畅的镜头画面切换、逼真的人物表情、精细化的细节表现……Sora的生成式能力颠覆以往人们对AI技术的认知。2月20日,Sora概念股再度领涨A股市场,截至收盘,Sora概念板块(BK1159)上涨6.67%,其中会畅通讯、当虹科技、新华网等多10只股票涨停。

除了OpenAI、谷歌等海外企业,中国企业也在加速布局AI。笔者从魅族处获悉,魅族将all in AI,面向软、硬件布局AI Device 产品、重构Flyme系统和建设AI生态;联想则告诉笔者,与其他科技企业发展AI的方式不同,联想或引入其他云厂商一同实现AI化。

值得注意的是,Sora并非只是一个简单的视频生成器,更是构建物理世界通用模拟器。它的出现让行业看到了一条对现实世界进行模拟的可行性实践路径。不过,现阶段大模型距离高级人工智能水平还有差距,仍然无法替代人的工作,它的作用在于基于应用帮助人们工作与生活提质增效。

业内普遍认为,要客观看待Sora的出现,一方面它将颠覆传统行业的发展模式;另一方面,与文字的逻辑不同,Sora生成出的一些错误画面现恰恰体现出机器尚未完全从文字中推演理解现实世界的3D画面逻辑,如何让机器更好地理解现实世界中的行为逻辑是AI技术要解决的问题;此外,随着越来越多的企业宣布转型AI,也要警惕借AI噱头炒作概念。

Sora打破现实与虚拟的边界

尽管Sora生成视频内容只有一分钟时长,且尚处于测试阶段仅对部分人员开放访问权限,但人们对Sora的表现仍充满期待,不少人惊呼这一技术的出现将颠覆影视、游戏等传统视频行业。

事实上,Sora热度持续走高与其颠覆性的生成能力不无关系。笔者注意到,以往也有Midjourney、Runway等AI大模型可以基于文字、图片等生成视频内容。然而笔者体验发现,相较Sora,这类大模型技术无法处理细节,也无法以不同镜头视角的画面生成流畅的视频内容。

例如笔者在Midjourney输入了“夕阳时分,一群滑雪爱好者在山顶举办了一场热闹的夕阳派对,电影杰作的风格,专业的摄影,浅景深,聚焦的主题,专业的色彩等级,微妙的动态,电影化,专业的电影摄影机拍摄”文字描述,Midjourney基于此只自动生成了一个为时3s的视频画面,且视频中人物的面部细节、着装细节等全部没有呈现或有明显的错误,画质也比较粗糙。

区别于此前许多AI大模型文生图或视频时出现人物形象前后不一致、细节无法还原等问题,此次OpenAI展示的Sora生成的视频中的主角、背景人物在60秒的视频中都具备一致性。同时,Sora能够能够理解语言提示,生成具有鲜明特色的角色以及各类复杂场景,并高度还原阴影、倒影、反光等细节。此外,Sora与人类拍摄剪辑视频一样,在自由切换不同的镜头视角时并准确保留角色和视觉风格,不会出现画面跳跃、移轴等情况。

除了通过文字语义生成视频,笔者发现在剪辑方面Sora也可以理解不同视频之间的关系。比如输入两个完全不同主题和场景的视频后,Sora可以通过专场实现两个视频的无缝过渡。

国内算力厂商内部人士告诉笔者,目前,生成视频类大模型主要有基于Transformer模型(理解能力)和基于扩散模型(生成能力)两种技术方式,Sora则是结合两种技术,通过高度可扩展的“补丁”,训练不同类型的视频和图像的生成模型。从效果来看,Sora表现明显优于以往市面上的文字/图片/视频生成视频的产品。Sora在视觉效果上几乎可以高度还原现实世界。而实现这一切的背后,与其技术方案相关。

大模型无法替代人类思维 算力等基础能力待突破

数据、算法及算力是训练大模型的重要基础。对于视频而言,其对算力要求更高。OpenAI 官网显示,在base compute 、4x compute、32x compute不同算力模式下,生成的画面呈现出了完全不一样的效果。

在应用基础算力时,输出的视频无法看出小狗的雏形,只有一团模糊的物体在运动,而在4倍算力情况下,小狗的形态已经可以完整展现但没有呈现细节,直到应用32倍算力时,才把小狗真实地还原出来。

除了对算力、数据的要求,在对现实世界事物的理解能力方面,目前大模型仍然无法替代人们的思维模式。虽然Sora可以输出清晰、流畅的视频,但也会出现一些明显的错误,比如玻璃杯没有破碎但杯中的水已经洒出、小动物的数量来回变化、人在跑步机上倒着锻炼等等问题。

国内研发大模型厂商内部人士告诉笔者,Sora宣传的视频效果确实精美,但一帧一帧的细节对于技术要求非常高。不仅仅是大数据和算力,不同于文字内容,很多现实世界中的事物是立体且多元的,它所呈现的逻辑AI仍然无法完全理解和模拟。比如Sora生成的视频中有一幕椅子在飞的画面,或是因为其没有理解事物之间的逻辑。在此方面,人工智能无法代替人类的工作,但此次Sora的出现大幅缩短了AGI技术的发展速度,让人们看到了人工智能具备理解能力的可能性。

除此之外,伦理和社会问题也是AGI技术亟待解决的问题。DICC互联网研究院院长刘兴亮认为,AGI技术的发展让虚拟与现实的界限变得模糊,内容、版权、隐私、数据安全等问题纷至沓来,社会需要一套完善的政策、法律和伦理规范来应对,确保技术发展不脱轨,保障每个人的利益。

警惕AI过度炒作

Sora的持续火爆带动了A股市场中Sora概念股持续上涨。截至2月20日收盘,又有10只Sora概念股涨停。

目前,国内企业竞相布局AI技术。除了百度、华为、科大讯飞等企业,近日,魅族、联想、OPPO也相继宣布加码或转型AI。魅族方面告诉笔者,除了软、硬件方面的开发,针对AI生态,魅族将向OpenAI等大模型团队开放魅族AI Device硬件。联想方面则称,联想AI化的出发点与互联网公司不同,实现AI化或需要云端厂商的参与。

不容忽视的是,虽然各大企业都在布局AI,AI手机、端侧大模型等各类产品也相继而出,但针对如何开发AI、AI会为用户带来哪些切实的改变等规划仍然不明确,上述企业都未作出正面回答。

在国产手机厂商内部人士看来,现阶段国内很多企业宣布转型AI,目的在于热点、流量、争议、噱头和传播,而非技术。

事实上,关于Sora出现后究竟能够带来哪些改变仍然处于猜测的阶段。上述国产大模型厂商内部人士表示,虽然很多观点认为Sora将在影视行业落地变现,但现在的技术不一定能够实现。与此同时,通用大模型的应用不会局限在某一个点,实现大模型落地还需要更多行业参与者一同共建,利用多样化的应用加速通用大模型技术落地。

上述国内算力厂商内部人士则表示,目前我国大模型技术与OpenAI、谷歌等头部企业技术相比仍有差距,但对比自身来看技术能力正在持续提高。不过,很多企业宣布加码AI时,并不理解如何做以及布局AI的意义是什么,一些厂商在Acopy阶段就开始思考商业化的问题。AI大模型要解决的不仅是创作,还包括应用于科学研究等更多领域,比如此前Alpha Fold的出现就解决了蛋白质折叠的问题,而由Sora带来的技术变革仍待观察。