打开APP
小贴士
2步打开 媒体云APP
  • 点击右上角“…” 按钮
  • 使用浏览器/Safari打开

Sora“升维”AI视频引发算力需求激增

2024-02-29 16:04

近日,美国OpenAI公司正式发布文生视频模型Sora,再次在全球掀起了人工智能关注浪潮。业内人士认为,从当前展示效果来看,Sora显著领先于其他文生视频模型,后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响,并进而传导到上游算力基础设施,算力需求有望再次迎来爆发。

文生视频探索新高度

美国OpenAI公司发布的全新的Sora文生视频模型,可以根据用户输入的文本指令,一次生成60秒的长视频,且视频的画面精细度、流畅度超越了以往的文生视频模型。由于Sora能够模拟对世界状态产生简单影响的行为,有分析人士认为,这将文生视频能力推向了全新的高度。

在Sora发布之后,有博主对当前市场上其他主流文生视频产品做了对比评测,在对Sora、Pika、Runway和Stable Video四个模型输入了相同的提示词后,Sora在视频生成质量和时间上均对同行“降维打击”,其更加清晰连贯、符合描述。

在OpenAI官方的技术报告中,对Sora的定位为“作为世界模拟器的视频生成模型”。“之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。”华金证券计算机首席分析师方闻千说。

360集团创始人周鸿祎表示,以往文生视频软件都是在2D平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是“真实”的。

业内人士表示,虽然OpenAI表示当前Sora仍有弱点,例如难以准确模拟复杂场景中的物理现象,可能无法理解具体的因果关系,但从当前展示的效果来看,Sora显著领先于其他文生视频模型,推动AI视频生成“进入了一个全新的时代”。

通用人工智能加速到来

目前,Sora暂未公开使用权限,仅对一部分视觉艺术家、设计师和电影制作人开放。业内人士认为,随着技术的进一步成熟,Sora将会推向所有用户。Sora预示AGI(通用人工智能)将加速到来,其后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响。

值得一提的是,日前大火的游戏《幻兽帕鲁》的开发团队仅有4人,市场猜测该团队使用了AI生成技术制作游戏角色,以节省成本。根据OpenAI发布的最新Sora技术报告,Sora能够模拟视频游戏的数字化过程。这意味着,开发制作游戏的门槛可能会被进一步降低。

“有了强大AI能力的加持,OpenAI通往商业成功之路缺的并不是程序员,而是能实现商业闭环的‘金点子’。一旦任务明确,OpenAI就可以很快复制,解决任何能力短板。”中经社区块链首席经济分析师郭兴华说。

天风证券认为,随着OpenAI发布Sora文生视频模型能力大幅提升,内容创作工作流有望被颠覆,下一个亿级用户的互联网平台雏形已然出现。2000亿美元的短视频创作生态有望率先被颠覆,生成式AI在视频创作和世界模型领域的大踏步进步将实现对视频、3D、游戏等下游应用场景的渗透。

此前,A股有不少上市公司曾披露文生视频有关布局。因赛集团1月26日发布的调研纪要显示,公司的Insight GPT预计于2024年3月底前开发实现文生视频功能,之后推出公测版正式启动商业化,公司目前已收到几家汽车、快消行业知名品牌方发出的AIGC(生成式人工智能)营销项目投标邀请。

“Sora的诞生意味着AGI实现可能从10年缩短至一两年。”周鸿祎认为,Sora只是小试牛刀,它展现的不仅仅是视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。有了大模型技术作为基础,再加上人类知识的引导,可以创造各个领域的超级工具,例如在生物医学、蛋白质、基因研究,物理、化学、数学的学科研究方面,大模型都会发挥作用。

算力需求再迎爆发

业内认为,Sora强大的文生视频能力将快速推进应用端商业化落地、拉动产业规模,进而传导到上游算力基础设施,算力需求将再次迎来爆发。

据了解,Sora所需token(文本处理最小单位)数量相较于文本及图片模型的推理呈数量级增长。经中信证券简单估算,对于一个60帧的视频(约6至8秒),Sora要生成至少约120万个token,这是相当大的计算量。

“最强AI比拼的终点就是算力。”郭兴华表示,为了更快和更好地实现对视频的渲染和合成,高性能计算机和计算芯片的需求将进一步释放。科技爆炸的背后需要算力膨胀来匹配,AI芯片将是这场变革中最核心的高地。

OpenAI的CEO萨姆·奥尔特曼表示,正在与投资者进行洽谈,旨在提高全球芯片产能,扩大其支撑AI性能的能力,该项目可能需要筹集至多5万亿至7万亿美元资金。奥尔特曼建议,OpenAI、投资者、芯片制造商和电力供应商建立合作关系,共同出资建立芯片工厂。

中信证券表示,本次OpenAI的模型更新仍然是围绕底层算法层面,除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提升。持续看好AI算力层面,尤其是得益于商业端成熟而带来的更多的AI推理侧算力的机会。

华金证券认为,AI技术的快速发展催生了算力需求的快速提升,为国内外算力产业链带来了巨大的发展机遇。逻辑芯片市场空间巨大,国产厂商具有巨大的替代空间。半导体行业在经历2022年、2023年的去库存周期后,销售额有望在2024年迎来复苏。(记者 闫鹏 李唐宁)


近日,美国OpenAI公司正式发布文生视频模型Sora,再次在全球掀起了人工智能关注浪潮。业内人士认为,从当前展示效果来看,Sora显著领先于其他文生视频模型,后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响,并进而传导到上游算力基础设施,算力需求有望再次迎来爆发。

文生视频探索新高度

美国OpenAI公司发布的全新的Sora文生视频模型,可以根据用户输入的文本指令,一次生成60秒的长视频,且视频的画面精细度、流畅度超越了以往的文生视频模型。由于Sora能够模拟对世界状态产生简单影响的行为,有分析人士认为,这将文生视频能力推向了全新的高度。

在Sora发布之后,有博主对当前市场上其他主流文生视频产品做了对比评测,在对Sora、Pika、Runway和Stable Video四个模型输入了相同的提示词后,Sora在视频生成质量和时间上均对同行“降维打击”,其更加清晰连贯、符合描述。

在OpenAI官方的技术报告中,对Sora的定位为“作为世界模拟器的视频生成模型”。“之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。”华金证券计算机首席分析师方闻千说。

360集团创始人周鸿祎表示,以往文生视频软件都是在2D平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是“真实”的。

业内人士表示,虽然OpenAI表示当前Sora仍有弱点,例如难以准确模拟复杂场景中的物理现象,可能无法理解具体的因果关系,但从当前展示的效果来看,Sora显著领先于其他文生视频模型,推动AI视频生成“进入了一个全新的时代”。

通用人工智能加速到来

目前,Sora暂未公开使用权限,仅对一部分视觉艺术家、设计师和电影制作人开放。业内人士认为,随着技术的进一步成熟,Sora将会推向所有用户。Sora预示AGI(通用人工智能)将加速到来,其后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响。

值得一提的是,日前大火的游戏《幻兽帕鲁》的开发团队仅有4人,市场猜测该团队使用了AI生成技术制作游戏角色,以节省成本。根据OpenAI发布的最新Sora技术报告,Sora能够模拟视频游戏的数字化过程。这意味着,开发制作游戏的门槛可能会被进一步降低。

“有了强大AI能力的加持,OpenAI通往商业成功之路缺的并不是程序员,而是能实现商业闭环的‘金点子’。一旦任务明确,OpenAI就可以很快复制,解决任何能力短板。”中经社区块链首席经济分析师郭兴华说。

天风证券认为,随着OpenAI发布Sora文生视频模型能力大幅提升,内容创作工作流有望被颠覆,下一个亿级用户的互联网平台雏形已然出现。2000亿美元的短视频创作生态有望率先被颠覆,生成式AI在视频创作和世界模型领域的大踏步进步将实现对视频、3D、游戏等下游应用场景的渗透。

此前,A股有不少上市公司曾披露文生视频有关布局。因赛集团1月26日发布的调研纪要显示,公司的Insight GPT预计于2024年3月底前开发实现文生视频功能,之后推出公测版正式启动商业化,公司目前已收到几家汽车、快消行业知名品牌方发出的AIGC(生成式人工智能)营销项目投标邀请。

“Sora的诞生意味着AGI实现可能从10年缩短至一两年。”周鸿祎认为,Sora只是小试牛刀,它展现的不仅仅是视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。有了大模型技术作为基础,再加上人类知识的引导,可以创造各个领域的超级工具,例如在生物医学、蛋白质、基因研究,物理、化学、数学的学科研究方面,大模型都会发挥作用。

算力需求再迎爆发

业内认为,Sora强大的文生视频能力将快速推进应用端商业化落地、拉动产业规模,进而传导到上游算力基础设施,算力需求将再次迎来爆发。

据了解,Sora所需token(文本处理最小单位)数量相较于文本及图片模型的推理呈数量级增长。经中信证券简单估算,对于一个60帧的视频(约6至8秒),Sora要生成至少约120万个token,这是相当大的计算量。

“最强AI比拼的终点就是算力。”郭兴华表示,为了更快和更好地实现对视频的渲染和合成,高性能计算机和计算芯片的需求将进一步释放。科技爆炸的背后需要算力膨胀来匹配,AI芯片将是这场变革中最核心的高地。

OpenAI的CEO萨姆·奥尔特曼表示,正在与投资者进行洽谈,旨在提高全球芯片产能,扩大其支撑AI性能的能力,该项目可能需要筹集至多5万亿至7万亿美元资金。奥尔特曼建议,OpenAI、投资者、芯片制造商和电力供应商建立合作关系,共同出资建立芯片工厂。

中信证券表示,本次OpenAI的模型更新仍然是围绕底层算法层面,除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提升。持续看好AI算力层面,尤其是得益于商业端成熟而带来的更多的AI推理侧算力的机会。

华金证券认为,AI技术的快速发展催生了算力需求的快速提升,为国内外算力产业链带来了巨大的发展机遇。逻辑芯片市场空间巨大,国产厂商具有巨大的替代空间。半导体行业在经历2022年、2023年的去库存周期后,销售额有望在2024年迎来复苏。(记者 闫鹏 李唐宁)


相关阅读
template 'mobile_v5/common/wake'