Sora太炸裂了!生成视频以假乱真人类如何辨真假?_KY体育/ky体育下载地址/ky体育官方入口

ky体育下载地址

ky体育官方入口
首页 > 新闻中心

Sora太炸裂了!生成视频以假乱真人类如何辨真假?

来源:KY体育    发布时间:2024-03-12 12:28:29

如果您正在寻找相关产品或有其他任何问题,可随时拨打我公司销售热线,或点击下方按钮在线咨询报价!

全国统一销售热线:0371-6463 0777

详情内容

  Sora从技术上迎来了全面革新,比如说,它能实现长达1分钟的视频内容创作,也能根据自身的需求制作长镜头内容,还能根据不一样的角色的情感给出不同的镜头语言。

  马斯克也在个人社交平台当中锐评道:“gg humans(人类愿赌服输)”。

  不过,Sora仍在测试阶段,距离其真正投入到正常的使用中还有一段时间。鉴于AIGC行业存在“Demo过度”的情况(比如Google Gemini发布会的演示就被揭露造假了),因此Sora发布版到底表现如何还有待体验。

  Sora的最大突破在于可以依据文本描述生成一段长达60秒的视频内容,此前,世界记录的保持者为Runway的Gen-2,最高能创作时长为16秒的视频。

  在OpenAI公开的技术性报告中,Sora的实际身份被揭晓:底层是一个扩散Transformer模型,相较于传统的基于二维模型的文生视频产品而言,Sora具有对现实世界物理规律的感知,对于如何生成一段「逼真」的视频,有深刻的自主意识。

  此外,Sora还能产生多个角色、特定类型运动和主体背景丰富细节等多种复杂场景的视频,即便用户没有描述这些特定场景的细节,Sora依然能够理解并准确生成。比如说,当你需要一个描述为「晚宴」的视频内容时,Sora并不会止步于饕客们将美食一扫而光的过程与结果,而是会将每一个动作所留下来的痕迹得以保留:咬了一口的汉堡,就会有咬过的痕迹。

  事实上,Sora的成功离不开OpenAI公司前两款产品的经验积累,那就是2021年初、2022年末分别推出的图像生成工具DALL.E与自然语言大模型工具ChatGPT,通过它们,Sora获得了对文字描述的理解与图像数据处理的能力。

  更重要的是,OpenAI为Sora引入了视觉块嵌入式代码,即pathces,你也可以将其理解为LLM里的tokens,这些pathces就像是一个又一个包含了时间、空间信息的积木块,Sora能够更快速地从中找到所需的素材,为创作者生成视频。此外,这些pathces也能帮助Sora完成高速的自主学习。

  Sora还能接受图片和视频输入,生成新的创意视频,又或是根据描述生成多达五个分镜头,包含人物表情特写、动作特写、场景等。

  很可惜,现阶段的Sora也存在一些问题,例如空间、方位的细节。在官方演示视频里,展示了反向跑步的运动者、凭空出现的狼崽以及从杯底流出果汁的水杯等。

  尽管仍有美中不足的地方,但Sora绝对可以称为AI视频的一大革命性突破——是真的革命性,而不是夸大其词那种。

  Sora通过对现实空间的精确识别,创作出带有动态视角变化的视频内容,视频中,人物、背景都在立体三维空间内移动,就像真实的影片创作一样。

  作为一个文本视频生成工具,Sora似乎有些过于「聪明」了,它的到来,也不禁让人对AI在未来的发展产生更多思考。

  全球化AI企业APUS董事长兼CEO李涛先生认为,Sora的横空出世,带来了三个问题:

  正如我们前面提到,Sora拥有现实世界的「意识」,这在某种程度上预示着它构建的内容基本都会遵循真实存在的物理规律,而这种「虚拟」在未来只会更加「逼真」,这也让我们不禁思考:

  士隐接了看时,原来是块鲜明美玉,上面字迹分明,镌着“通灵宝玉”四字,后面还有几行小字。正欲细看时,那僧便说“已到幻境”,便强从手中夺了去,与道人竟过一大石牌坊,上书四个大字,乃是“太虚幻境”。两边又有一幅对联,道是:

  Sora的出现,让真实世界与虚拟世界的边界一下变得模糊,在如梦如幻的“太虚幻境”,真假难辨,将给人类带来许多困惑。对此,人类必须要想法来应对。

  Sora与之前问世的文本视频生成工具不太一样,它具备高度模拟能力与学习能力,而作为一个有自主学习能力的「模拟器」,参考ChatGPT从3.5到4.0的进化速度,是不是能够大胆预测,

  每一个深度学习的人工智能模型,不能离开背后强大算力的支持,Sora亦是如此。如今,中国人工智能所拥有的能力远远落后于此,算力的局限无疑是制约我国AI发展的主要的因素之一。

  Sora仍在测试阶段,我们仍有时间在短期时间内尝试驾驭它、了解它,同时继续在芯片端巩固地位,为AI提供更强大的底层硬件支持。

  在Sora问世之后,马斯克急得像热锅上的蚂蚁,只因Sora是当下最接近AGI概念的产品,而AGI又是马斯克心心念念的蓝海市场。

  尽管Sora当前只展示了其在视频,又或是内容创作上的能力,但其对于真实世界的理解,已经展现出强悍的实力。

  为什么三六零周鸿祎说Sora让AGI时代到来的时间从十年缩短至一年?归根结底就是对现实世界的理解能力。AGI最大的特点在于对真实世界的规则,尤其是物理状态、自然规律、化学变化等等因素的反馈。Sora虽然只在内容创作上带来帮助,但谁能确保经过足够的训练,OpenAI不会基于此推出真正意义上的AGI产品呢?

  周鸿祎在见证Sora诞生后表示,Sora有别于其他文本视频生成工具,它能理解坦克是有巨大冲击力的,坦克能够冲毁汽车,而不可能会出现汽车撞毁坦克这样的事情发生。

  这并非空穴来风,早在去年10月,路透社就曾报道OpenAI已经参与投资至少三家半导体设计企业,其中Cerebras更是一家初创型企业。OpenAI CEO Altman曾公开表示,其工作与产品仍需更多算力提供帮助,目前公司所使用的还远远不足。除去已经投入运营的DALL.E和ChatGPT,以及测试中的Sora,或许还有真正属于AGI时代的产品蓄势待发。

  2016年,Google旗下的AlphaGo战胜李世石让深度学习被全世界关注,我们进入了深度学习驱动的AI时代,许多科学技术产品和传统行业均被深度学习技术改变,这一阶段也迎来了抖音、小红书这样的AI驱动的世界级产品的崛起。

  2023年兔年开工,全世界沉浸在 ChatGPT 带来的 AGI(通用型人工智能)的震撼之中,一年之后的今天,Sora再度震撼人类,且是更大的震撼,见过大世面的人类就像原始人发现火种一般激动不已。

  毫无疑问,一个崭新的AGI时代的序幕已经缓缓拉开,一个新的智能时代已然到来。

在线留言

如果我们有什么可以帮助到您的,您可以随时拨打我们的24小时客服电话:0371-64630777。

您也可以通过点击 在线咨询 在线与我们沟通。另外您还可以在下面给我们留言,我们将用心为您服务!

  • *您需要的产品:
  • 您的姓名:
  • *联系方式:
  • *需求信息内容:
联系我们

地址:中国 - 郑州 - 荥阳市王村镇木楼村工业区

服务热线:0371-6463 0777

现在联系获取最优惠报价


在线咨询
索要报价
销售热线

销售热线:0371-64630777

ky体育官方入口