电脑行业点评:Sora惊艳发布,Vincent Video突破

admin 2024-02-19 67人围观 ,发现0个评论 电脑openai

计算机行业回顾、Sora模型、文本生成视频、跨越式突破

OpenAI新发布的Sora模型引起了计算机行业的轰动。 其文字生成的视频效果令人惊叹,代表着一次跨越式的技术突破。

电脑行业评论:Sora发布惊艳,Vincent Video实现飞跃。 OpenAI发布Sora模型,1分钟Vincent视频效果惊人。 2月15日,OpenAI发布了Vincent视频模型Sora,展示了诸多亮点:1)视频生成长度可达1分钟,远超其他Vincent视频模型。 2)3D空间的一致性,Sora可以生成具有动态镜头移动的视频。 当摄像机移动和旋转时,角色和场景元素在三维空间中保持连贯的运动。 3)长期连续性和对象持久性。 可以在单个视频中生成同一物体的多个镜头,即使主体暂时离开视野也可以保持不变。 4) 能够向前和向后扩展视频,以及连接两个视频。 5)模拟数字世界,Sora可以模拟人类操作,例如控制Minecraft游戏中的玩家。 我们相信,与之前的其他文胜视频模型相比,Sora已经跃升为实用的生产力工具。 1分钟的长度有望在短视频领域得到广泛应用。 扩展视频的能力也有望产生长视频,这可能会带来新一轮的内容创作产业。 革命。 AIGC有着广阔的应用空间,算力需求可能会增加几个数量级。 Sora是一个扩散模型,类似于GPT模型。 Sora 使用变压器架构将视频和图像表示为称为补丁的较小数据单元的集合,类似于 GPT 中的令牌。 Sora 基于 OpenAI 的 DallE 和 GPT 模型构建。

目前,Sora 尚未向公众开放使用。 随着AIGC技术逐渐渗透到影视剧、宣传片、自媒体、游戏等领域,视频创作效率或将显着提升。 同时,视频的交互数据水平相对于文本和图像将会有很大的提升,或者说是与计算相对应。 电力需求快速扩大。 Google 发布了 Gemini1.5Pro,上下文长度为 100 万个 token。 2月15日,谷歌推出Gemini 1.5 Pro,支持多达100万个代币,远远超过目前其他基础型号。 它可以一次性处理大量信息,例如1小时的视频、11小时的音频、超过30,000行代码或超过700,000个单词。 Gemini1.5Pro是一款中型多模态模型,在相同基准测试下其性能与Google之前最大的Gemini-1.0Ultra相近。 即使上下文窗口增大,Gemini1.5Pro也能保持高水平的性能。 我们认为,Google Gemini 1.5的推出进一步促进了大模型技术的良性竞争,行业发展态势欣欣向荣。 投资建议:算力方面:中科曙光、浪潮信息、海光信息、力通电子、信易盛、高科发展、中际旭创、工业富联、寒武纪、神州数码、恒威科技、软通动力、润建股份。 、万马科技、云赛智联、拓维信息、烽火通信等。 地图应用:万兴科技、紫天科技、虹软科技、大华科技、海康威视。 风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。 #信雅达(sh600571)#

请发表您的评论
请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP