欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:
一、Sora 是什么?
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
Sora 是 OpenAI 发布的 AI 视频生成模型。它能够根据文本提示生成逼真视频,最长可生成 20 秒视频,面向 ChatGPT 付费用户开放。
Sora 是视觉数据的通用模型,能够严格根据用户输入的文本描述,准确理解所描述事物在现实世界中的存在方式,生成不同时长、长宽比和分辨率的高清视频和图像,视频时长最多可达一分钟。其生成视频可包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,特定类型的动作,视觉风格前后保持一致。
Sora Turbo 版本支持最长 20 秒视频生成,并提供多种视频变体。自今年 2 月首次预告 Sora 以来,OpenAI 已经与多家电影制片厂、媒体高管以及经纪公司展开合作对话,并允许艺术家、知名演员和导演试用该服务。
OpenAI 声称,Sora 是一项理解和模拟现实的基础性 AI 技术,对于开发能够与物理世界互动的模型具有重要意义。然而,Sora 在早期测试中也暴露出一些局限性,如 “多余肢体” 的问题和对物理现象理解的不准确。
OpenAI 首席执行官奥尔特曼表示,初期 Sora 的使用将受到一定限制,ChatGPT Plus 订阅用户每月可生成 50 个低分辨率视频,而 ChatGPT Pro 订阅用户则可以无限制地 “较慢” 生成高分辨率视频,以及 500 个快速生成的视频。
Sora 的功能十分强大,它可以制作不同分辨率的竖版、方形和水平视频,而且计算量越高,视频质量也会越高。Sora 与 OpenArt 的 AI 工具 DALL - E 类似,用户输入期望的场景,Sora 将回馈高清视频剪辑结果。
Sora 页面还介绍了一些其他功能,如名为 Remix 的重新混合功能可以替换、删除或重新构想视频中的元素;Storyboard 选项让用户可以详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成;此外,用户还可以浏览其他人创作的视频集锦。
定价方面,Sora 目前纳入 OpenAI 的两个产品套餐,其中,ChatGPT Plus 每月收费 20 美元,为订阅用户生成的视频分辨率高达 720p,时长最长 5 秒,ChatGPT Pro 每月收费 200 美元,订阅用户可以无限量生成高分辨率的视频,分辨率高达 1080p、最长时长 20 秒,并且可以五个视频同时生成,视频可以无水印下载。
二、Sora 的特点
1. 强大的视频生成能力
Sora 具有强大的视频生成能力,能够生成 1080p、最长 20 秒的视频,支持多种常见比例。它的生成能力不仅体现在分辨率和时长上,还在于其可以对生成的视频进行 Remix、Re-cut、混合等操作,为用户提供了丰富的后期制作选择。
与其他视频生成工具相比,Sora 具有明显的优势。例如,在视频时长方面,此前的一些平台如 Runway Gen2、Pika 等,视频生成默认只有几秒钟,即使通过视频扩展等手段,最多也只能生成十几秒的视频,而 Sora 可以生成最多一分钟的视频,并且视频生成的结果非常连贯和清晰。在视频尺寸方面,Sora 模型可以采样宽屏 1920x1080 视频、竖屏 1080x1920 视频以及介于两者之间的所有尺寸视频,这意味着它可以生成更加自由的视频尺寸。而像 Runway Gen2 这样的平台,文本生成视频的方式只能选择固定的几种长宽比,且清晰度默认也较低。
此外,Sora 还可以通过在适当大小的网格中排列随机初始化的补丁来控制生成视频的大小,这种基于补丁的表示使 Sora 能够在不同分辨率、持续时间和宽高比的视频和图像上进行训练。同时,Sora 是一个扩散模型,给定噪声输入补丁(和条件信息,如文本提示),它被训练来预测原始的 “干净” 补丁。并且,Sora 是一个扩散变换器,在多个领域展示了显著的扩展性能,随着训练计算的增加,样本质量显著提高。
2. 支持探索社区功能
Sora 支持探索社区功能,用户生成的视频可以分享至社区,也可以在社区看到、搜索或再创作其他用户分享的视频。这一功能极大地增强了用户之间的互动性和创造性。
与其他具有社区功能的应用不同,Sora 的社区专注于视频创作和分享,为用户提供了一个展示自己创意和才华的平台。用户可以在社区中获取灵感,学习其他用户的创作技巧,同时也可以通过再创作其他用户的视频,进一步提升自己的创作能力。
3. 世界模型雏形
Sora 已有世界模型的雏形,它不仅能理解用户提示词的要求内容,还能了解这些内容在物理世界中的存在方式。
Sora 通过大量观察训练,学会了许多关于真实世界的物理规律。例如,在生成视频时,它能够准确地把握物体的运动规律、光影效果等物理特性,使得生成的视频更加逼真。与传统的动画影视公司相比,Sora 只需要一行描述、几次提示便能自动完成复杂的视频制作任务,大大提高了制作效率。
然而,Sora 目前也存在一些局限性。例如,它在某些情况下会出现对物理现象理解不准确的问题,如玻璃破碎的方式不符合现实规律,蚂蚁只有四条腿等。但随着技术的不断进步和更多高质量数据的引入,Sora 有望不断完善其对物理世界的理解和模拟能力。
Remix(重混)
比如生成的演示:在“沙漠中行走的长毛猛犸象,广角镜头视角”场景下,选择 Remix 功能,输入“将长毛猛犸象替换为机器人”的指令。
Sora 会自动完成渲染过程。还可以调整生成强度,选择“强力 Remix”进行大幅改动(如替换角色),或选择“轻微 Remix”进行小调整(如添加风或沙尘)。
Storyboard(故事板)
三、Sora 的发布时间
2024 年 2 月,OpenAI 发布首个文生视频模型 Sora。此后,Sora 开始长达 10 个月的封闭测试,仅向视觉艺术家、设计师和电影制作人等特定外部人员开放。
2024 年 12 月,OpenAI 发布 Sora Turbo 版本。Sora Turbo 在生成速度和画质上都进行了显著提升,吸引了广泛的关注和讨论。在直播演示中,Sora Turbo 同时生成四条 10 秒时长的视频,总耗时仅 72 秒。新版本 Sora Turbo 允许用户通过简洁的文字描述、图片或已有视频生成相应的新视频。OpenAI 针对不同会员类型提供了多种使用额度,OpenAI Plus 会员每月 50 次生成机会,Pro 会员则可享受更高的生成频率和更高的分辨率。Sora Turbo 设有分镜(Storyboard)功能,让用户能够清晰地设置视频中的场景和画面顺序。通过简洁的输入,用户可以自定义视频的风格、时长和分辨率。Sora Turbo 支持的最高分辨率为 1080p,最大视频时长可达 20 秒。用户在描述输入时,输入的字数和具体程度将直接影响生成视频的细节丰富程度,给创作带来了更多的可能性。开发团队设计了便捷的优化工具,其中包括 remix 和 recut 功能。用户不仅可以替换视频中的物体,还能根据需求剪辑保留的片段,从而制作出新的创意视频。这种简化而灵活的编辑过程极大地提升了用户创作的自由度,鼓励更多人探索视频制作的乐趣。通过简单的输入操作,Sora Turbo 能够实现复杂场景之间的平滑过渡,使得创作过程更加流畅。
四、Sora 对行业的影响
1. 可能遭受 “重创” 的行业
1. 媒体和娱乐业:直播、短视频等行业竞争压力增大。
OpenAI 的 Sora 模型具有强大的视频生成能力,能够快速生成高质量的视频内容。这对于媒体和娱乐业中的直播、短视频等行业来说,无疑带来了巨大的竞争压力。Sora 可以根据用户的需求生成各种风格的视频,无论是时尚、搞笑、美食还是其他主题,都能轻松应对。相比之下,传统的直播和短视频制作需要大量的人力、物力和时间,而且质量也难以保证。因此,直播和短视频行业需要不断创新,提高自身的竞争力,才能在 Sora 的冲击下生存下来。
2. 安防行业:异常行为识别和预警能力提升,改变传统安防。
Sora 的出现为安防行业带来了新的机遇和挑战。Sora 可以通过对视频数据的分析,快速识别出异常行为,并及时发出预警。这对于安防行业来说,无疑是一个巨大的进步。传统的安防系统主要依靠人工监控和报警,效率低下,而且容易出现误报和漏报的情况。而 Sora 可以通过深度学习和人工智能技术,自动识别出异常行为,提高安防系统的准确性和效率。然而,Sora 的出现也给安防行业带来了一些挑战。例如,Sora 的算法和模型需要不断优化和更新,以适应不同的场景和需求。此外,Sora 的安全性和隐私保护也需要得到保障,以防止数据泄露和滥用。
3. 零售业:影响商品配置和营销策略。
Sora 的视频生成能力可以为零售业带来新的营销方式和商品展示方式。通过 Sora 生成的视频,可以更加生动地展示商品的特点和优势,吸引消费者的注意力。此外,Sora 还可以根据消费者的需求和偏好,生成个性化的商品推荐视频,提高消费者的购买意愿。然而,Sora 的出现也给零售业带来了一些挑战。例如,Sora 的视频生成需要大量的数据和计算资源,成本较高。此外,Sora 的视频生成也需要一定的技术和专业知识,对于一些小型零售商来说,可能难以掌握和应用。
4. 工业生产:提高生产效率,冲击传统生产线工人工作。
Sora 在工业生产中的应用可以提高生产效率,降低成本。例如,Sora 可以通过对生产过程的监控和分析,及时发现问题并进行调整,提高生产质量和效率。此外,Sora 还可以通过对生产数据的分析,优化生产流程,提高资源利用率。然而,Sora 的出现也给传统生产线工人带来了一定的冲击。随着 Sora 的应用,一些重复性、危险性高的工作可能会被机器人和自动化设备所取代,这将导致一部分工人失业。因此,工业生产企业需要加强对工人的培训和转岗安置,以适应 Sora 带来的变化。
5. 人力资源行业:影响工作方式。
Sora 的出现对人力资源行业也产生了一定的影响。Sora 可以通过对简历和面试视频的分析,快速筛选出符合要求的候选人,提高招聘效率。此外,Sora 还可以通过对员工绩效和行为的分析,为企业提供更加科学的人力资源管理建议。然而,Sora 的出现也给人力资源行业带来了一些挑战。例如,Sora 的算法和模型需要不断优化和更新,以适应不同的行业和企业需求。此外,Sora 的安全性和隐私保护也需要得到保障,以防止数据泄露和滥用。
2. 两大隐患
1. 内容版权疑问。
随着 Sora 的广泛应用,内容版权问题也逐渐浮出水面。Sora 生成的视频可能会涉及到版权问题,例如使用了未经授权的音乐、图片或视频素材等。此外,Sora 生成的视频也可能会被他人盗用或抄袭,这将给原作者带来一定的损失。因此,OpenAI 需要加强对 Sora 的版权管理,明确版权归属,保护原作者的合法权益。
2. 深度伪造可能影响选举。
OpenAI 报告指出,AI 模型被用于干扰选举,美国大选成 “重灾区”。随着 Sora 的出现,深度伪造的问题也更加突出。Sora 可以生成非常逼真的视频内容
最后,我们再来欣赏几个用Sora Turbo生成和编辑的视频片段,感受一下细节刻画和镜头语言:
故事板:日本冬季街头
故事板:六名工人,身穿暗色破旧衣服,携带工具和背包,缓慢地行走在一个荒凉、雾气弥漫的海滩上。
Remix重混:给水母加上滑稽的眼睛
网友评论