欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:
OpenAI于2.16号发布了首款文生视频(Text-to-Video)模型——Sora,“通用物理世界模拟器”。
一睹为快,这是Sora生成的,是不是又有人要???
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子,手拿黑色手袋,在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜,涂着红色口红。街道潮湿而有反光效果,色彩缤纷的灯光仿佛在地面上创造了镜面效果。许多行人在街上来往。关注公众号,回复1007,获取提示词辅助工具体验链接
基础原理
Sora是一种Diffusion模型,通过模拟 Langevin 动力学和随机微分方程,实现了对数据的逐步扩散,从而生成高质量的样本。
它从看起来像静态噪声的视频开始生成视频,然后通过多个步骤消除噪声来逐渐对其进行转换。
通用物理世界模拟器?
Sora的发布,OpenAI验证了一种可行性。
即AI是否能从视频里的画面、像素点中学到那个世界的“物理规律”。
可以大胆想象,如果学的不是历史视频,而是真实世界呢,比如给AI装一双“眼睛”,让他满世界跑,会发生什么呢?
支持扩展视频
Sora 能够一次生成整个视频或扩展生成的视频以使其更长。
通过提供多个帧的预见,模型能够更好地理解视频中的主题,并在生成视频时保持主题的一致性,即使主题在某些帧中暂时离开了视野。
这种技术的应用范围可能包括视频编辑、电影制作、虚拟现实等领域,它可以帮助人们更轻松地生成和编辑视频,并提高视频的质量和连贯性。
本文链接:https://gptwangzhi.top/chatgpt/459.html
微软chatgpt4.0体验
网友评论