太炸裂,OpenAI发布文生视频模型Sora,AGC的又一重要里程碑

chatGPT网址2024-02-18124

chatgpt 欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:

OpenAI于2.16号发布了首款文生视频(Text-to-Video)模型——Sora,“通用物理世界模拟器”。


一睹为快,这是Sora生成的,是不是又有人要???

提示词
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
翻译为中文是
一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子,手拿黑色手袋,在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜,涂着红色口红。街道潮湿而有反光效果,色彩缤纷的灯光仿佛在地面上创造了镜面效果。许多行人在街上来往。

关注公众号,回复1007,获取提示词辅助工具体验链接


基础原理

Sora是一种Diffusion模型,通过模拟 Langevin 动力学和随机微分方程,实现了对数据的逐步扩散,从而生成高质量的样本。


它从看起来像静态噪声的视频开始生成视频,然后通过多个步骤消除噪声来逐渐对其进行转换。


通用物理世界模拟器?

Sora的发布,OpenAI验证了一种可行性。


即AI是否能从视频里的画面、像素点中学到那个世界的“物理规律”。


可以大胆想象,如果学的不是历史视频,而是真实世界呢,比如给AI装一双“眼睛”,让他满世界跑,会发生什么呢?



支持扩展视频

Sora 能够一次生成整个视频或扩展生成的视频以使其更长。


通过提供多个帧的预见,模型能够更好地理解视频中的主题,并在生成视频时保持主题的一致性,即使主题在某些帧中暂时离开了视野。


这种技术的应用范围可能包括视频编辑、电影制作、虚拟现实等领域,它可以帮助人们更轻松地生成和编辑视频,并提高视频的质量和连贯性。


本文链接:https://gptwangzhi.top/chatgpt/459.html

微软chatgpt4.0体验

相关文章

网友评论