Компания OpenAI представила новую нейросеть под названием Sora, умеющую создавать целые видео по текстовому описанию.
Sora – это диффузная модель, которая способна "создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона". На сайте проекта сказано, что модель умеет понимать подсказки и знает, как ведут себя разные объекты в физическом мире.
Sora генерирует целое видео сразу, а не покадрово. Это помогает избежать того, что было проблемой при использовании других подходов – изменения объекта во время движения или перемещения камеры.
Sora пока на стадии разработки, и OpenAI пока не планирует сделать ее широкодоступной. В частности, из-за опасений относительно безопасности. Сейчас компания работает над идеями по сокращению возможностей создания разжигающего ненависть контента, а также четкой маркировки видео, сгенерированного ИИ.
Подписывайтесь на наш Тelegram-канал t.me/sudua и на Google Новости SUD.UA, а также на нашу страницу в Facebook и в Instagram, чтобы быть в курсе самых важных событий.