Google представив генератор коротких відео Veo 2 для користувачів Gemini

Google представив генератор коротких відео Veo 2 для користувачів Gemini

Google представив генератор коротких відео Veo 2 для користувачів Gemini

Користувачі ШІ-бота Gemini від Google відтепер можуть створювати та ділитися відео, використовуючи відеомодель Veo 2, йдеться у блозі компанії. У Gemini тепер можна перетворювати текстові підказки в динамічні 8-секундні відеоролики.

Ключові факти

  • Нова функція ШІ створює 8-секундне відео з роздільною здатністю 720p, яке передається як файл MP4 в альбомному форматі 16:9. 
  • В даний час Gemini підтримує лише генерацію тексту у відео, але компанія працює над розширенням функціоналу у майбутніх оновленнях.
  • Всі відео, створені за допомогою Veo 2, позначені SynthID — цифровим водяним знаком, вбудованим у кожен кадр, який вказує на те, що відео створено за допомогою ШІ.
  • Генерувати відео можуть користувачі Gemini Advanced у віці від 18 років всіма мовами та в усіх країнах, де доступні програми Gemini.
  • «Veo 2 є значним кроком уперед у створенні відео за допомогою ШІ, розроблений для створення високоякісних, деталізованих відео з кінематографічним реалізмом», – повідомляє Google.
  • Завдяки кращому розумінню фізики реального світу та руху людини, генератор забезпечує плавний рух персонажів, реалістичні сцени та більш тонкі візуальні деталі у різних предметах та стилях.
  • Для того, щоб згенерувати відео, слід вибрати «Veo 2» з меню моделей в лівому верхньому куті Gemini Advanced. 
  • Створювати та ділитися відео можна і в мобільному додатку Gemini. Veo 2 також доступний у Google Labs через інстумент Whisk, який дозволяє створювати нові зображення, використовуючи як текстові, так і графічні підказки, а тепер анімувати їх у відео.

Контекст

Gemini – це відповідь Google компаніям Microsoft Corp. та OpenAI, які, на думку деяких експертів, швидше скористалися перевагами нинішнього буму штучного інтелекту, зокрема серед хмарних клієнтів та розробників. Тепер Google прагне заманити цих користувачів у свою екосистему за допомогою більш потужних інструментів. 

Google презентував Gemini у грудні 2023-го, модель обійшла GPT-4 у більшості тестів, демонструючи потужність в аналізі наукових текстів, відео та юридичних документів. Але свято тривало недовго – одразу почалися спроби масштабувати функціональність: довга пам’ять, генерація подкастів, обробка PDF. Команда почала інтегрувати Gemini у всі продукти компанії. ChatGPT і далі випереджав Gemini за кількістю завантажень: 600 млн проти 140 млн, за даними Sensor Tower.

Детальніше про те, як створювався конкурент чату GPT – читайте тут.

Коментарі

Поки що немає коментарів. Чому б вам не розпочати обговорення?

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *