Google представив функцію перетворення зображень на короткі відеокліпи за допомогою ШІ

Google представив функцію перетворення зображень на короткі відеокліпи за допомогою ШІ

Google представив функцію перетворення зображень на короткі відеокліпи за допомогою ШІ

Google, що належить Alphabet Inc., додає функцію для платних користувачів Gemini AI, яка дозволяє створювати короткі відеокліпи з фотографій. Про це пише Bloomberg 10 липня. 

Деталі 

  • З четверга підписники планів Google AI Ultra та Pro в окремих регіонах зможуть використовувати функцію через вебверсію Gemini, а протягом тижня – у мобільному додатку. Користувачі можуть створювати 8-секундні відео зі звуком у форматі MP4 (720p, 16:9) на основі фото та текстового опису.
  • Функція, інтегрована в чат-інтерфейс Gemini, допомагає Google конкурувати з OpenAI, Runway AI та китайськими компаніями, як-от Alibaba та Kuaishou. 
  • Вона працює на базі моделі Veo 3, представленої в травні. Google забороняє створювати відео з публічно відомими особами чи контент, що заохочує насильство.
  • Під час тестування Bloomberg News виявив, що інструмент може змінювати риси обличчя чи расу суб’єктів. Прості завдання, як анімація рослин чи тварин, виконуються краще, ніж складні, наприклад, створення відео з брейкдансом.
  • Google пояснює, що це нова технологія, яка краще анімує об’єкти чи природу, і планує її вдосконалювати.

Контекст 

Google вперше представив модель генерації відео Veo у травні 2024 року на конференції Google I/O. Вона створювала відео у форматі 1080p тривалістю понад хвилину за текстовими запитами, забезпечуючи складні сцени, реалістичні рухи та кінематографічні ефекти.

У грудні 2024 року вийшла оновлена версія Veo 2, яка підтримувала роздільну здатність 4K і краще відтворювала фізичні рухи об’єктів, їхню поведінку та освітлення. У квітні 2025 року Veo 2 стала доступною для обмеженої аудиторії через додаток Gemini.

У травні Google анонсував Veo 3 – найсучаснішу модель, яка не лише генерує відео у 4K, а й синхронізує їх із музикою, голосом або звуковими ефектами. Veo 3 інтегрована в плани Gemini (Pro/Ultra) та Google Cloud Vertex AI. Для захисту від зловживань Google використовує технологію SynthID для прихованих цифрових водяних знаків, а також видимі мітки.

У червні CNBC повідомило, що Google використовував відео з YouTube для тренування моделей Veo та Gemini без явної згоди авторів і без можливості відмови. Хоча Google заявляє про відповідність умовам YouTube, критики вказують на проблеми з авторськими правами та прозорістю.

Коментарі

Поки що немає коментарів. Чому б вам не розпочати обговорення?

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *