Китайська компанія Alibaba презентувала моделі штучного інтелекту Qwen3, які, за її твердженням, можуть конкурувати з останніми розробками Google та OpenAI. Про це йдеться у повідомленні компанії від 29 квітня.
Деталі
- Моделі з параметрами від 0,6 до 235 млрд доступні на Hugging Face і GitHub.
- Зазначається, що Qwen3 поєднують швидкість для простих завдань і здатність до складного аналізу, зокрема перевірки фактів, використовуючи архітектуру Mixture of Experts для підвищення ефективності.
- Вони підтримують 119 мов і тренувалися на даних із підручників, коду та контенту від попередніх моделей.
- Тестування показало значні покращення: Qwen3 перевершує OpenAI o1 у деяких тестах, хоча поступається новітнім o3 та o4-mini, повідомили в компанії. Alibaba наголошує на точності виконання інструкцій Qwen3.
- Експерти зазначають, що ці моделі з відкритим кодом можуть стати ключовим інструментом для Китаю в умовах обмежень на імпорт чипів для ШІ.
Контекст
У квітні 2023 року Alibaba Group Holding Ltd представила генеративну ШІ-модель Tongyi Qianwen. Під час презентації модель демонструвала складання запрошень, планування маршрутів подорожей і надання порад щодо макіяжу.
За словами генерального директора Даніеля Чжана, технологія «радикально змінить виробництво, роботу та спосіб життя». Він наголосив, що такі ШІ-моделі, як Tongyi Qianwen, сприятимуть популяризації штучного інтелекту в майбутньому.