Мінцифри розпочало створення української великої мовної моделі (LLM), яка навчатиметься на унікальному наборі даних, щоб краще адаптуватися до українського контексту, повідомила пресслужба відомства.
Деталі
- Мінцифри 17 червня уклало меморандум із «Київстар», який стане стратегічним партнером та інвестором розробки національної LLM. «Київстар» буде займатися розробкою, будувати експертизу і навчати цю модель», – сказав міністр цифрової трансформації Михайло Федоров під час презентації проєкту. За його словами, після створення LLM вона буде доступна за опенсорс-моделлю.
- Першу версію моделі планують презентувати до кінця 2025 року, зробивши її доступною для державних установ, університетів, науковців, громадських організацій і бізнесу. Для розробки знадобиться команда з 10-15 технічних спеціалістів та 30-40 лінгвістів, сказав директор з розробки цифрових продуктів «Київстар» Михайло Нестор під час презентації проєкту.
- «Реалізація подібного проєкту в Казахстані коштувала Veon $1,5-$2 млн. В Україні ми орієнтуємося на таку ж суму», – додав Нестор.
- Робота над створенням національної мовної моделі триватиме дев’ять місяців, повідомив заступник міністра цифрової трансформації Олександр Борняков. «Далі буде період бета-тестування який триватиме до року. Під час тестів модель буде безкоштовною для державних установ, вишів та інших організацій», – додав заступник голови Мінцифри.
- В період бета-тестування національну LLM можуть підключити до ШІ асистента на порталі Дія, заявив Борняков.
- За словами Федорова, національна LLM стане основою для нових продуктів на базі штучного інтелекту, сприятиме розвитку стартапів, залученню інвестицій та економічному зростанню України. Він додав, що національна мовна модель краще враховуватиме українську мову, історію та контекст порівняно з іноземними аналогами. «Вона буде доступнішою, дешевшою та безпечнішою, адже дані зберігатимуться в Україні», – додав Федоров.
Контекст
Великі мовні моделі (LLM) – це системи штучного інтелекту, які використовують нейронні мережі для обробки, аналізу та генерації тексту. Вони тренуються на величезних масивах даних, що дозволяє їм розуміти мову, контекст і стиль, а також створювати логічні тексти. Засновані на архітектурі трансформерів, LLM передбачають послідовності слів, генеруючи відповіді, код чи статті. Їх застосовують у чат-ботах, перекладах, аналізі текстів і програмуванні. Приклади: GPT-4 (OpenAI), Gemini (Google), Llama (Meta).
У березні 2025 року міністр цифрової трансформації Михайло Федоров анонсував запуск першої україномовної LLM до кінця 2025 року. Це відкриє можливості для створення тисяч українських ШІ-продуктів, як-от віртуальні помічники (аналог ChatGPT), генератори тексту (Notion AI) чи інструменти програмування (GitHub Copilot).
Власна модель посилить безпеку, адже іноземні LLM можуть не враховувати український контекст і бути вразливими до пропаганди. Локальна обробка даних стане ключовою для ШІ в обороні, уряді, медицині та фінансах. Детальніше про це читайте у матеріалі Forbes Україна.