В Україні почали розробляти національну велику мовну модель: у чому рішення

Україна розпочинає розробку власної великої мовної моделі (LLM), що стане основою для створення тисяч штучно-інтелектуальних продуктів та зміцнить цифровий суверенітет країни.

Про це повідомив міністр цифрової трансформації Михайло Федоров, пише Рубрика.

У чому проблема?

Великі мовні моделі — це основа сучасних ШІ-технологій. Вони використовуються в чат-ботах, генераторах тексту, код-асистентах, а також у фінансах, медицині та обороні. Наразі українські компанії змушені використовувати іноземні LLM, що має низку ризиків:

  • Вплив пропаганди — наративи, сформовані іноземними моделями, можуть містити російську дезінформацію.
  • Захист даних — обробка інформації в Україні гарантує безпеку для державних і бізнесових структур.
  • Доступність — власна модель дозволить створювати локальні ШІ-продукти дешевше, швидше та ефективніше.

Яке рішення?

Дедалі більше країн активно й стратегічно розвивають ШІ в країні, створюють національні LLM, натреновані на локальних мовах. Тому Україна повинна діяти швидко, щоб не лише наздогнати світових лідерів, а й стати самостійним гравцем у цих технологічних перегонах“, наголосив Федоров.

Як це працює?

Як зауважив очільник міністерства, вже розпочали розробку першої українськомовної LLM національного масштабу. Про це він оголосив на Forbes AI Day 2025.

Українські розробники планують створити LLM до листопада-грудня 2025 року. Модель тренуватимуть на українських даних, вона розумітиме національний контекст, діалекти та терміни.

Фото: Фейсбук / Михайло Федор

Михайло Федоров зазначив, що на базі цієї LLM Мінцифри запускатиме ШІ-продукти для урядових організацій, оборони, медицини та фінансового сектору. Розробки інтегруватимуть у “Дію”, “Мрію” та військо.

Фото: Фейсбук / Михайло Федоров

Також зможуть застосовувати продукти на основі національної LLM підприємці, зокрема:

  • чатботи для служби підтримки;
  • ШІ-агенти для надання послуг;
  • ШІ-асистенти для оцінки резюме;
  • програми для моніторингу та аналізу різноманітних показників тощо.
Фото: Фейсбук / Михайло Федоров

Федоров відзначив, що мовну модель створюватимуть не за державні кошти, а за підтримки партнерів із бізнес-сектору.

Контекст

LLM-моделі (Large Language Models, або великі мовні моделі) – це системи штучного інтелекту, які базуються на нейронних мережах і призначені для обробки, аналізу, розуміння та генерації текстової інформації. Вони тренуються на величезних обсягах текстових даних, що дозволяє їм «розуміти» мову, контекст, стиль і навіть тон висловлювань, а також створювати зв’язні й логічні тексти у відповідь на запити.

Такі моделі використовують архітектуру трансформерів (Transformer), яка дозволяє їм обробляти великі обсяги тексту одночасно й враховувати зв’язки між словами в реченні чи навіть у цілих абзацах. Під час тренування модель «навчається» передбачати наступне слово в послідовності, що дає їй здатність генерувати текст, відповідати на запитання чи виконувати інші завдання.

Моделі аналізують стиль, тон і логіку тексту, генеруючи відповіді, код чи статті. Їх використовують у чат-ботах, перекладах, аналізі тексту та генерації коду. Серед прикладів: GPT-4 (OpenAI) для діалогів, Gemini (Google) для складних завдань і Llama (Meta) для оптимізації ресурсів.

За матеріалами rubryka.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Вверх