Уряд та найбільший мобільний оператор розробляють для українців національний штучний інтелект. Що отримають держава, бізнес та громадяни?
В Україні готуються запустити першу національну велику мовну модель (LLM). Ідеться не про ще один стартап чи академічний експеримент, а про національний проєкт, до якого уряд хоче долучити мільйони українських текстів – від книжок до правових документів.
У Мінцифрі одразу дали зрозуміти: самостійно держава не потягне, тому потрібен потужний партнер. Хтось із “технічними м’язами”, грошима й розумінням, як працює інфраструктура штучного інтелекту (ШІ).
У червні стало відомо, що головним партнером держави в створенні LLM стане “Київстар”. Один з найбільших телеком-операторів країни взявся за завдання, яке раніше в Україні не виконував ніхто. Компанія пообіцяла не лише зібрати команду й підготувати технічну базу, а й повністю профінансувати перший етап розробки.
Це викликало подив навіть у частини ШІ-спільноти. Чому саме “Київстар”? Чи вистачить йому експертизи і що він буде робити? Для чого це бізнесу?
Без відповідей залишилися й головні питання, які ставить собі будь-хто, хто живе в країні, де тривають велика війна та економічна турбулентність: чи на часі така розробка? Що отримає від неї звичайна людина – не айтівець, не держслужбовець, а користувач, платник податків, громадянин?
Що створюватимуть Мінцифра та “Київстар”
Перед міністерством та мобільним оператором стоїть складне завдання: з одного боку – реалізувати те, чого ще ніхто в Україні не робив: створити національну LLM, а з іншого – долучити державу до клубу країн, які вже мають власні ШІ-рішення.
Елітарність цього клубу визначається перш за все ресурсами, які потрібні для створення власної LLM. Ідеться не тільки про фінансову частину, а й про спеціалістів і технічну базу. Потрібні команди лінгвістів, дата-саєнтистів (аналітика даних), DevOps-інженерів (інфраструктурні розробники), експертів з етики ШІ та стратегів обробки даних. Без такої екосистеми модель ризикує залишитися сирою або непрактичною.
Частину людських ресурсів можуть забезпечити наукова спільнота та ІТ-сектор, а фінансову – “Київстар”. Найбільшим викликом залишатиметься створення та підтримка інфраструктури для розгортання вітчизняної LLM.
У квітні технічний директор новоствореного ШІ-центру при Мінцифрі Дмитро Овчаренко пояснював: для навчання моделі “з нуля” в Україні бракує обчислювальних потужностей. Тож у відомстві одразу зробили ставку на інший шлях: використання наявних open-source-моделей (доступних для вільного використання) і їх навчання на українських даних (fine-tuning). Це менш ресурсомісткий та швидший процес.
Для розуміння: навчання “з нуля” можна порівняти з процесом, коли дитину вчать читати, писати й мислити, а fine-tune – коли вона здобуває фахову освіту, наприклад, бухгалтерську чи юридичну.
Віцепрем’єр-міністр, міністр цифрової трансформації Михайло Федоров та президент “Київстару” Олександр Комаров підписали меморандум про розробку української LLM / Telegram FEDOROV
Такий підхід широко використовується в державних ініціативах і приватному секторі. Наприклад, українська IT-компанія MacPaw недавно запустила ШІ-асистента Eney, якого створила на базі LLaMA 3.2 Instruct, провівши додаткове навчання для власних потреб.
Яку відкриту модель оберуть для національної LLM? У світі є кілька десятків компаній, які розробляють LLM. Лише обмежена кількість моделей масштабна, високопродуктивна та конкурентоспроможна на глобальному рівні. При цьому більшість відомих моделей, як-от від OpenAI або Google, не є відкритими. Вони доступні лише через API – власний інтерфейс без розкриття архітектури чи ваг.
Тому вибір для навчання моделей, які є у відкритому доступі, невеликий. У світі не набереться й двох десятків компаній, що створюють і публікують власні LLM з відкритим кодом. Крім того, не всі вони дозволяють використовувати ці моделі в комерційних продуктах. Наприклад, Meta забороняє комерційне застосування без окремої ліцензії.
“Теоретично процес зрозумілий: є набір даних, інфраструктура і можна починати процес тонкого налаштування. На практиці ж це складе завдання, яке в Україні ще ніхто не реалізовував. Прогнозувати успіх дуже важко, бо немає аналогів і нема на кого орієнтуватися”, – пояснює CEO DevRain Олександр Краковецький.
“Наразі триває первинна фаза досліджень і розробки, за результатами якої буде визначено, яку саме open-source архітектуру оберуть для fine-tune. Рішення ухвалюватиметься на основі технічних та прикладних критеріїв”, – пояснює директор з розробки диджитал-продуктів “Київстару” і CPO у Kyivstar.Tech Михайло Нестор, який курує проєкт з боку оператора.
Одне можна сказати точно: рішення китайських ШІ-компаній, як-от DeepSeek AI, не будуть розглядатися. Принаймні так заявляли в Мінцифри.
Навіщо Україні власний ШІ
Тренд на створення суверенних ШІ-технологій стає дедалі помітнішим у різних країнах. Мова не лише про лідерів світової економіки, які й так інвестують мільярди в штучний інтелект, а й про держави зі схожим до України підходом, які прагнуть мати власну мовну модель, адаптовану до локальних потреб.
У результатах дослідження Українського католицького університету (УКУ) зазначається, що уряди бачать у національному ШІ потужний поштовх для розвитку освіти, електронного врядування, медицини, економіки і навіть посилення національної безпеки.
Наприклад, Болгарія та Греція працюють над власними LLM: BgGPT та Meltemi. Їх використовують в освітньому процесі, щоб генерувати завдання, відповідати на запитання й пояснювати складні поняття. Модель BgGPT вже показала результативність на рівні шкільних іспитів, іноді навіть вищу за ChatGPT та LLaMA.
У Швеції, де спостерігається дефіцит робочої сили через старіння населення, створюють GPT-SW3. Модель має автоматизувати роботу з текстами в держсекторі та компенсувати брак працівників.
Одним з найпопулярніших напрямів є інтеграція ШІ з державними сервісами. В Албанії працює віртуальний асистент, який автоматизує подання заявок на державні послуги. У планах – створення національної мовної моделі для перекладу юридичних документів у межах підготовки до вступу в ЄС.
За словами співрозмовника ЕП в Мінцифрі, держава хоче покращити надання послуг для громадян і пришвидшити роботу уряду. Це один з пріоритетів міністра Михайла Федорова.
Нестор пояснює, що однією з ключових особливостей вітчизняної LLM має бути глибоке розуміння української мови. Модель враховуватиме діалекти, семантичні нюанси та термінологічну точність. Це дозволить застосовувати її в галузях, де потрібна мовна чутливість, зокрема в юриспруденції, медицині чи державному управлінні.
Ще один важливий момент – цифровий розрив. ШІ стає рушієм економічних змін. Якщо Україна не матиме власної моделі, вона залежатиме від зовнішніх рішень, які часто погано працюють з українською мовою та місцевим контекстом. Національний ШІ відкриє доступ до інструменту, який справді розуміє Україну і допоможе бізнесу, освіті та державі не відставати в технологічних перегонах.
Як зробити ШІ українцем
Аби створити по-справжньому українську мовну модель, технічної інфраструктури недостатньо. Головне “паливо” для ШІ – це дані, а саме українські дані, яких досі ніхто в таких масштабах не збирав і не впорядковував для тренування мовної моделі.
Це завдання взяло на себе Мінцифри. Відомство координує процес створення моделі в технічному та етичному сенсах. Для цього формуються три ключові структури: координаційний комітет, технічна рада та етична рада.
Перший відповідатиме за загальну стратегію проєкту. До нього увійдуть представники Мінцифри, зокрема ШІ-центру, інші держустанови, команда “Київстару” та фахівці з обох рад.
Етична рада стежитиме за дотриманням законодавства, норм конфіденційності й етичних стандартів. Технічна – за архітектурою моделі, її навчанням, підготовкою даних і якістю кінцевого продукту.
У Мінцифрі повідомили ЕП, що для тренування використовуватимуть корпус українськомовних текстів з відкритих джерел. Розглядаються кілька датасетів, зокрема “Малюк” (113 Гб тексту), NER-UK, UA-GEC та інші. Остаточне рішення ще не ухвалене.
Паралельно команда міністерства шукає менш очевидні, але цінні джерела. Це унікальні українські тексти, які формально відкриті, але розпорошені по архівах бібліотек, держустанов, наукових фондів. Їх планують зібрати разом за участю університетів, національних бібліотек та інтелектуальних центрів.
“Наше завдання – зібрати ці дані. Завдяки їм модель буде справді українською, з живим і точним контекстом, якого немає в іноземних аналогах”, – пояснює Chief AI Officer Мінцифри Данило Цьвок.
Там додали, що це дасть змогу моделі краще розуміти українську мову в усій її повноті: з діалектами, термінами, історичними реаліями. Вона зможе давати змістовні, точні й мовно вивірені відповіді на питання про війну, історію чи культуру.
Окремо готується ініціатива, яка дозволить авторам “задонатити” свої тексти на навчання моделі. Адже LLM – це новий спосіб знайти інформацію. Коли українці ставитимуть їй питання, вона у своїх відповідях посилатиметься на роботи авторів.
Схожу ідею запропонував і Краковецький з DevRain. У подкасті “Шілософія” він висловив думку, що до збору даних могли б долучитися й українські медіа. При цьому він наголосив: прецедентів передавання даних не було, бо не зрозуміло, як розв’язувати проблему авторських прав.
Водночас у Мінцифрі наголошують: жодних персональних або чутливих даних у модель не завантажуватимуть. Дані проходитимуть очищення й анонімізацію, аби гарантувати безпеку та приватність користувачів.
Чому “Київстар”
У травні Федоров повідомив, що Україна веде перемовини з великою міжнародною компанією щодо створення національної ШІ-інфраструктури. Він зазначив, що її мають розгорнути повністю всередині країни з урахуванням воєнних та безпекових ризиків.
У Мінцифрі наголошували: проєкт української LLM неможливо реалізувати без партнерів. Хоча в Україні є відповідні фахівці, проте компаній, що системно працюють з ШІ, поки небагато. Саме тому в експертному середовищі довгий час припускали, що до співпраці залучать когось з великих західних гравців.
Однак на відкритий запит держави несподівано відгукнувся “Київстар”. Це здивувало багатьох. “Я думав, що це буде консорціум на зразок Microsoft, держави, якогось наукового центру, можливо, інфраструктурного партнера. А поки виглядає так, що просто сказали: “Київстаре, зроби”. З одного боку, це простіше: одна компанія – одна відповідальність. З іншого – питання залишаються”, – каже власник однієї з ІТ-компаній, яка працює у сфері ШІ.
Утім, партнер визначений і тепер важливо зрозуміти його роль. За словами представників компанії, “Київстар” виступає операційним виконавцем: створює проєктний офіс, добирає команду, відповідає за інфраструктуру й забезпечує обчислювальні потужності для попереднього етапу навчання моделі.
Фінансування бере на себе оператор. З огляду на воєнний час і постійний бюджетний дефіцит це виглядає цілком логічно. Розраховувати на державні кошти в такому проєкті було б нереалістично. У “Київстарі” оцінюють загальну вартість розробки 2 млн дол. У масштабах ШІ-індустрії це помірна сума.
Михайло Федоров та Олександр Комаров / Telegram FEDOROV
Кошти планують спрямувати насамперед на оренду інфраструктури та оплату праці. Власну інфраструктуру наразі не розгортатимуть, оскільки це складний і довгий шлях, який не відповідає темпам проєкту.
“Наразі в Україні бракує спеціалізованих GPU-чипів, потрібних для тренування подібної моделі. Тому ми плануємо використовувати потужності дата-центрів хмарних провайдерів. Паралельно, звісно, в Україні відбуватиметься поступове нарощування GPU-інфраструктури”, – пояснює Нестор.
Чому це вигідно “Київстару”? Офіційно це спосіб здобути експертизу у сфері ШІ та використовувати модель для власних рішень. Проте є й інші вагомі фактори.
В останні кілька місяців компанія активно цікавиться українським технологічним ринком, зокрема M&A-угодами. Вона формує міжнародні партнерства, як-от недавня угода із SpaceX, і готується до лістингу: невдовзі частина акцій “Київстару” з’явиться на фондовій біржі. У такому контексті участь у створенні національної LLM виглядає не просто як громадянська позиція, а як стратегічна інвестиція в репутацію і вплив.
Що на виході
Першу версію української LLM планують створити протягом дев’яти місяців. На початковому етапі вона працюватиме у форматі бета-тесту. “Під час цього періоду державні, наукові, громадські та освітні інституції зможуть завантажити модель і випробувати її можливості. Після завершення тестування модель буде передана державі й викладена у відкритий доступ”, – пояснює Нестор.
Після запуску модель планують інтегрувати з державними сервісами, зокрема з “Дією”. Один з перших прикладних продуктів – інструмент для перекладу та аналізу євросоюзівського законодавства. Наразі над ним працює WINWIN AI Center of Excellence. Такий сервіс може суттєво пришвидшити процес євроінтеграції. Рішень, які допомагатимуть державі, у міністерстві обіцяють більше.
З появою LLM функціональність “Дії” істотно розшириться. Вона має перетворитися на універсальне вікно взаємодії громадянина з державою, сервіс, де більшість послуг можна буде отримати за принципом one-stop-shop.
У Мінцифрі також очікують, що український бізнес почне створювати власні ШІ-продукти. “У компаній буде реальна можливість запускати власні чат-боти та ШІ-агенти для мільйонів користувачів. Ми хочемо, щоб в Україні зʼявився свій умовний ChatGPT. Але це вже більше історія для ринку, а не для держави”, – каже Цьвок з Мінцифри.
У “Київстарі” додають: бізнес отримає змогу долучитися до бета-тестування. Для цього потрібно буде подати запит. Надалі планується запуск комерційних рішень на базі LLM, які будуть доступні через API та з можливістю локального розгортання на серверах клієнтів.
Окреме питання – якою буде українська LLM за обсягом. Оскільки open-source-архітектуру ще не визначено, говорити про точні параметри рано. Утім, навряд чи варто очікувати на рішення, які здатні конкурувати з найпотужнішими моделями OpenAI.
Водночас за словами Овчаренка з ШІ-центру при Мінцифрі, пріоритет – це моделі в діапазоні 1-16 млрд параметрів. Такий масштаб дозволяє зберігати баланс між продуктивністю й ресурсними витратами: моделі до 7 млрд можна запускати на одній GPU, а 13-16 млрд – на невеликих кластерах (група об’єднаних комп’ютерів або серверів).
Досвід LLaMA, Gemma та Mistral показує, що правильно натреновані середні моделі можуть показувати конкурентну якість у завданнях класифікації, генерації та розуміння мови, зокрема в локалізованому контексті.
“Малі та середні моделі легше запускати і тонко налаштовувати до конкретних завдань, для цього вони і створені. Вони потребують менше ресурсів, але можуть показувати кращу ефективність на спеціалізованому наборі даних або в контексті конкретного завдання”, – зазначає Краковецький.
Хай там як, а повноцінно визначити, як виглядатиме і як працюватиме український суверенний ШІ, можна буде тільки після його запуску.
За матеріалами epravda.com.ua