Humain: Саудівська Аравія крокує в майбутнє ШІ з власною мовною моделлю

В травні 2025 року Саудівська Аравія представила нову національну ініціативу у сфері штучного інтелекту — компанію Humain, завдання якої не просто масштабне, а стратегічно визначальне: створення повноцінної ШІ-інфраструктури з акцентом на розвиток потужної арабської мовної моделі. Це не просто стартап, це – спроба втрутитися у глобальний перерозподіл сил на ринку AI.

Навіщо Саудівській Аравії своя мовна модель?

Мовні моделі — це нова геополітика. Чим краще модель “розуміє” вашу мову, культуру, юридичні й історичні контексти — тим краще вона може працювати в інтересах суспільства, уряду і бізнесу. Але сьогодні більшість лідерських LLM (large language models) створені англомовними країнами — GPT, Claude, Gemini, Mistral, LLaMA — і майже не враховують арабський семантичний світ.

Саудівська Аравія, яка останні роки проводить масштабну цифрову трансформацію в рамках програми Vision 2030, робить амбітну ставку: вийти за межі споживача ШІ й стати його творцем. Humain — це фундамент для мовного, культурного і технологічного суверенітету.

Що відомо про Humain?

Humain — це не просто компанія, а державно-приватний консорціум, який має об’єднати науковців, інженерів, філологів і корпорації для створення:

  • власного LLM, натренованого на мільярдах арабськомовних джерел, включно з Кораном, класичними текстами, локальними діалектами, сучасними медіа;
  • національного дата-центру для обробки великих обсягів мовних даних;
  • екосистеми відкритого коду для розробників, університетів та індустріальних гравців;
  • інтеграцій з державними платформами в освіті, охороні здоров’я, правосудді та безпеці.

Як це змінить ШІ-ландшафт арабського світу?

Зараз арабська мова в більшості глобальних LLM — другорядна. Вона має складну морфологію, велику варіативність діалектів і культурно залежні значення слів. Ігнорування цього створює ризики: ШІ, який погано розуміє мову, не здатен адекватно обслуговувати мільйони громадян.

Humain може змінити це. Якщо їм вдасться створити мовну модель, яка:

  • коректно обробляє фусха (класичну арабську),
  • адаптивно працює з діалектами (єгипетський, ліванський, саудівський тощо),
  • розуміє релігійні, правові й соціальні контексти…

… то це означатиме появу штучного інтелекту, який “мислить” арабською. І це — революція не тільки технічна, а й культурна.

Ця гонка — не лише за якість, а й за вплив. Мовні моделі стають цифровими послами культури.

Виклики Humain

  1. Брак даних. Хоча арабська — одна з найпоширеніших мов, якісні відкриті датасети обмежені.
  2. Мовна різноманітність. Від Ер-Ріяда до Рабату — величезна варіативність у вимові, лексиці, семантиці.
  3. Консервативне суспільство. Питання цензури, фільтрації та релігійного контексту потребують обережного балансу.
  4. Конкуренція з Falcon. ОАЕ вже випустили Falcon — одну з найпотужніших відкритих арабських моделей.

Наш погляд: Humain як частина нового цифрового ренесансу

Для About Digital запуск Humain — це частина ширшого тренду: глобальної деколонізації ШІ. Як колись країни боролись за незалежність і економічний суверенітет, так зараз вони виборюють цифровий суверенітет — право мати ШІ, який не тільки розуміє мову, а й поділяє цінності.

Humain — це технологічна декларація: арабський світ має голос, і цей голос має звучати в ШІ. І ми підтримуємо це.

Що далі?

Очікується, що впродовж 2025–2026 років Humain:

  • випустить першу версію моделі на 13B параметрів;
  • запустить API для урядових і комерційних сервісів;
  • підготує освітні програми з використанням LLM;
  • вийде на ринок B2B-рішень у сфері govtech, fintech, legaltech.

Це лише початок. Але якщо Humain буде успішним — це означатиме, що арабський штучний інтелект став реальністю.