Искусственный интеллект научат понимать культуру и язык Узбекистана

Аскар Жакыпов
фото: dzen.ru

В Узбекистане началась разработка национальной языковой модели искусственного интеллекта (ИИ), что, по мнению властей, поможет обеспечить цифровой суверенитет и сохранить культурную идентичность, передает Ulysmedia.kz.

Подробности 

Согласно плану, министерствам поручено предоставить реестры данных на узбекском языке, которые будут включать тексты, изображения и анонимизированные медицинские данные для использования в ранней диагностике заболеваний, пишет gazeta.uz. Эти данные помогут создать датасеты для машинного обучения. Ведутся переговоры с экспертами по маркировке данных, что станет следующей стадией. 

Планы

С 2026 года планируется запуск большого кластера ИИ, который позволит реализовать до 100 проектов в разных отраслях, включая здравоохранение. Одной из ключевых задач является сохранение исторической и культурной идентичности, чтобы избежать искажений в информации об Узбекистане при использовании глобальных языковых моделей. 

Актуальность 

Разработка национальной модели также важна для решения задач в области перевода, распознавания речи и работы с клиентами. Кроме того, условия, создаваемые государством для частного сектора, позволят сократить расходы на внедрение ИИ. Локальная языковая модель будет необходима для работы с конфиденциальной информацией в государственных структурах и снизит зависимость от внешних поставщиков. Узбекистан активно стремится занять самостоятельное место на мировом рынке технологий, работая над созданием собственных моделей, аналогично соседним странам.

Мнение 

Хикматилла Убайдуллаев, эксперт в области стратегических коммуникаций, цифровых технологий и искусственного интеллекта, отметил, что долгое время ChatGPT был недоступен для пользователей из Узбекистана — доступ открыли только в 2023 году, после чего интерес к ИИ значительно вырос.

     - Однако даже при работе с современными инструментами возникают искажения: например, при генерации изображений под запрос „узбек“ модель часто создаёт стереотипный или чуждый образ — мужчина в бороде и тюбетейке, женщина в покрывале. Это связано с отсутствием достаточного количества данных об узбеках и Узбекистане. 

Если мы пишем „Самарканд, Регистан“, сейчас ИИ более-менее понимает, как он выглядит. Но до этого были проблемы, и именно поэтому мы занимаемся сбором собственных данных, - отметил он.