Корейские стандарты ИИ: безопасность и доверие

В условиях стремительного развития технологий искусственного интеллекта (ИИ) обеспечение его безопасности и надежности становится глобальной задачей. Южнокорейские исследователи активно участвуют в формировании международного регулирования, возглавляя разработку двух ключевых стандартов.

Институт электроники и телекоммуникационных исследований (ETRI) выступил инициатором стандартов «AI Red Team Testing», предназначенного для проактивного выявления рисков в системах ИИ, и «Trustworthiness Fact Label (TFL)», который призван помочь потребителям легко оценить уровень достоверности ИИ. Эти предложения были представлены Международной организации по стандартизации (ISO/IEC), и началась их полномасштабная разработка.

Благодаря этим инициативам, Южная Корея переходит от роли «быстрого последователя» технологий к роли «первопроходца», устанавливая правила игры в новую эру ИИ.

«AI Red Team Testing» представляет собой метод агрессивного тестирования для оценки защищенности систем ИИ. Например, он позволяет выявлять ситуации, когда генеративный ИИ может выдавать неверную информацию или когда его можно использовать для обхода пользовательских защитных мер.

ETRI выступает в роли редактора международного стандарта ISO/IEC 42119-7, определяющего общие процедуры и методы тестирования, применимые в широком спектре областей, включая медицину, финансы и оборону.

В рамках этой работы ETRI совместно с Министерством продовольствия и медикаментов Республики Корея провел первое в Азии и Корее мероприятие «Advanced AI Digital Medical Product Red Team Challenge and Technology Workshop». В нем приняли участие медицинские работники, эксперты по безопасности и широкая общественность для оценки предвзятостей и рисков ИИ в медицинских устройствах.

ETRI также сотрудничает с Сеульским медицинским центром Asan для разработки методологии оценки ИИ-систем в медицине и создания системы тестирования цифровых медицинских продуктов с применением передовых технологий ИИ. Кроме того, сформирован консорциум с ведущими компаниями, такими как STA, NAVER, Upstage, SelectStar, KT и LG AI Research Institute, для усиления сотрудничества в области стандартизации.

Еще одним важным стандартом являются «Trustworthiness Fact Labels (TFLs)». Этот «ярлык доверия» предоставляет наглядную информацию о степени надежности системы ИИ, аналогично пищевой ценности на продуктах питания.

ETRI руководит разработкой серии стандартов ISO/IEC 42117, которые могут применяться различными способами: компании могут предоставлять информацию самостоятельно или проходить верификацию третьей стороной.

В будущем ETRI рассматривает возможность включения ESG-факторов, таких как углеродный след ИИ.

В сочетании со стандартом ISO/IEC 42001 (система менеджмента ИИ), эти новые стандарты послужат основой для демонстрации надежности разработанных продуктов и услуг.

Эти инициативы соответствуют государственным стратегиям «Sovereign AI» и «AI G3 leapfrog», демонстрируя не только технологическое лидерство, но и практический вклад в формирование глобальных правил игры в сфере ИИ.

Представители индустрии подчеркивают значимость этих шагов. Ким Ук, менеджер проекта Института планирования и оценки информационно-коммуникационных технологий (IITP), отметил: «Обеспечение безопасности и надежности ИИ сделает его использование проще для всех, а лидирующая роль в международных стандартах станет поворотным моментом на пути к стране, управляющей нормами ИИ».

Ли Сын Юн, помощник вице-президента отдела стандартизации и исследований открытого ПО ETRI, добавил: «Тестирование ИИ по методу красной команды и этикетки доверия являются ключевыми техническими элементами, включенными в политики регулирования ИИ в США, ЕС и других странах. Эти международные стандарты послужат общими критериями для оценки безопасности и надежности систем ИИ во всем мире».

ETRI продолжит лидировать в стандартизации в области безопасности и надежности ИИ, делая Корею центром передового опыта не только в области суверенного ИИ, но и в технологиях обеспечения его безопасности.

Комментарии

Комментариев пока нет.