Эстония создаёт национальную ИИ-модель для защиты языка и данных
В глобальной гонке искусственного интеллекта Эстония не может позволить себе остаться в стороне. Цель страны — не обязательно победить, а сохранить компетенции во всех ключевых технологических областях.
По мере того как расширенный интеллектом персонал становится обычным явлением, многие важные секторы услуг сталкиваются с ограничениями коммерческих больших языковых моделей. Особенно это касается обработки конфиденциальных данных в здравоохранении, обороне и государственном управлении. Создание собственной, точной и эффективной языковой модели для эстонского языка стало бы значительным преимуществом для общества. Однако из-за небольшого размера языкового сообщества коммерческий интерес сторонних разработчиков невелик.
Чтобы защитить и сохранить эстонский язык в эпоху стремительного развития ИИ, а также создать практические инструменты для повседневного использования, Институт компьютерных наук Тартуского университета обучает открытую языковую модель. Её цель — свободное общение на эстонском и глубокое понимание местного культурного контекста. Обучение модели проходит на вычислительном кластере Центра высокопроизводительных вычислений университета.
Множество инновационных компаний, основанных на исследованиях, предъявляют повышенные требования к защите интеллектуальной собственности и безопасности данных. Для них критически важна абсолютная ясность правового и технического окружения.
Инвестиции в знания как основа стратегии
Сегодня очевидно, что решение Эстонии, принятое 35 лет назад после восстановления независимости, строить экономику на новых технологиях и образовании принесло значительные плоды.
Центр высокопроизводительных вычислений Тартуского университета пользуется преимуществами своего положения в вузе, входящем в топ-1,2% университетов мира. Широкая экспертиза — от фундаментальных дисциплин до узкоспециализированных областей, включая ИИ, — создаёт уникальную среду для сотрудничества с ведущими учёными. Это также позволяет студентам университета проходить практические курсы под руководством специалистов, непосредственно занятых в передовых проектах в области высокопроизводительных вычислений и искусственного интеллекта.
Опыт показывает, что ИИ-агенты могут быть чрезвычайно эффективны, но только когда пользователи обладают достаточной квалификацией для проверки и корректировки их результатов. Поэтому, параллельно с технологическим прогрессом, спрос на высококвалифицированных ИТ-специалистов будет не снижаться, а возрастать.
Развитие собственных технологических систем
Центр высокопроизводительных вычислений Тартуского университета был официально основан в 2008 году, хотя история научных вычислений в Тарту началась ещё в 1959 году. В 2008 году был развёрнут первый вычислительный кластер «Aurumasin».
С тех пор центр эволюционировал от простого поставщика вычислительных мощностей в комплексного провайдера услуг, поддерживающего пользователей на всех этапах исследовательского цикла — от выполнения анализа до безопасного хранения данных и полного соответствия регуляторным требованиям.
В феврале 2026 года локальные вычислительные мощности центра выросли примерно на порядок. Были введены в эксплуатацию новые графические ускорители, включая 12 NVIDIA H200, 24 NVIDIA B200 и 40 NVIDIA RTX Pro 6000 Blackwell Max-Q. Эта аппаратура была приобретена при поддержке Министерства юстиции и цифровых дел для ускорения разработки национальных и научных решений на основе ИИ. В результате общая инфраструктура, включающая облачные, Kubernetes и кластерные ресурсы, насчитывает 164 графических процессора, 21 520 потоков ЦП и 118 ТБ оперативной памяти, а также более 17 петабайт полезного хранилища и свыше 30 петабайт для архивных целей.
Не менее важной, чем передовая аппаратная инфраструктура, является команда из более чем 50 высококвалифицированных специалистов. Команда активно участвует в киберзащитных учениях и хакатонах, внося вклад как в устойчивость к киберугрозам, так и в исследование будущих решений на основе ИИ.
Формирование эстонской научно-вычислительной инфраструктуры
По мере того как вычислительные методы становились неотъемлемой частью исследований в большинстве научных дисциплин, потребность в общегосударственном консорциуме становилась всё очевиднее. В ответ на это в 2011 году была создана Эстонская научно-вычислительная инфраструктура. Консорциум возглавляет Тартуский университет, а партнёрами являются Таллиннский технический университет, Институт химической и биологической физики и Министерство образования и исследований.
ETAIS поддерживает конкурентоспособность эстонской науки и промышленности, предоставляя доступ к современным вычислительным ресурсам. Эти услуги включают высокопроизводительные вычисления, безопасное управление данными, поддержку пользователей и экспертные консультации. Основными пользователями являются сообщества биоинформатиков, медиков, специалистов по анализу данных, языковых технологий, химии, материаловедения, климатических исследований и физики.
Сегодня ETAIS служит официальным поставщиком инфраструктуры для эстонского сектора исследований и разработок, а также предоставляет современные услуги ИИ-инфраструктуры всему государственному сектору Эстонии. Кроме того, ETAIS соединяет национальную электронную инфраструктуру Эстонии с международными партнёрами, в первую очередь с суперкомпьютером EuroHPC LUMI и LUMI AI Factory.
ETAIS представляет Эстонию в Северном сотрудничестве в области электронной инфраструктуры и развивает сервис Puhuri — специализированную систему управления ресурсами и порталом, которая используется в нескольких странах, в том числе в среде суперкомпьютера LUMI. ETAIS также участвует в проектах, связанных с развитием квантовых вычислений и безопасным долгосрочным архивированием персональных данных.
ETAIS была одним из учредителей консорциума суперкомпьютера LUMI, официально открытого 13 июня 2022 года в Каяани, Финляндия. LUMI предоставляет исследователям и предпринимателям доступ к вычислительным ресурсам мирового класса, позволяя даже самым требовательным пользователям, например, разработчикам продвинутых ИИ-моделей, получить возможности для серьёзных научных и технологических прорывов. По состоянию на начало 2026 года LUMI продолжает входить в десятку самых мощных суперкомпьютеров мира. Команда центра активно участвует в работе по созданию и эксплуатации сервисов на этой уникальной вычислительной платформе.
Обеспечение безопасности геномных данных Эстонии
Эстонский биобанк создал популяционный банк данных, охватывающий более 200 000 человек. Поскольку в программе участвует около 20% взрослого населения Эстонии, этот ресурс представляет собой уникально ценный набор данных для развития медицинских исследований как на национальном, так и на международном уровне. Данные позволяют исследователям изучать различия в рисках заболеваний и индивидуальные реакции на методы лечения, закладывая основу для внедрения персонализированной медицины в Эстонии.
Ввиду высокой чувствительности этих данных доступ к ним предоставляется исключительно через защищённую среду для работы с конфиденциальными данными. Это самая безопасная служба, управляемая центром, предлагающая полностью изолированную исследовательскую среду с исчерпывающим журналированием всех действий для обеспечения прослеживаемости и возможности аудита.
Получение сертификата ISO/IEC 27001:2022
В 2025 году центр получил сертификат соответствия международному стандарту ISO/IEC 27001:2022. Этот стандарт подтверждает приверженность центра поддержанию высочайшего уровня защиты данных и протоколов безопасности. Сертификация охватывает все критические ИТ-операции и услуги, обеспечивая соответствие глобально признанным стандартам информационной безопасности.
Процесс сертификации включал всесторонний аудит системы управления информационной безопасностью центра, охватывающий все аспекты обработки данных, оценки рисков и внедрения средств контроля безопасности для широкого спектра услуг. Получение этого сертификата демонстрирует стремление центра защищать конфиденциальные исследовательские данные и поддерживать операционное совершенство во всех областях своей деятельности.
Центр будет поддерживать свой сертификат посредством регулярных аудитов и постоянного совершенствования практик безопасности, гарантируя, что его система управления информационной безопасностью остаётся устойчивой к развивающимся угрозам как в академической, так и в коммерческой среде.
Управление ресурсами
С 2016 года часть команды центра участвует в разработке портала Waldur, который делает доступ к сложным вычислительным ресурсам таким же простым, как онлайн-банкинг. Портал позволяет организациям предоставлять своим пользователям необходимые инструменты, контролировать бюджет и обеспечивать эффективное использование дорогостоящих технологий.
Waldur является ключевым компонентом Платформы Федерации EuroHPC — центрального портала, предназначенного для интеграции разнообразных суперкомпьютерных и квантовых ресурсов Европы в единую, безопасную и удобную экосистему. В рамках проектов CASTIEL 2 и готовящегося CASTIEL 3 команда отвечает за разработку маркетплейса для услуг, предлагаемых компетентными центрами EuroHPC.
Результат достигается тесным сотрудничеством
Министерства Эстонии заслуживают признания за свои смелые и инновационные инициативы, которые вдохновляют, позволяют и поддерживают сотрудничество в проектах, которые были бы слишком амбициозны для любого отдельного партнёра.
Тридцать лет назад была запущена программа «Прыжок тигра», обеспечившая компьютерами все школы и заложившая основу цифрового успеха Эстонии. Сегодня, в ответ на новые вызовы неконтролируемого использования ИИ в образовании, запущена новая программа «Прыжок ИИ». Эта инициатива объединяет тысячи учителей для переосмысления образования в эпоху ИИ, повышения цифровой грамотности в обществе и развития образовательных практик на основе исследований.
Уверенность в том, что подобные инициативы в сочетании с описанными выше инфраструктурой, экспертизой и сотрудничеством создают связи и знания, необходимые для предоставления широкого спектра услуг. Эти услуги позволяют обучать профессионалов и предоставлять инструменты для самостоятельного, безопасного и эффективного использования современных и будущих технологий искусственного интеллекта.
Комментарии
Комментариев пока нет.