Создание надёжного ИИ: новый подход к мультимодальному обучению

Исследователи из Шеффилдского университета и Института Алана Тьюринга представили новый «план» для разработки практичного и надёжного искусственного интеллекта. Эта передовая разработка акцентирует внимание на способности ИИ обучаться на разнообразных типах данных, выходя за рамки привычных текста и изображений, что значительно расширяет возможности его применения в реальном мире.

Разработанная структура служит «дорожной картой» для создания и внедрения ИИ, делая технологию более практичной, этичной и эффективной в решении актуальных проблем. Опубликованный в журнале Nature Machine Intelligence, этот фреймворк представляет собой стратегию построения мультимодального ИИ — систем, способных обрабатывать и анализировать различные источники информации, такие как текст, изображения, звуки и сенсорные данные, для формирования более целостного представления о мире.

Традиционно ИИ обучается на одном типе информации. Однако мультимодальные системы интегрируют разнообразные данные, что позволяет им получать более полное понимание. Несмотря на очевидные преимущества, текущие исследования и системы мультимодального ИИ в основном сосредоточены на анализе визуальной и текстовой информации. По мнению разработчиков, это существенно ограничивает потенциал ИИ в решении комплексных задач, требующих более широкого спектра данных.

Например, объединение визуальных данных, информации с датчиков и данных об окружающей среде может повысить безопасность автономных транспортных средств в сложных условиях. Интеграция медицинских, клинических и геномных данных, в свою очередь, позволит ИИ-инструментам точнее диагностировать заболевания и ускорять разработку лекарств. Новый фреймворк, разработанный с учётом этих тенденций, может быть полезен как разработчикам в индустрии, так и учёным. Это особенно актуально, учитывая, что 88,9% научных работ, опубликованных в 2024 году на arXiv (ведущем репозитории препринтов по информатике), связанных с ИИ, использующим ровно два типа данных, задействовали именно визуальную или текстовую информацию.

Профессор Хайпин Лу, руководитель исследования из Школы компьютерных наук и Центра машинного интеллекта Шеффилдского университета, отметил: «ИИ достиг значительных успехов в области зрения и языка, но реальный мир гораздо богаче и сложнее. Для решения глобальных проблем, таких как пандемии, устойчивая энергетика и изменение климата, нам необходим мультимодальный ИИ, который интегрирует более широкий спектр данных и экспертизы».

«Наше исследование предлагает практический план для внедрения ИИ, который работает не только в лабораторных условиях, уделяя особое внимание безопасности, надёжности и практической пользе», — добавил он. Исследование иллюстрирует новый подход на трёх примерах: реагирование на пандемии, разработка автономных автомобилей и адаптация к изменению климата. К работе над этими примерами были привлечены 48 специалистов из 22 учреждений по всему миру.

Доктор Луиза ван Зеланд, руководитель отдела исследований в Институте Алана Тьюринга, подчеркнула: «Интегрируя и моделируя большие, разнообразные наборы данных с помощью мультимодального ИИ, наша совместная работа с коллегами из Института Алана Тьюринга устанавливает новый стандарт в прогнозировании окружающей среды. Этот сложный подход позволяет нам генерировать прогнозы в различных пространственных и временных масштабах, что приводит к реальным результатам в таких областях, как сохранение Арктики и повышение устойчивости сельского хозяйства».

Комментарии

Spike 09.11.2025 00:36
Экспансия!

Информация

Опубликовано: 21 октября 2025
Категория:
Просмотров: 8