VoiceSecure: ИИ-защита от прослушивания голоса
При голосовых звонках через популярные мессенджеры мы не только обмениваемся словами. Мы раскрываем свой возраст, пол, эмоциональное состояние, социальное положение и черты характера – это своего рода биометрический отпечаток, уникальный как лицо. И искусственный интеллект всё чаще прислушивается.
«Уже сейчас мы видим фишинг, основанный на нашей онлайн-активности и текстах электронных писем», — отмечает Нирупам Рой, доцент кафедры компьютерных наук Университета Мэриленда. «Сегодня значительная часть наших голосовых коммуникаций проходит через цифровые платформы, что создает беспрецедентную уязвимость конфиденциальности нашей речи. Мы ожидаем, что угрозы, связанные с голосовыми данными, станут весьма реальными, особенно с развитием искусственного интеллекта».
В то время как мы беспокоимся о том, что пишем в письмах или публикуем в социальных сетях, наши голоса непреднамеренно транслируют глубоко личную информацию при каждом онлайн-общении. Голосовые данные могут попасть в руки злоумышленников, способствуя целевому фишингу, созданию дипфейков, краже биометрических данных и даже сложным социальным инженериям.
Рой работает над решением этой растущей угрозы личной безопасности. Чтобы защитить голосовые данные от кражи и использования злоумышленниками, он и его исследовательская группа в UMD разработали VoiceSecure – инновационную систему, которая скрывает речь от искусственного интеллекта, сохраняя при этом кристальную чистоту разговоров для человеческого слуха.
Когда каждый звонок становится источником данных
Ценность для злоумышленников представляет не только содержание разговора. По словам Роя, главная проблема в обеспечении конфиденциальности заключается в «мета-лингвистической» информации, которую несут человеческие голоса: эмоции, биологические характеристики, паттерны стресса и маркеры личности.
«Правительственные и военные переговоры часто требуют серьезной защиты от прослушивания голоса, но даже обычные разговоры могут раскрыть массу информации», — говорит Рой. «Разговор матери с сыном по FaceTime может выдать критически важные личные детали, которые можно использовать для создания чего угодно: от таргетированной рекламы до клонирования голоса для мошенничества».
Мошенники и создатели дипфейков используют сгенерированные ИИ голоса, чтобы сделать свои схемы более убедительными. Кража биометрических данных обеспечивает несанкционированный доступ к системам с голосовой аутентификацией, таким как банковские счета или медицинские карты пациентов. А сложные атаки социальной инженерии становятся гораздо эффективнее, когда злоумышленники используют подробные профили, построенные на основе реальных речевых паттернов и биометрических данных человека.
Рой отмечает, что компании и платформы уже имеют процедуры для защиты данных пользователей, но эти стратегии часто оказываются неэффективными на практике.
Некоторые решения включают добавление шумовых помех в аудиозаписи, что может ухудшить качество связи для пользователей. Традиционное шифрование, наиболее распространенный метод, также сталкивается со значительными проблемами, включая необходимость шифрования и дешифрования контента в реальном времени на обоих концах – это требует больших вычислительных ресурсов, которые не каждое устройство может комфортно поддерживать.
«Несовместимость устройств пользователей, таких как настольный компьютер и мобильное устройство, может создавать слабые места в безопасности, которые могут использовать злоумышленники. Когда коммуникационные системы становятся более сложными, конечные пользователи теряют контроль над своими данными», — говорит Рой. «Даже при наличии сквозного шифрования на многих платформах эти защиты часто необязательны, трудны в реализации или просто не соблюдаются. А злоумышленникам с инструментами вроде ИИ становится легче использовать эти уязвимости».
Система VoiceSecure Роя призвана устранить эти ограничения и бороться со злонамеренными атаками, используя одно ключевое различие между людьми и машинами: как они обрабатывают звук.
«Человеческий слух имеет встроенные ограничения. Люди не одинаково чувствительны ко всем частотам звука. Например, два близко расположенных звука на высоких частотах часто невозможно различить. Психоакустические эффекты формируют наше восприятие звука — это не только частота, но и чувствительность, и контекст», — объясняет Рой. «Напротив, машины обрабатывают все частоты как отдельные точки данных с математической точностью. Они анализируют каждую акустическую характеристику для идентификации говорящих и извлечения информации».
Используя обучение с подкреплением на основе ИИ, система VoiceSecure оптимизирует голосовые сигналы для подавления характеристик, на которые полагаются машины при распознавании и профилировании, сохраняя при этом характеристики, которые люди используют для понимания речи и узнавания друг друга.
VoiceSecure, функционирующая как модуль микрофона на уровне прошивки или драйвера, захватывает и преобразует голосовые данные на самом раннем этапе конвейера связи, еще до того, как они достигнут операционной системы устройства. Этот тонкий баланс между человеческим и машинным слухом может стать препятствием между конфиденциальным разговором и нежелательным прослушиванием со стороны ИИ, отмечает Рой.
«Голосовая связь очень лична, поэтому мы хотели сохранить это человеческое качество в нашей системе. Мать должна по-прежнему узнавать голос своего сына во время звонка, но автоматизированные системы наблюдения ИИ должны не суметь идентифицировать говорящего или извлечь конфиденциальные биометрические данные», — говорит Рой. «Ключ к этой работе — игра в промежутке между тем, что слышат люди, и тем, что слышат машины».
Рой и его команда уже успешно протестировали измененное аудио из VoiceSecure на реальных пользователях, подтвердив, что разговоры остаются понятными для людей, но непроницаемыми для машин.
Пользователи также могут настраивать предпочтительные уровни конфиденциальности и контролировать свои голоса, не полагаясь на действия или технологии других сторон, включая собеседников и коммуникационную платформу.
Команда надеется сотрудничать с инженерами и отраслевыми партнерами для упаковки системы в виде устанавливаемого программного обеспечения, которое можно будет применять ко всем компьютерам и умным устройствам.
А пока Рой отмечает, что человеческая бдительность так же важна, как и технологическая защита, для обеспечения безопасности цифровых систем и нашей конфиденциальности.
«Осведомленность — ключ к обеспечению безопасности, когда люди вовлечены», — говорит он. Сотрудничая с профессором информатики UMD Мегой Субраманиам и доцентом кафедры компьютерных наук Университета Мэриленда в Балтиморе Каунти Саноритой Дей, Рой запустил Cyber-Ninja — платформу на базе ИИ, которая превращает обучение кибербезопасности в интерактивный игровой опыт.
Cyber-Ninja, разработанная для подростков и взрослых, помогает пользователям обнаруживать и избегать фишинговых атак, развивая при этом навыки критического мышления и цифровую уверенность. Команда уже провела успешные семинары в библиотеках по всей Мэриленду, демонстрируя, как обучение с использованием ИИ может повысить устойчивость сообщества к развивающимся цифровым угрозам.
«От чат-ботов службы поддержки до роботизированных пылесосов и таких устройств, как Alexa, искусственный интеллект действительно стал неотъемлемой частью нашей жизни. И по мере того, как ИИ становится все более физически присутствующим, потребность в надежной защите конфиденциальности становится еще более насущной», — говорит Рой. «Мы хотим, чтобы ИИ развивался, поскольку он приносит столько пользы, но важно реагировать на развивающиеся угрозы, развивая и наши собственные механизмы защиты».
Галерея
Комментарии
Комментариев пока нет.