AI-голос в шуме: прорыв от Subtle Computing

Стартап Subtle Computing из Калифорнии предлагает решение проблемы записи голоса в шумных условиях с помощью собственных моделей изоляции звука. Эта технология обещает революционизировать голосовые AI-продукты и сервисы.

Современные потребительские приложения с поддержкой голосового AI демонстрируют взрывной рост. Сервисы для заметок на совещаниях, такие как Granola, Fireflies, Fathom и Read AI, привлекают внимание как пользователей, так и инвесторов. Крупные компании, включая OpenAI, ClickUp и Notion, активно внедряют решения для транскрипции голоса. Разработчики приложений Wispr Flow и Willow работают над системами голосового ввода. Кроме того, аппаратные производители, такие как Plaud и Sandbar, используют специализированные устройства для преобразования голоса в текст с последующим анализом и генерацией инсайтов.

Одной из ключевых проблем для всех этих компаний остается качественный захват голоса пользователя в самых разнообразных условиях — будь то оживленное кафе или гулкий офис.

Для решения этой задачи Subtle Computing разработала комплексную модель изоляции голоса, способную точно распознавать речь даже при наличии фонового шума. Основатель компании Чен отмечает, что многие компании занимаются обработкой голоса, но часто отправляют аудиопоток в облако для очистки, что неэффективно.

Стартап фокусируется на обучении специализированных моделей, адаптированных под акустические особенности конкретного устройства и индивидуальные характеристики голоса пользователя, вместо универсальной модели для всех платформ.

«Мы обнаружили, что сохранение акустических характеристик устройства обеспечивает на порядок лучшее качество, чем у универсальных решений. Это также позволяет нам предлагать персонализированные решения», — пояснил Чен.

Компания была основана Тайлером Ченом, Дэвидом Харрисоном, Саванной Кофер и Джеки Янгом, которые познакомились в Стэнфорде. Чен, Кофер и Янг обучались в аспирантуре, а Харрисон получил степень MBA. Их объединил курс Lean Launchpad Стива Бланка, где они исследовали альтернативные интерфейсы для вычислений и заложили основу Subtle Computing.

«По мере того, как мы все больше взаимодействуем с AI, мы движемся к будущему, где будем общаться с нашими устройствами голосом», — говорит Чен. «Но закономерный вопрос: насколько хорошо наши устройства понимают нас, пользователей, во всех повседневных средах? Будь то очень шумное кафе или общий офис, где вокруг другие люди, и вы можете обсуждать конфиденциальные вопросы — сегодня голосовое взаимодействие работает не так», — добавил он.

По заявлению стартапа, модель, отвечающая только за изоляцию голоса, может функционировать на некоторых устройствах с размером всего в несколько мегабайт и задержкой в 100 мс. Для других устройств компания может использовать отдельную модель для транскрипции голоса и преобразования его в текст. Чен подчеркивает, что благодаря модели изоляции, транскрипционная модель компании лучше понимает пользователя, что, в свою очередь, обеспечивает более точную запись.

Subtle Computing сообщила, что Qualcomm выбрала стартап для участия в своей программе расширения голосовых и музыкальных технологий. Это означает, что технология стартапа будет совместима с чипами Qualcomm и доступна на устройствах, производимых OEM-партнерами.

Компания привлекла 6 миллионов долларов в рамках начального раунда финансирования под руководством Entrada Ventures, с участием Amplify Partners, Abstract Ventures и бизнес-ангелов, включая основателей таких компаний, как Biz Stone (Twitter), Evan Sharp (Pinterest) и Johnny Ho (Perplexity).

Карен Ротер Дэвис, управляющий партнер Entrada Ventures и бывший руководитель одного из ранних проектов X (Alphabet), отметила, что сфера голосового AI насыщена, и хотя взаимодействие через этот интерфейс набирает обороты, общий пользовательский опыт далек от идеала. Она считает, что фокус Subtle Computing на изоляции голоса предлагает новый взгляд на рынок.

«Можно спорить, увеличат ли достижения в области AI или уменьшат время, затрачиваемое на повседневные задачи, но все мы согласны с тем, что прогресс в вычислительных мощностях и машинном обучении / AI открывает возможности для прорывов в голосовых интерфейсах — если все сделано правильно», — заявила Дэвис. «Subtle Computing встречает пользователей там, где они есть, с голосовыми интерфейсами, которые работают в условиях экстремального шума и тишины, обеспечивая надежный, простой и приятный голосовой опыт. Это настоящая революция», — добавила она.

Компания также объявила о партнерстве с производителем потребительской электроники и автомобильным брендом (их названия не разглашаются) для внедрения своих решений. Однако Subtle Computing не планирует оставаться лишь поставщиком моделей для других компаний.

Стартап анонсировал планы по выпуску собственного потребительского продукта, включающего аппаратное и программное обеспечение, в следующем году, но пока без раскрытия деталей.

Комментарии

Комментариев пока нет.

Информация

Опубликовано: 06 ноября 2025
Категория:
Просмотров: 9