Willow: Ваш голосовой помощник для всех приложений

Современные модели искусственного интеллекта открывают новые горизонты, и одной из наиболее впечатляющих областей стало понимание человеческой речи, что привело к созданию более точных инструментов для диктовки. Компания Willow, уже известная своим приложением для Mac, готовится к запуску версии для iOS, призванной позволить пользователям управлять вводом текста голосом во всех приложениях.

Подобно другим подобным решениям, клавиатура Willow не только транскрибирует вашу речь, но и форматирует текст в соответствии с контекстом. Приложение поддерживает более 100 языков и позволяет настраивать собственные термины или создавать различные стили письма для таких категорий, как работа, сообщения, электронная почта и другие.

Одно из ключевых преимуществ приложения Willow — наличие полноценной клавиатуры для ввода текста. В отличие от некоторых конкурентов, предлагающих лишь числовую клавиатуру, Willow позволяет легко вносить быстрые правки или набирать отдельные слова вручную, не переключаясь на другую клавиатуру.

Willow была основана Алланом Гуо и Лоуренсом Лю, которые оставили Стэнфорд, чтобы основать стартап. Дуэт присоединился к программе Y Combinator летом 2024 года с другим составом соучредителей. Изначально их идея была связана со сферой здравоохранения — разработкой программного обеспечения для управления учреждениями по уходу за пожилыми людьми. Однако эта концепция не получила развития, и в течение года компания экспериментировала с различными направлениями.

«Работая над решениями для здравоохранения, мы заметили, что у врачей есть ИИ-ассистенты, которые записывают разговоры с пациентами и создают документы для последующих визитов. Я много общался с врачами, и они отмечали, что эти помощники по ведению записей очень полезны. Это подтолкнуло нас к созданию инструмента на базе ИИ для работы с голосом, ориентированного на профессионалов и других пользователей», — рассказал Гуо в телефонном интервью.

Гуо добавил, что решил не создавать еще один инструмент для ведения заметок, поскольку рынок в этой нише был насыщен. Вместо этого пространство диктовки показалось ему более привлекательным, так как значительная часть общения происходит вне встреч. Он отметил, что компания использует набор моделей и уделяет особое внимание настройке своего конвейера преобразования текста в текст, основанного на моделях Llama от Meta, для форматирования и персонализации.

Стартап перенес свой выпуск в рамках YC на весну 2025 года для запуска продукта. С момента запуска компания демонстрирует рост пользователей на 50% ежемесячно. Среди корпоративных клиентов, использующих инструмент для диктовки с функциями пользовательского словаря команды, — Uber, Heidi Health и Zego.

Willow привлекла 4,5 миллиона долларов от Box Group, Y Combinator, Burst Capital и бизнес-ангелов, включая Дхармеша Шаха (HubSpot), Томера Лондона (Gusto), Алекса Оганяна (Reddit), Киппа Боднара (бывший COO Yelp), Каз Неджатиана (CEO Opendoor), Адама Гилда (соучредитель Owner) и Макса Маллена (соучредитель Instacart).

Маллен выразил уверенность, что в будущем наиболее интуитивно понятные пользовательские интерфейсы будут управляться голосом.

«Меня очень впечатлило видение Аллана не только в создании превосходного приложения для диктовки, но и в долгосрочной перспективе — в создании интерфейса, способного управлять вашим компьютером», — сказал он. «Когда я пишу с помощью Willow, мне требуется меньше правок, чем при использовании встроенной системы диктовки компьютера».

Маллен отметил, что одним из его любимых сценариев использования является возможность на рабочем столе использовать голосового помощника «Hey Willow», чтобы давать команды приложению, например, писать ответы на письма вашим собственным голосом.

Стартап конкурирует с такими игроками, как Wispr Flow, привлекший более 56 миллионов долларов финансирования; Monologue, являющийся частью подписки Every; а также стартапами из YC: Aqua, Talktastic, Superwhisper и Betterdication.

Гуо сообщил, что в ближайшие месяцы компания планирует расширить платформы на Windows и Android, а также улучшить персонализацию, чтобы сократить количество ручных правок, которые пользователи должны выполнять после диктовки.

Комментарии

Комментариев пока нет.