Qodo: Искусственный интеллект для проверки AI-генерации кода

По мере того как инструменты искусственного интеллекта ежемесячно генерируют миллиарды строк кода, возникает новая проблема: обеспечение корректной работы программного обеспечения. Стартап Qodo, разрабатывающий AI-агентов для проверки, тестирования и управления кодом, считает, что верификация определит следующий этап развития индустрии.

Компания, базирующаяся в Нью-Йорке, привлекла 70 миллионов долларов в рамках раунда финансирования серии B под руководством Qumra Capital, что увеличило общий объём инвестиций до 120 миллионов долларов.

Цель Qodo — повысить уровень доверия к коду, созданному искусственным интеллектом, в условиях растущего внедрения корпоративных инструментов. Многие компании обнаруживают, что увеличение скорости генерации кода не всегда приводит к созданию надёжного и безопасного программного обеспечения.

В то время как большинство AI-инструментов для проверки анализируют внесённые изменения, платформа Qodo оценивает, как эти правки влияют на всю систему. Решение учитывает корпоративные стандарты, исторический контекст и допустимый уровень риска, помогая организациям увереннее управлять AI-сгенерированным кодом.

Основатель компании Итамар Фридман, ранее соосновавший Visualead и руководивший направлением машинного зрения в Alibaba, рассказал, что на создание Qodo его вдохновили два ключевых момента карьеры: работа в Mellanox и опыт построения Visualead. В Mellanox, где он занимался автоматизацией проверки аппаратного обеспечения с помощью машинного обучения, он осознал, что генерация систем и их верификация требуют принципиально разных подходов. Позже, в Damo Academy (Alibaba), он наблюдал эволюцию ИИ в сторону систем, способных к логическим рассуждениям на человеческом языке.

Недавнее исследование показывает, что хотя 95% разработчиков не полностью доверяют коду, созданному искусственным интеллектом, только 48% регулярно проверяют его перед внедрением. Это демонстрирует разрыв между осознанием проблемы и реальной практикой.

«Компании, занимающиеся генерацией кода, в основном построены вокруг больших языковых моделей. Но для обеспечения качества и управления кодом одних LLM недостаточно, — отметил Фридман. — Качество субъективно. Оно зависит от стандартов организации, предыдущих решений и внутренних знаний. Языковая модель не может полностью понять этот контекст».

Qodo делает ставку на производительность, чтобы выделиться на конкурентном рынке. Стартап недавно занял первое место в рейтинге Martian’s Code Review Bench, набрав 64,3% — более чем на 10 баллов опередив ближайшего конкурента. Тестирование продемонстрировало способность системы обнаруживать сложные логические ошибки и проблемы, затрагивающие несколько файлов, не перегружая разработчиков избыточными предупреждениями.

За последний месяц компания запустила Qodo 2.0 — мультиагентную систему проверки кода, которая в настоящее время лидирует в актуальных benchmarks, — а также представила инструменты, изучающие внутреннее определение качества кода для каждой конкретной организации.

Среди клиентов Qodo — крупные предприятия, такие как Nvidia, Walmart, Red Hat, Intuit и Texas Instruments, а также быстрорастущие компании, включая Monday.com и JFrog.

«Каждый год приносил определяющий момент — от Copilot до ChatGPT и полной автоматизации задач, — сказал Фридман. — Сейчас мы вступаем в новую фазу: переход от stateless AI к stateful системам — от интеллекта к „искусственной мудрости“. Именно для этого и создан Qodo».

Комментарии

Комментариев пока нет.