Ольга Карпова , редактор CyberBrain

Кейс CyberBrain: внедрение ИИ в разработку — 120 тестов за неделю и 90% AI-кода

У вайбкодинга, как и у любой горячей темы, много противников. Мы сами долгое время не воспринимали его всерьёз, особенно когда успехами делились крупные игроки и AI-корпорации, которые продвигают свои продукты.

Microsoft — ИИ пишет 20–30% кода в отдельных продуктах и репозиториях.
OpenAI — ИИ участвует в создании самого себя. Собственные модели участвуют в разработке и улучшении следующих версий, прежде всего в отладке, тестировании и инженерной поддержке.
Anthropic — Claude пишет почти 100% кода, а люди занимаются постановкой задач и ревью. Ранее основатель компании Дарио Амадей прогнозировал уровень 90%, но на практике он оказался даже выше.

Нам казалось, что подобные заявления используют как PR, чтобы замаскировать увольнения и поднять стоимость акций. Но в начале 2026 года мы решили обновили личный кабинет и эксперимента ради подключили к процессу ИИ — в итоге добились таких успехов, которые не уступают кейсам больших технологических компаний.

Результаты внедрения ИИ в разработку

1. Фронтенд

Сейчас около 95% фронтенд-кода личного кабинета пишет ИИ. Речь идёт именно о коде интерфейса.

Обновлённый личный кабинет был сделан за три недели новогодних праздников, тогда как предыдущую версию мы разрабатывали около шести месяцев.

🔽 Ниже — старая и новая версия личного кабинета, сделанная с помощью ИИ.

2. Бэкенд

По бэкенду доля автоматизации тоже существенная — ИИ пишет 50% кода.

Это типовые задачи: получить цифры из базы в Яндекс Облаке, подготовить их и передать на фронтенд. Именно этот слой сейчас во многом закрывает вайбкодинг.

3. Отладка и качество данных

Отдельный класс задач — отладка проблем, связанных с качеством данных. Для этого CTO сделал Telegram-бота. Под капотом — OpenClaw (ранее Moltbot, о его преимуществах и возможностях мы говорили в посте), который работает с контекстом проекта и структурой данных. Бот знает, какие витрины есть, какие таблицы используются и какие поля участвуют в расчётах.

Сценарий простой:

аналитик описывает проблему текстом
бот анализирует ситуацию и возвращает ответ

Когда у наших аналитиков есть вопрос, они не идут в ClickHouse, не ищут таблицы вручную и не держат в голове всю архитектуру — потому что они аналитики, а не девопсы. Они просто обращаются к боту в Telegram.

Например, бот может узнать:

где лежит таблица с post-click событиями
какая витрина отвечает за расчёт конверсий
почему не сходятся данные между CRM и отчётом

В ответ мы получаем:

название таблицы
в каком датасете она находится
какие поля участвуют в расчёте
что именно нужно проверить

Таким образом, 90% задач по data quality теперь закрывает ИИ.

4. Тестирование

Тест — это воспроизведение конкретного сценария. Например, в базу прилетает нулевое значение, и система не должна упасть. Под такие ситуации пишутся тесты, проверяющие устойчивость и качество кода.

Наши успехи:

80% тестов пишет ИИ
двое из трёх разработчиков пишут тесты полностью через ИИ

Кейс: 120 тестов за одну неделю

Самый показательный результат — тестовое покрытие. CTO написал 120 тестов за одну неделю вместо четырёх.

По времени:

живого времени CTO ушло около 20 часов
примерно половина — на подготовку архитектуры для бота
два дня ушло на развёртывание архитектуры
далее несколько часов в день на тюнинг, чтобы бот переписывал сам себя и улучшал результат

Бот работал круглосуточно в четырёх-шести потоках. Фактически это четыре-шесть параллельно работающих ботов, которые писали код всю неделю. Это стоило нам аж целой подписки Claude Max.

Экономика эксперимента

Все 120 тестов были проверены и приняты командой через pull request.

Фактические затраты:

6 физических дней непрерывной работы моделей
20 часов времени CTO
200$ на подписку Claude Max

Альтернатива:

около четырёх недель занятости разработчика
250 000 ₽ в месяц на ЗП + 41% налогов

Как это устроено технически

проект полностью развёрнут на локальной машине
настроена интеграция с GitHub
команда вносит изменения
CEO забирает изменения, проверяет расчёты и тесты
после проверки код возвращается в основную ветку

Вся работа велась через Claude-бота.

Важное ограничение

Без предварительного понимания архитектуры ИИ будет писать что угодно, но не то что нужно. Подход работает только тогда, когда у вас есть специалист с опытом и пониманием архитектуры, который может задать ИИ правила и держать его в рамках.

Правильный алгоритм работы с ИИ:

Человек задаёт жёсткий архитектурный скелет и проверенную структуру.
Внутри этих границ ИИ закрывает типовые задачи и выполняет роль линейного специалиста. То есть даже при идеальных условиях это его максимум (на февраль 2026 года). И пока что этим «линейным специалистом» у нас умело дирижируют только CTO и старший технический разработчик.

Дополнительные наблюдения

Ставьте чёткое ТЗ. ИИ лучше работает, когда с ним говорят как с исполнителем, а не собеседником

Мы заметили, что при жёсткой, директивной постановке задачи бот реже уходит в сторону. Иногда это доходило до предельно прямых формулировок, включая крепкие выражения. Похожий эффект описан в исследовании Dobariya & Kumar (2025) на ChatGPT-4o: при одинаковых задачах точность для грубых (Very Rude) запросов была выше, чем для вежливых (Very Polite) — 84,8% против 80,8%. Это не доказывает, что грубость или мат сами по себе улучшают результат, но подтверждает практическую мысль: чем жёстче и конкретнее запрос, тем меньше у модели пространства для самодеятельности.

Не смешивайте разные роли ИИ в одном чате

Когда в одном чате модель постоянно переключают между ролями — разработчик, копирайтер, аналитик — она начинает работать менее стабильно: чаще теряет контекст и допускает ошибки. Этот эффект описан и в исследованиях Anthropic как дрейф поведения модели: при смешении ролей ИИ отклоняется от базовой ассистентской модели и становится менее предсказуемым. Практический вывод простой: один чат — одна роль, а разные типы задач лучше разносить по отдельным потокам.

Заключение

ИИ в правильных руках и с пониманием, где его применять, — почти божественное вмешательство в разработку. Особенно это будет заметно в проектах со сменой разработчиков: когда новый человек не ориентируется в кодовой базе, ИИ за несколько минут сам находит места, которые нужно править.

Экономьте время, тестируйте больше гипотез за то же время и закрывайте типовые задачи без привлечения новых специалистов — сегодня это всё подвластно нейронкам. Мы с оптимизмом смотрим на будущее этой технологии и будем делиться с вами результатами применения.

Присмотритесь к вайбкодингу — если подойти к вопросу грамотно, вам понравится.

Больше кейсов, аналитики и уникального контента: t.me/cyberbrainio