Иконка стрелки назад Назад

Кейс: как мы внедрили ИИ в разработку и написали 120 тестов за неделю

Кейс: как мы внедрили ИИ в разработку и написали 120 тестов за неделю
  • Что внедряли: ИИ в разработку личного кабинета
  • Где эффект: фронтенд / бэкенд / data quality / тестирование
  • Результат: 120 тестов / 95% фронта / 50% бэка / 90% data quality
  • Что было до: 4 недели на те же тесты
  • Сколько стоило: $200 + 20 часов CTO

В начале 2026 года мы внедрили ИИ в процесс разработки CyberBrain: обновили личный кабинет, ускорили написание кода и за неделю сделали 120 тестов. Мы пришли к таким результатам с помощью вайбкодинга, который поначалу не воспринимали всерьёз, пока не попробовали.

Внедрение ИИ: кейсы крупных компаний

  • Microsoft — ИИ пишет 20–30% кода в отдельных продуктах и репозиториях.
  • OpenAI — ИИ участвует в создании самого себя. Собственные модели участвуют в разработке и улучшении следующих версий, прежде всего в отладке, тестировании и инженерной поддержке.
  • Anthropic — Claude пишет почти 100% кода, а люди занимаются постановкой задач и ревью. Ранее основатель компании Дарио Амадей прогнозировал уровень 90%, но на практике он оказался даже выше.

Нам казалось, что подобные заявления используют как PR, чтобы замаскировать увольнения и поднять стоимость акций. Но в начале 2026 года мы решили обновили личный кабинет и эксперимента ради подключили к процессу ИИ — в итоге добились таких успехов, которые не уступают кейсам больших технологических компаний.

Результаты внедрения ИИ в разработку

1. Фронтенд

Сейчас около 95% фронтенд-кода личного кабинета пишет ИИ. Речь идёт именно о коде интерфейса.

Обновлённый личный кабинет был сделан за три недели новогодних праздников, тогда как предыдущую версию мы разрабатывали около шести месяцев.

🔽 Ниже — старая и новая версия личного кабинета, сделанная с помощью ИИ.

Картинка
Картинка

2. Бэкенд

По бэкенду доля автоматизации тоже существенная — ИИ пишет 50% кода.

Это типовые задачи: получить цифры из базы в Яндекс Облаке, подготовить их и передать на фронтенд. Именно этот слой сейчас во многом закрывает вайбкодинг.

3. Отладка и качество данных

Отдельный класс задач — отладка проблем, связанных с качеством данных. Для этого CTO сделал Telegram-бота. Под капотом — OpenClaw (ранее Moltbot, о его преимуществах и возможностях мы говорили в посте), который работает с контекстом проекта и структурой данных. Бот знает, какие витрины есть, какие таблицы используются и какие поля участвуют в расчётах.

Сценарий простой:

  • аналитик описывает проблему текстом
  • бот анализирует ситуацию и возвращает ответ

Когда у наших аналитиков есть вопрос, они не идут в ClickHouse, не ищут таблицы вручную и не держат в голове всю архитектуру — потому что они аналитики, а не девопсы. Они просто обращаются к боту в Telegram.

Например, бот может узнать:

  • где лежит таблица с post-click событиями
  • какая витрина отвечает за расчёт конверсий
  • почему не сходятся данные между CRM и отчётом

В ответ мы получаем:

  • название таблицы
  • в каком датасете она находится
  • какие поля участвуют в расчёте
  • что именно нужно проверить

Таким образом, ИИ закрывает 90% типовых запросов по data quality: поиск таблиц / полей / витрин и подсказки для сотрудников.

4. Тестирование

Тест — это воспроизведение конкретного сценария. Например, в базу прилетает нулевое значение, и система не должна упасть. Под такие ситуации пишутся тесты, проверяющие устойчивость и качество кода.

Наши успехи:

  • 80% тестов пишет ИИ
  • двое из трёх разработчиков пишут тесты полностью через ИИ

Кейс: 120 тестов за одну неделю

Самый показательный результат — тестовое покрытие. CTO написал 120 тестов за одну неделю вместо четырёх.

По времени:

  • живого времени CTO ушло около 20 часов
  • примерно половина — на подготовку архитектуры для бота
  • два дня ушло на развёртывание архитектуры
  • далее несколько часов в день на тюнинг, чтобы бот переписывал сам себя и улучшал результат

Бот работал круглосуточно в четырёх-шести потоках. Фактически это четыре-шесть параллельно работающих ботов, которые писали код всю неделю. Это стоило нам подписки Claude Max за $200.

CyberBrain

Запись на демо продукта

CEO CyberBrain расскажет о платформе и предложит лучшее решение ваших задач

Записаться на демо
Картинка

Экономика эксперимента

Все 120 тестов были проверены и приняты командой через pull request.

Фактические затраты:

  • 6 физических дней непрерывной работы моделей
  • 20 часов времени CTO
  • 200$ на подписку Claude Max

Альтернатива:

  • около четырёх недель занятости разработчика
  • 250 000 ₽ в месяц на ЗП + 41% налогов

Как это устроено технически

  • проект полностью развёрнут на локальной машине
  • настроена интеграция с GitHub
  • команда вносит изменения
  • CEO забирает изменения, проверяет расчёты и тесты
  • после проверки код возвращается в основную ветку

Вся работа велась через Claude-бота.

Важное ограничение

Без предварительного понимания архитектуры ИИ будет писать что угодно, но не то что нужно. Подход работает только тогда, когда у вас есть специалист с опытом и пониманием архитектуры, который может задать ИИ правила и держать его в рамках.

Правильный алгоритм работы с ИИ:

  • Человек задаёт жёсткий архитектурный скелет и проверенную структуру.
  • Внутри этих границ ИИ закрывает типовые задачи и выполняет роль линейного специалиста. То есть даже при идеальных условиях это его максимум (на февраль 2026 года). И пока что этим «линейным специалистом» у нас умело дирижируют только CTO и старший технический разработчик.

Дополнительные наблюдения

Ставьте чёткое ТЗ. ИИ лучше работает, когда с ним говорят как с исполнителем, а не собеседником

Мы заметили, что при жёсткой, директивной постановке задачи бот реже уходит в сторону. Иногда это доходило до предельно прямых формулировок, включая крепкие выражения. Похожий эффект описан в исследовании Dobariya & Kumar (2025) на ChatGPT-4o: при одинаковых задачах точность для грубых (Very Rude) запросов была выше, чем для вежливых (Very Polite) — 84,8% против 80,8%. Это не доказывает, что грубость или мат сами по себе улучшают результат, но подтверждает практическую мысль: чем жёстче и конкретнее запрос, тем меньше у модели пространства для самодеятельности.

Не смешивайте разные роли ИИ в одном чате

Когда в одном чате модель постоянно переключают между ролями — разработчик, копирайтер, аналитик — она начинает работать менее стабильно: чаще теряет контекст и допускает ошибки. Этот эффект описан и в исследованиях Anthropic как дрейф поведения модели: при смешении ролей ИИ отклоняется от базовой ассистентской модели и становится менее предсказуемым. Практический вывод простой: один чат — одна роль, а разные типы задач лучше разносить по отдельным потокам.

Ответы на вопросы

Можно ли повторить этот подход без CTO

Можно, если в команде есть человек, который может задать архитектурные правила, держать контекст проекта и выстроить процесс проверки через pull request. Это может быть тимлид или senior-разработчик.

Как контролировать качество ИИ-кода

Через стандартный инженерный процесс: pull request, ревью, тесты, чек-лист приёмки. ИИ ускоряет производство кода, но не заменяет контроль качества.

Какие задачи нельзя полностью отдавать ИИ

Задачи без чётких ограничений и критериев проверки, а также любые изменения, где цена ошибки высока (безопасность, критичная архитектура, финансовые расчёты) — только через строгие правила, ревью и тесты.

Как понять, что ИИ реально даёт эффект

Смотрите на измеримые метрики: скорость закрытия типовых задач, время ревью, количество регрессий / дефектов, рост тестового покрытия, время от идеи до релиза.

Почему у нас всё получилось быстро

Потому что ИИ работал внутри заранее заданных рамок (архитектура + контекст проекта), и все итерации и изменения контролировались командой.

Заключение

ИИ в правильных руках и с пониманием, где его применять, — почти божественное вмешательство в разработку. Особенно это будет заметно в проектах со сменой разработчиков: когда новый человек не ориентируется в кодовой базе, ИИ за несколько минут сам находит места, которые нужно править.

Экономьте время, тестируйте больше гипотез за то же время и закрывайте типовые задачи без привлечения новых специалистов — сегодня это всё подвластно нейронкам. Мы с оптимизмом смотрим на будущее этой технологии и будем делиться с вами результатами применения.

Присмотритесь к вайбкодингу — если подойти к вопросу грамотно, вам понравится.

Больше кейсов, аналитики и уникального контента: t.me/cyberbrainio

CyberBrain

Запись на демо продукта

CEO CyberBrain расскажет о платформе и предложит лучшее решение ваших задач

Записаться на демо
Подождите,
отправляем заявку...
Успешно Заявка успешно отправлена.
Мы свяжемся с вами
Ошибка Ошибка отправки.
Попробуйте ещё раз