Отчет команды разработки рантайма dotnet об использовании ИИ в разработке

 Публичный пост

Довольно подробный отчет разработчиков рантайма .NET о том, как они 10 месяцев использовали Copilot Coding Agent: что он делал успешно, что не очень. Сравнивали с людьми и всякое такое. Внутри куча табличек о всяком разном и выводы, довольно занятно. Шорт саммари от гпт вот такой:

  • Copilot использовался как инструмент под контролем инженеров, с обязательным ревью и высокими требованиями к качеству. За это время он создал 878 pull request’ов, из которых 535 были приняты, но с более низким процентом успешности (~68%), чем у людей (~87%).
  • Лучше всего ИИ справлялся с простыми, хорошо ограниченными и повторяющимися задачами, тогда как сложная логика и архитектура оставались за людьми.
  • Все изменения инициировались и проверялись людьми, также применялись AI-инструменты для код-ревью.
  • Главный вывод: эффективность достигается через сотрудничество человека и ИИ, а не через автономную работу ИИ.
9 комментариев 👇
Evgeniy Petukhov Фулл-стек TypeScript разработчик 27 марта в 10:45

Сейчас будет саркастический комментарий:

Ten Months with Copilot Coding Agent in dotnet/runtime: we decided to switch to Claude Code

  Развернуть 1 комментарий

Приятно смотреть на разборы на большом проекте, с какой-то аналитикой и анализом конкретных случаев и ошибок (статистикой можно манипулировать, но тут хотя бы понятно объясняют как её считали)

Вместо потока бесконечных статей в виде "аааа it's over гайз, оно само всё теперь делает!!! " или "Топ 5 вещей которые я понял за 2 часа экспериментов и теперь эксперт"

Спасибо за ссылку

  Развернуть 1 комментарий

Интересный материал, который у меня вызывает много вопросов
Это внутреняя команда, которая потенциально имеет доступ к разработчикам и бенчмаркам, best practices и иже с ними

И они говорят что не знали как работать с ассистентом и сами вырабатывали подходы как с ним лучше всего работать?

Я сам на проекте пробовал Github Copilot использовать, где-то Июль-Сентябрь 2025
Ощущение было что я действительно с джуном парным программированием занимаюсь
А дома я уже Claude Code использовал - в то же время
И на контрасте Github Copilot выглядел как бесплатная печенюшка к кофе - если дают, то норм
но в здравом уме не куплю

  Развернуть 1 комментарий

я думал что нормальный excuse если это опыт как раз середины 2025 года
а они ссылаются на PR которые уже были сделаны в 2026 году

аж руки опускаются

  Развернуть 1 комментарий

опыт использования ассистентов в 2026 (из статьи):
"Please run code coverage, analyze gaps, and add tests to get coverage as close to 100% as possible."

ну блин - вы сами свои (от другой команды Микрософт) материалы не читаете?

или это была тестовая группа...

  Развернуть 1 комментарий

@jugor,

Я сам на проекте пробовал Github Copilot использовать, где-то Июль-Сентябрь 2025

справледливости ради, с тех пор GitHubCopilot сделал большой шаг вперед, особенно если его юзать с Opus 4.6 моделью. За 40 баксов в месяц (на enterprise плане) - бомба.

  Развернуть 1 комментарий

@maxdanilov, насколько я помню, там проблема была в самом harness (т.е. Гитхаб Копайлоте) и как он взаимодействует с моделью и данными
надеюсь что действительно сделали пригодным для использования

но после Claude Code я бы к Гитхаб Копайлоту даже сейчас только в крайнем случае бы прибегал, если бы у клиента прям жёсткие полиси и ничего другого нельзя и есть наработанная база практик

  Развернуть 1 комментарий

😱 Комментарий удален автором поста...

  Развернуть 1 комментарий
Тимур Салахов системный аналитик 26 марта в 06:50

Спасибо за ссылку на полезный материал!

  Развернуть 1 комментарий

Авторы статьи сами подчеркивают что это нельзя трактовать как полноценную количественную оценку тем более как исследование. А жаль. Вот бы как в "Дедлайне" ДеМарко - попросить хотя бы две группы разрабов работать над одной и той задачей - одни без копилота, другие с ним... (впрочем даже тут эксперимент был бы не чистым, т.к. чуваки с копайлотом могли бы попасть под влияние эффекта новизны. или наоборот чуваки без копайлота упоролись бы чтобы доказать что ИИ ненужон)

  Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?


Войти  или  Вступить в Клуб