→

Отчет команды разработки рантайма dotnet об использовании ИИ в разработке

Публичный пост

25 марта 2026 984

Отчет команды разработки рантайма dotnet об использовании ИИ в разработке

Ten Months with Copilot Coding Agent in dotnet/runtime https://devblogs.microsoft.com/dotnet/ten-months-with-cca-in-dotnet-runtime/

Довольно подробный отчет разработчиков рантайма .NET о том, как они 10 месяцев использовали Copilot Coding Agent: что он делал успешно, что не очень. Сравнивали с людьми и всякое такое. Внутри куча табличек о всяком разном и выводы, довольно занятно. Шорт саммари от гпт вот такой:

Copilot использовался как инструмент под контролем инженеров, с обязательным ревью и высокими требованиями к качеству. За это время он создал 878 pull request’ов, из которых 535 были приняты, но с более низким процентом успешности (~68%), чем у людей (~87%).
Лучше всего ИИ справлялся с простыми, хорошо ограниченными и повторяющимися задачами, тогда как сложная логика и архитектура оставались за людьми.
Все изменения инициировались и проверялись людьми, также применялись AI-инструменты для код-ревью.
Главный вывод: эффективность достигается через сотрудничество человека и ИИ, а не через автономную работу ИИ.

9 комментариев 👇

Evgeniy Petukhov Фулл-стек TypeScript разработчик 27 марта в 10:45

Сейчас будет саркастический комментарий:

Ten Months with Copilot Coding Agent in dotnet/runtime: we decided to switch to Claude Code

Развернуть 1 комментарий

Павел Шефтелевич C++ инженер 25 марта в 19:11

Приятно смотреть на разборы на большом проекте, с какой-то аналитикой и анализом конкретных случаев и ошибок (статистикой можно манипулировать, но тут хотя бы понятно объясняют как её считали)

Вместо потока бесконечных статей в виде "аааа it's over гайз, оно само всё теперь делает!!! " или "Топ 5 вещей которые я понял за 2 часа экспериментов и теперь эксперт"

Спасибо за ссылку

Развернуть 1 комментарий

Pavel Filipovich (Lead?) Data Scientist 26 марта в 21:06

Интересный материал, который у меня вызывает много вопросов
Это внутреняя команда, которая потенциально имеет доступ к разработчикам и бенчмаркам, best practices и иже с ними

И они говорят что не знали как работать с ассистентом и сами вырабатывали подходы как с ним лучше всего работать?

Я сам на проекте пробовал Github Copilot использовать, где-то Июль-Сентябрь 2025
Ощущение было что я действительно с джуном парным программированием занимаюсь
А дома я уже Claude Code использовал - в то же время
И на контрасте Github Copilot выглядел как бесплатная печенюшка к кофе - если дают, то норм
но в здравом уме не куплю

Развернуть 1 комментарий

Pavel Filipovich 26 марта в 21:08

я думал что нормальный excuse если это опыт как раз середины 2025 года
а они ссылаются на PR которые уже были сделаны в 2026 году

аж руки опускаются

Развернуть 1 комментарий

Pavel Filipovich 26 марта в 21:12

опыт использования ассистентов в 2026 (из статьи):
"Please run code coverage, analyze gaps, and add tests to get coverage as close to 100% as possible."

ну блин - вы сами свои (от другой команды Микрософт) материалы не читаете?

или это была тестовая группа...

Развернуть 1 комментарий

Maxim Danilov 26 марта в 21:36

@jugor,

Я сам на проекте пробовал Github Copilot использовать, где-то Июль-Сентябрь 2025

справледливости ради, с тех пор GitHubCopilot сделал большой шаг вперед, особенно если его юзать с Opus 4.6 моделью. За 40 баксов в месяц (на enterprise плане) - бомба.

Развернуть 1 комментарий

Pavel Filipovich 26 марта в 21:39

@maxdanilov, насколько я помню, там проблема была в самом harness (т.е. Гитхаб Копайлоте) и как он взаимодействует с моделью и данными
надеюсь что действительно сделали пригодным для использования

но после Claude Code я бы к Гитхаб Копайлоту даже сейчас только в крайнем случае бы прибегал, если бы у клиента прям жёсткие полиси и ничего другого нельзя и есть наработанная база практик

Развернуть 1 комментарий

Константин Савуся Vue Software Engineer 25 марта в 17:09

😱 Комментарий удален автором поста...

Развернуть 1 комментарий

Тимур Салахов системный аналитик 26 марта в 06:50

Спасибо за ссылку на полезный материал!

Развернуть 1 комментарий

Anatoly Tarasenko CBDO 29 марта в 08:17

Авторы статьи сами подчеркивают что это нельзя трактовать как полноценную количественную оценку тем более как исследование. А жаль. Вот бы как в "Дедлайне" ДеМарко - попросить хотя бы две группы разрабов работать над одной и той задачей - одни без копилота, другие с ним... (впрочем даже тут эксперимент был бы не чистым, т.к. чуваки с копайлотом могли бы попасть под влияние эффекта новизны. или наоборот чуваки без копайлота упоролись бы чтобы доказать что ИИ ненужон)

Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?

Войти или Вступить в Клуб