Обновить

Как ИИ создавал клоны «Сапера»: тест четырех моделей и неожиданные результаты

Время на прочтение6 мин
Охват и читатели15K
Всего голосов 29: ↑25 и ↓4+30
Комментарии16

Комментарии 16

Читал только из-за того что бы увидеть как справился с заданием Gemini 3. И на тебе)

Правда, Gemini CLI работал на версии Gemini 2.5, а не на новейшей Gemini 3.

Чуть выше mistral как мне кажется 🤔. Надо бы зайти в google ai studio и в build попросить.

На рисунках, иллюстрирующих OpenAI Codex и Claude Code видны ошибки в расстановке циферек - у обоих на поле невозможная позиция. Это называется "справилась хорошо"?
Или вы имели в виду, что нейросетка похоже нарисовала скриншот из игры?

Мда

Не удивлюсь если LLM при этом ещё и покрыла код тестами, которые были успешно пройдены.

В этом и есть проблема повсеместного применения llm для написания кода.

Код получается очень похожий на настоящий, компилируется, запускается и делает почти то, что требовалось...

Это неважно! А кто считает иначе - просто отстали от жизни. Пока заказчик заметит несоответствие, вайбкодер успеет сделать ещё несколько проектов.

Простите, а что невозможное у Codex? Или я просто в третьем часу ночи чего-то не понял?..

Скрытый текст

ИИ не давали возможности дорабатывать код после первой попытки, что сделало условия максимально приближенными к реальной разработке

Спасибо, компания Селектел, что поделились особенностями реальной разработки

Тоже поржал с этого. Можно ещё было через N минут генерацию прерывать, мол, дедлайны сорваны, выкатывай уже в продакшн.

Сапёр ошибается один раз...

А что за промт был?

В исходной статье он такой:

Make a full-featured web version of Minesweeper with sound effects that

1) Replicates the standard Windows game and
2) implements a surprise, fun gameplay feature.

Include mobile touchscreen support.

Я бы тоже, хм, призадумался!

Тогда совсем не понятны восторги о этом "чоринге" - он есть в стандартном сапере, требовалось сделать то, что есть в стандартном сапере..

ВАУ!! он сделал то, что есть в стандартном сапере!

С чего вдруг это стало называться "добавил"? Давайте еще восторгаться от того, что добавлены цвета разным цифрам..

Cybersweeper.space.z.ai 6 минут glm-4.6

С первой попытки можно вычесть 2 минуты на деплой

Даже читать не стал! Вообще уважения к читателям нуль и к России! Прочитал фразу  «чординга» да я *** еще *** и *** но читать не стал!

Во первых, как это надо было написать, а во вторых - какие маты вставлять то?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
slc.tl
Дата регистрации
Дата основания
Численность
1 001–5 000 человек
Местоположение
Россия
Представитель
Александр Шилов