Обновить
39
200.5
Андрей Пешков@runaway_llm

Пользователь

Отправить сообщение

Так и вижу как через месяц в презентации для инвесторов Сэм Альтман рассказывает, что ChatGPT стал ИИ №1 для учителей по всему миру.

можно выключить в настройках же

Я перед написанием новости проверил его гипотезы на обеих подписках. В целом, модели ведут себя примерно так, как он описывает:

У ChatGPT и Claude есть списки самых важных фактов о пользователе, их можно найти и почитать в настройках. По моему опыту, Claude обновляет этот список активнее, ChatGPT добавляет туда что-то новое только если его прямо об этом попросить.

ChatGPT при попытках вспомнить прошлые диалоги, достаточно уверенно вспоминает наши беседы за последние три дня - единственное, что не 15 диалогов, а где-то 20 с небольшим. Когда я прошу вспомнить что-то более древнее, модель пишет "я не вижу полный список твоих старых чатов по датам и названиям — у меня есть только то, что попало в “память” (устойчивые темы) и куски недавних диалогов". Не помогло даже тогда, когда я точно описывал, что было в каком-нибудь старом диалоге.

Claude пытается искать по диалогам как в поисковике - походу, пишет запрос, а затем пробегается по найденным диалогам. У меня он смог найти диалоги, которые мы вели весной и в начале лета. Но не всегда находил точно те, о которых я его просил.

поправил, спасибо! в СhatGPT так и не удалось сегодня с ней поиграться - уже завтра.

500 млрд это цифры из официального анонса Старгейта - https://group.softbank/en/news/press/20250122

1,4 трлн - высказывание Альтмана.

Согласен, что сравнивать годовую выручку с многолетними инвестициями не совсем корректно. Но официального прогонза по выручке OpenAI не дает (как минимум, я не видел). Есть прогноз от HSBC - 213 млрд выручки в 2030 году, но даже с такими цифрами по HSBC они остаются убыточными.

https://economictimes.indiatimes.com/news/international/us/half-trillion-loss-hsbc-says-openai-facing-titanic-cash-burn-through-2030/articleshow/125789463.cms

Я сегодня проверял эту информацию - нашел только заявления на Реддите. Полагаю, сотрудники OpenAI приходят в магазины, говорят "не, даже для нас дорого", разворачиваются и уходят.

Посмотрите на картинку внимательно: The official competition has ended as of December 3rd, 2025 at 5:00 PM EST. Ну и дальше там приписка, что решили не отключать модели после подведения итогов, пусть торгуют сколько влезет.

Про Nof1 интересная гипотеза, с большой вероятностью вы правы.

Это внутреннее название все-таки, наружу выкатят как какую-нибудь GPT-5.5.

Для голосовых ассистентов до сих пор используются упрощенные модели - Gemini 3 Pro и GPT-5.1 там и не пахнет. Но я полностью согласен, что приложение Gemini просто ужасное, сам им почти не пользуюсь.

В Google AI Studio можно попробовать их более новую голосовую модель - https://aistudio.google.com/live?model=gemini-2.5-flash-native-audio-preview-09-2025

BoltzGen предлагает только кандидаты в лекарства, до клинических испытаний (на людях) в любом случае будет несколько лет.

У меня были случаи, когда Gemini 3 Pro думала по 2-3 минуты и в Gemini App, и в Google AI Studio. Если же говорить про GPT-5.1 Extended Thinking, то когда он по 5-7 минут пыхтит, то это очень часто из-за активного использования поисков - модель реально упарывается и перепроверяет в интернете чуть ли не каждый факт в своем ответе. Когда поиск не используется, то GPT-5.1 Thinking тоже очень быстро отвечает, 10-20 секунд.

Временами они сильно нагнетают краски, но я рекомендую почитать прогноз вдумчиво (можно взять LLM-ку, чтобы помогала с переводом и объяснением сложных мест). Так как Кокотайло бывший ИИ-безопасник, то он там между строк дает много интересных фактов о разработке ИИ-моделей, том, как они проверяются на безопасность, и какие техники могут быть использованы при разработке более сложных ИИ.

Google не ловили на вранье в бенчмарках. Плюс уже пошли независимые цифры вроде LMArena, там тоже все хорошо.

Ссылку на карточку заменил на новую, из вебархива.

Просто выложили раньше времени, а сообщество подхватило. В целом Хассабис намекал на старт сегодня, как бы не отложили из-за падения Сloudfare.

Скрыли)

Но главное я в новости пересказал, там примерно 60% model card про организацию безопасности.

Нейронки умеют писать промпты и делают это неплохо.

Но прежде, чем написать промпт, модели нужно понять, что от нее хотят: задачу, формат вывода, ограничения, весь нужный контекст (кто делает, для кого, какие есть ресурсы, делали ли что-то раньше и т. п.)

В персональных задачах достаточно дать модели задачу, попросить первым ответом задать уточняющие вопросы, а затем, получив информацию, ответить. Грубо говоря: "я планирую поехать в Турцию, спроси всю нужную информацию, затем предложи мне три плана поездки". Модель в ответ вывалит целый список вопросов (когда, кто едет, какой бюджет, хочется лежать на пляже или смотреть достопримечательности, готовы ли арендовать машину - и еще десяток вопросов), затем предложит вполне вменяемые варианты.

Если же говорить про руководство выше, то оно заточено больше на API: через него часто строят ИИ-ассистентов, а им надо задать инструкции. Но и в руководстве есть рассказ, как использовать GPT-5.1 для улучшения собственных промптов.

Примерно так. Допускаю, что путаницы может быть больше, но остальные технологии постоянного обучения пока выглядят не лучше. Это одна из самых сложных задач для прогресса ИИ на данный момент.

бенчмарки вышли чуть позже, по ним прямо хорошая модель - https://habr.com/ru/news/963838/

Вы будете смеяться, но в закладках лежит новость о разработке спец-языка для коммуникации ИИ друг с другом. Если завтра основной работой не накроет, то напишу.

Информация

В рейтинге
20-й
Зарегистрирован
Активность

Специализация

Директор по контенту
Ведущий
Управление проектами
Планирование
Стратегическое планирование
Построение команды
Бюджетирование проектов
Организация бизнес-процессов