В Европе ретейлеры частично остановили поставки GPU от Nvidia. Владелец магазина техники рассказал, что его поставщик из Германии отменил все заказы на RTX 5090, RTX 5080 и RTX 5070 Ti, сославшись на полное истощение запасов. К отгрузке доступны только RTX 5070 — не больше 5 карточек на магазин. В качестве причин названа переориентация производителя на ИИ — Nvidia получает больше доходов от продаж оборудования для дата центров для обучения систем искусственного интеллекта.
«Все заказы на видеокарты, кроме 5070 на сумму около 20 000 евро, также были отменены. Цены на видеокарты скоро резко вырастут. Amazon Business также значительно ограничивает количество видеокарт, которые можно заказать», — пояснили продавце в ЕС.
Ранее крупный японский ретейлер Tsukumo eX ограничил продажу видеокарт Nvidia GeForce и AMD с 16 ГБ видеопамяти и выше в одни руки. В сети магазинов пояснили, что графические адаптеры с большим объёмом памяти стало труднее достать. В настоящий момент у ретейлера ещё есть запасы, но он не знает, когда прибудет следующая партия и приедет ли она вообще.
Обстановка с ростом цен на ОЗУ: планка на 256 ГБ стоит на $1400 дороже, чем RTX 5090.
Ранее из-за дефицита ОЗУ (бум искусственного интеллекта и скупка любых карт памяти для серверов) 2 плашки памяти на 64 ГБ оперативной памяти в США стали стоить столько же или дороже (после скидки) полуавтоматической винтовки AR15 или как MacBook Air.
Разработчики движка Chromium реализовали поддержку стандарта WebGPU. Новый API включён в стабильные версии Chrome и Edge для Windows, macOS и ChromeOS, а также Chrome для Android. Ранее поддержка WebGPU появилась в Firefox для Windows и macOS, а также в Safari на macOS, iOS, iPadOS и visionOS. На практике это даёт разработчикам единый GPU API, который они могут задействовать во всех основных браузерных движках.
«Сегодня мы запустили децентрализованную сеть для ИИ‑вычислений Cocoon («Кокон») — https://cocoon.org. Она обеспечивает пользователям 100% конфиденциальность при взаимодействии с ИИ. Часть запросов Telegram, связанных с автоматическим переводом сообщений, уже проходит через эту сеть. Разработчики получают доступ к вычислительным ресурсам по более низким расценкам, чем у централизованных провайдеров вроде Microsoft или Amazon. А владельцы видеокарт могут зарабатывать криптовалюту TON в реальном времени, подключая своё оборудование к сети Cocoon», — сообщил Павел Дуров.
Наконец-то у меня появилась Rendition V2200 благодаря подписчику! Осталось найти рабочую Socket 7 или слотовую материнку и можно делать вторую часть стать про самопальную 3D игру для компьютеров 90х :)
Пользователь Reddit под ником Beautiful-Turnip-353 собрал рабочий макет миниатюрной железной дороги на бэкплейте видеокарты, установленной внутри ПК. Энтузиаст использовал один из самых маленьких масштабов поезда (T-gauge, 1:450), где ширина колеи всего 3 мм. Минипоезд приводится в движение платой Arduino, подключённой к USB и подающей 5V PWM-сигнал. Автор планирует реализовать две задумки: подключить поезд к 5V PWM-разъёму для вентилятора на материнской плате, а также сделать так, чтобы скорость поезда будет напрямую зависела от температуры GPU: чем горячее видеокарта, тем быстрее будет ехать поезд.
Основатель Telegram Павел Дуров представил децентрализованную сеть Cocoon (Confidential Compute Open Network), которая будет задействовать искусственный интеллект и блокчейн TON. Проект, запуск которого запланирован на ноябрь 2025 года, предназначен для безопасного и приватного выполнения ИИ-инференса на условиях полной анонимности.
Cocoon представляет собой децентрализованную вычислительную сеть, которая объединяет технологии искусственного интеллекта (ИИ) и блокчейна TON. По словам основателя Telegram, централизованные ИИ-платформы могут собирать и использовать данные пользователей, а Cocoon является альтернативным решением, которое основано на принципах децентрализации и приватности. Владельцы GPU предоставляют создателям ИИ-приложений вычислительные мощности для их работы в обмен на криптовалюту TON, а рядовые пользователи сохранят полную конфиденциальность при работе с ИИ-продуктами. Запуск технологии запланирован на ноябрь 2025 года.
Предполагается, что сеть Cocoon будет работать на основе GPU-майнеров, получающих вознаграждение в Toncoin, а разработчики приложений получат доступ к недорогим ИИ-инструментам. По словам Павла Дурова, Cocoon обеспечит полную приватность и децентрализацию, позволяя интегрировать любые ИИ- агенты, включая DeepSeek и Qwen, без риска утечек.
Примечательно, что на презентации Дуров с иронией добавил, что изначально рассматривал для проекта название Private AI Network, что образует аббревиатуру P.A.I.N. («боль»).
Японская компания Nagao Manufacturing вернула в продажу зеркало для видеокарты в системный блок Graphics Board Mirror Display (NB-VGA-MIRROR) стоимостью $21. Этот аксессуар представляет собой магнитную рамку с зеркалом, которая позволяет пользователям видеть свою видеокарту во всей красе. Также подставка с зеркалом оснащена регулируемым механизмом, который позволяет устанавливать угол наклона от 0 до 90 градусов.
+10% к производительностисервера с конфигурацией AR45-NVMe
Нужна высокая производительность на одном узле, но серверная платформа не по бюджету и избыточна? AR45-NVMe — готовый сервер с передовым десктопным CPU, локальной сетью и быстрыми NVMe-дисками. Решение спроектировано именно для таких задач. Предложение ограничено, успейте заказать сервер по ссылке —>
Характеристики:
CPU: AMD RyzenTM 9 9950X, 16 ядер, до 4.3 ГГц;
RAM: 192 ГБ DDR5 (non-ECC);
Диск: 2×2000 ГБ SSD NVMe M.2;
Сеть и сервис: 1 Гбит/с приватная сеть, безлимитный трафик, SLA 99.8%,защита от DDoS, 24/7 поддержка, 3 часа на замену комплектующих.
Из чего состоит прирост производительности +10%
Высокая частота сокращает задержки в задачах, где важна оперативность: сборки, компиляции, отладки и CI-прогоны реагируют быстрее, потому что ядра решают мелкие задачи быстрее.
Больше RAM значит реже подкачка на диск, меньше простоев из-за swapping и стабильнее in-memory вычисления при аналитике и прототипировании ML.
Низкая задержка и высокая пропускная способность, плюс рост числа операций ввода-вывода в секунду (IOPS). Они ускоряют доступ к временным файлам, БД и scratch-пространству. Которые при хранении в сетевом сторадже тормозят работу.
GPU H200 в новой конфигурации выделенных серверов уже в Selectel
NVIDIA H200 — одна из самых мощных видеокарт для задач искусственного интеллекта с 141 ГБ памяти. В новой конфигурации — восемь GPU в формате SXM. Карты могут обмениваться данными на скорости до 4,8 Тбайт/сек. Поэтому конфигурация точно подходит для машинного обучения и инференса LLM.
Практическое применение:
Можно загружать большие параметры и контексты без постоянного свопа на диск — 141 ГБ vRAM в каждой карте позволяют работать с моделями и батчами, которые раньше требовали шардинга.
Высокая пропускная способность памяти (4.8 ТБ/с) ускоряет подачу данных в тензорные ядра для быстрого обучения и инференса больших языковых моделей и повышения скорости обработки токенов.
NVLink и SXM-формат минимизируют накладные расходы на обмен между GPU, что критично для крупных распределенных пайплайнов.
Selectel уже предлагает конфигурации с современными GPU и серверными платформами и готов собирать выделенные решения под H200-платформы. Берите в аренду 8×H200 в проверенной инфраструктуре вместо покупки и обслуживания собственного кластера.
Мы расширили линейку GPU-карт, которые можно арендовать за рубль при создании кастомных конфигураций выделенных серверов. Список видеокарт пополнила NVIDIA RTX А2000.
Низкопрофильный дизайн позволяет установить GPU в самый компактный корпус сервера, а память GDDR6 с коррекцией ошибок — защитить данные и сохранить точность расчетов.
Какие особенности у RTX А2000
6 ГБ высокоскоростной памяти GDDR6 с ECC,
104 тензорных ядра четвертого поколения,
3 328 ядра CUDA третьего поколения.
Карта подходит, например, для сложных ML-задач, видеомонтажа и работы с графикой.
В облачную платформу Рег.ру добавили новые GPU NVIDIA A4000. Теперь можно решить еще больше запросов на выгодных условиях: от 3D-моделирования и работы в CAD-программах до сложных вычислений и обучения ИИ-моделей. Облачные серверы с GPU позволяют быстро получать результат без собственного оборудования и работают по системе Pay-as-you-go.
Также напомним, что в Облаке Рег.ру доступны видеокарты NVIDIA: А5000 24Гб и А100 80Гб. Попробовать новые NVIDIA A4000 можно уже на сайте.
Для тестирования GPU-сервера YADRO G4208P G3 в конфигурации с восемью Н100 NVL / RTX 4090 мы выбрали бенчмарк на основе реализации обучения для модели GPT-2 на 1,558 миллиарда параметров из репозитория проекта llm.c Андрея Карпаты.
Эта модель была представлена OpenAI в блоге Better Language Models and Their Implications в феврале 2019 года. Тогда для ее обучения требовались команда инженеров и десятки топовых V100, а процесс длился неделями.
Сейчас, шесть лет спустя, достаточно одного сервера с восемью картами H100, а обучение занимает 1–1,6 суток. Все это благодаря развитию GPU, современным библиотекам, таким как CUDA и cuDNN, а также открытым датасетам типа FineWeb-Edu.
Андрей Карпаты показывает, что это возможно даже без фреймворков вроде PyTorch или TensorFlow. Все обучение реализовано примерно в 5 тысячах строк на C и CUDA.
Мы проверили, как справляются серверы YADRO c обучением GPT-2 на 1,6 миллиарда параметров. Обучение на конфигурации G4208P с восемью H100 NVL заняло 38 часов, или примерно 1.6 суток. На графике ниже показываем соотношение времени исполнения 50 шагов обучения на конфигурации G4208P с RTX 4090 по сравнению с конфигурацией на Н100 NVL:
Артём Маклаев с командой, которая занимается оценкой производительности серверных платформ для ИИ-задач в YADRO, поделился в статье результатами десятка тестов GPU-сервера с 8x Н100 NVL / RTX 4090: от инференса моделей распознавания речи до обучения LLM.
Сразу оговорюсь, что пока ко мне едет второй диск под отдельную систему, все тесты представленные ниже проведены на поставляемой в комплекте Windows 11 Pro Сборка 26100.4061 Adrenalin Edition 24.20.64 (Драйверы от AMD) HIP 6.2.4
Что в коробке с Gmktec Evo X-2
Processor: AMD RYZEN AI MAX+ 395 @ 3.00GHz (16 Cores / 32 Threads), Motherboard: GMKtec (1.04 BIOS), Memory: 8 x 16384MB 8000MHz Micron MT62F4G32D8DV-023 WT, Disk: 1908GB ADATA LEGEND 900, Graphics: AMD Radeon 8060S 4GB, Audio: Senary Audio + AMD Streaming Audio Device + AMD HD Audio Device, Monitor: LG ULTRAINE, Network: ASIX AX88179 USB 3.0 Gigabit + Realtek Gaming 2.5GbE + Bluetooth Device (Personal Area ) OS: Microsoft Windows 11 Pro Build 26100, Kernel: 10.0.26100.4061 (x86_64), Display Driver: 32.0.12064.27, OpenCL: OpenCL 2.1 AMD-APP (3628.0), File-System: NTFS, Screen Resolution: 3840x2160
Phoronix test suite Так как я ненастоящий сварщик обзорщик, разобраться как все тесты валить в одну запись в базе пока не сдюжил Кодирование из Av1 в разные качества кодека Av1 с помощью транскодера SVT https://openbenchmarking.org/result/2505227-NE-PORTAL20141
Конечно мы тут собрались не ради синтетики, а ради тестов в задачах локального инференса и тут как раз есть некая сложность в виде как я понял отсутсвия gfx1151 kernel для данного APU
Однако CPU инференс в LM Studio для lmstudio-community/Qwen3-235B-A22B-GGUF/Qwen3-235B-A22B-Q3_K_L-00001-of-00003.gguf Позволил получить для запроса (Слова: 200 / Знаки с пробелами: ~1000)
4.10 tok/sec /1191 tokens / 2.93s to first token / Stop reason: EOS Token Found Однако окно контекста забивается буквально от пары запросов, эксплуатировать такую модель для прикладных задач, а не ради факта локального инференса едва ли будет возможным
Что же касается генерации, то для этого потребуется поддержка GPU, так как процессор совершает менее 1 итерации в секунду, что слишком медленно не только для видео, но и для фото.
С вопросами и предложениями что ещё и как именно протестировать можно сюда
Железка прикольная, многое ещё предстоит в ней проверить, пожелания/предложения - welcome в комментарии
Энтузиасты YouTube-канала Budget-Builds Official запустили Minecraft на ПК с Windows XP, процессором Athlon 64 и видеокартой Pine 3D Phantom XP-2800 2005 года выпуска, которая основана на SiS-чипе и обладает всего 8 МБ видеопамяти.
Изначально версия Minecraft 1.6.4 загрузилась, но выдавала всего 1 кадр в секунду и через две минуты вылетала. Чтобы добиться хоть какой-то стабильности, пришлось отключить все эффекты — облака, туман и анимации, а также снизить разрешение до минимума и использовать пакет текстур 8x8, чтобы предотвратить вылет игры. Даже генерация мира была перенесена на отдельный ноутбук, чтобы повысить производительность. Также игра изначально работала в такой старой конфигурации только на CRT-мониторе.
На YouTube-канале Tech YES City появился необычный эксперимент, в котором автор проверил, как разные версии Windows — 10 и 11 LTSC — ведут себя в современных играх.
Тесты проводились на мощном железе: PC с GeForce RTX 5090 и Radeon RX 9070 XT в разрешениях 1080p и 4K. Например, в Counter-Strike 2 обе версии Windows 10 LTSC — 2019 и 2021 (IoT) — обошли Windows 11 LTSC, причём разница сохранилась даже в 4K. Но здесь же обнаружился парадокс: Radeon RX 9070 XT в 1080p выдал больше кадров, чем RTX 5090, хотя в 4K Nvidia взяла верх.
Для фанатов CS2 и Fortnite оптимальна Windows 10 LTSC 2019, а владельцам свежих GPU, возможно, стоит обратить внимание на IoT-версию 2021 года. Но в некоторых проектах, особенно с упором на DirectX 12, выигрывает Windows 11 LTSC.
Эксперты Hardware Unboxed провели независимое тестирование новой видеокарты Nvidia RTX 5060 Ti в двух версиях — с 8 ГБ и 16 ГБ памяти. Результаты показали, что младшая модель заметно отстаёт в современных проектах, особенно при высоких настройках графики.
В таких играх, как The Last of Us Part II и Horizon Forbidden West, разрыв между версиями достигал 30–80% в разрешении 1440p и 4K. Например, при активации трассировки лучей в Hogwarts Legacy карта с 8 ГБ демонстрировала падение производительности почти в пять раз по сравнению со старшей моделью. Даже в менее требовательных сценариях, возникали резкие просадки до 7 кадров в секунду и вылеты из-за нехватки памяти.
Аналитики советуют избегать покупки RTX 5060 Ti 8 ГБ, несмотря на ее низкую стоимость. Для комфортной игры в разрешении 1080p карта подходит условно, но даже здесь наблюдаются подтормаживания.
Nvidia начала продавать новые видеокарты RTX 5080 и 5090 из «фургона с едой» на своей конференции по технологиям GPU, где участники, заплатившие более $1000 за билет, могут приобрести графические адаптеры вместе с мерчем. Nvidia собирается так продать всего 2000 карт (по 1000 штук RTX 5080 и 5090) в течение трехдневной конференции.