Мой робот научился слушать, злиться и даже краснеть (как я прокачал AGI-робота до уровня «почти человек»)

Привет снова, Хабр!
Помните моего робота на Arduino Uno Q с характером? Того, который умел подмигивать и обижаться? Так вот, за пару месяцев он серьезно прокачался. Теперь он не просто ездит и болтает, а:
- 🎤 Слушает ответы после того, как сам поговорил (и отправляет их в LLM для контекста!)
- 🌈 Светится разными цветами в зависимости от настроения (красный = злой, зеленый = радостный, синий = думает)
- 🗣️ Говорит на трех языках (английский, русский, чешский) голосами WaveNet от Google
- 🗺️ Рисует карту комнаты прямо в текстовом режиме
- 🧠 Помнит свои движения, чтобы не застревать в углах как пылесос из 2005-го
В этой статье я расскажу, как превратить простого робота в почти разумное существо, используя мультимодальный Gemini API, и почему мой робот теперь умнее некоторых людей (шутка... или нет?).



















