Google навела лад у Gemini 2.5 Pro — виправлені накопичені у ІІ-моделі «регресії»
Google випустила велике оновлення своєї найпотужнішої моделі штучного інтелекту Gemini 2.5 Pro. Свіжий варіант покликаний виправити деякі проблеми, що виникли в попередніх версіях, — компанія має намір встановити для нього статус стабільного, тобто він буде підключений до додатку Gemini як основний для широкої аудиторії.
Джерело зображень: blog.google
Попередній випуск Gemini 2.5 Pro з номером версії 05-06 та ім'ям I/O Edition був спрямований на підвищення якості генерованого ІІ програмного коду. В останньому оновленні, стверджує Google, ця навичка була додатково покращена, і в тесті Aider Polyglot модель набрала 82,2%, значно відірвавшись від кращих моделей OpenAI, Anthropic та DeepSeek.
Модель Gemini 2.5 Flash вже вийшла зі стадії попередньої і стала стабільною, тоді як робота над Gemini 2.5 Pro триває — кілька останніх її оновлень спровокували критику щодо якості відповідей на запити, не пов'язані з написанням коду, — їхня якість знизилася порівняно з великим випуском версії 03-25. Google прийняла ці зауваження всерйоз, заявили в компанії, і у свіжому оновленні «закриті проблеми в регресії [щодо] 03-25». Користувачам обіцяно покращені творчі здібності моделі та більш якісне форматування відповідей.
Останнє оновлення Gemini 2.5 Pro 06-05 підтримує гнучке управління ресурсами моделі для розробників, і Google розраховують, що ця збірка отримає статус «довгострокового стабільного випуску». Таким чином, якщо найближчими тижнями цей варіант вийде в додатку для широкої аудиторії та в веб-інтерфейсі, Gemini 2.5 Pro вже не матиме статусу попередньої версії (Preview).
Google традиційно збирає оцінки якості відповідей своїх моделей та наводить рейтинги з платформ LMArena та WebDevArena, де порівнюються можливості різних систем ІІ. На платформі LMArena модель збільшила результат на 24 бали за системою Ело і на 35 балів він виріс на WebDevArena. Моделі ІІ від Google були на вершинах обох рейтингів і досі, тому з виходом чергового оновлення розрив тільки збільшився. Опробувати останню версію Gemini 2.5 Pro можна на хмарних платформах Google Cloud Vertex AI та AI Studio, а також у Gemini.
Источник: 3dnews.ru