Ускорение интеллекта: анализ генеративного ИИ

Andrew Gordon

Опубликовано 19 нояб. 2025 г.

Краткое содержание

Период с ноября 2022 по ноябрь 2025 года представляет собой «кембрийский взрыв» искусственного интеллекта. Всего за три года Large Language Models (LLM) эволюционировали от текстовых предикторов, способных к легким галлюцинациям, до мультимодальных агентных систем, способных к «PhD» рассуждению и автономной программной инженерии. С выходом Google Gemini 3.0 Pro на этой неделе мы официально вышли из «Эры чат-ботов» и вступили в «Агентную эру».

Этот анализ показывает скачки возможностей по сравнению с ChatGPT от OpenAI (GPT-3.5) на Gemini 3.0 Pro от Google и прогнозирует траекторию моделей Frontier к 2030 году.

Часть I: Исторический анализ (2022–2025)

1. Прорыв в разговоре (Конец 2022 – начало 2023)

Модель якоря: OpenAI GPT-3.5
Ключевые возможности: Нулевая беглость разговора.
Современное состояние: До GPT-3.5 модели были академическими курьёзами. GPT-3.5 демократизировал искусственный интеллект с помощью простого чат-интерфейса.[
Ограничения: Это было строго только текстовое сообщение, склонное к сильным «галлюцинациям» (Фактические ошибки), имел короткую память (4k токены), и испытывал трудности с сложной логикой или математикой. Это был пассивный реагирующий человек, неспособный действовать в реальном мире.

2. Рассужде��ие и мультимодальный скачок (2023 – начало 2024)

Якорные модели: OpenAI GPT-4, Google Gemini 1.0 Ultra
Ключевые возможности: Продвинутые рассуждения и визуальный ввод.
Продвижение: GPT-4 ввел возможность прохождения стандартизированных тестов (например, экзамен на адвоката) и интерпретировать изображения. Заявка Google с Gemini 1.0 представила нативную мультимодальность (натренированный на изображениях и тексте одновременно, а не прикреплённым).
Влияние: Индустрия перешла от «генерации текста» к «решению проблем». Однако задержка была высокой, а затраты для массовых автономных агентов — слишком высокими.

3. Войны контекста и задержки (Середина 2024 – конец 2024)

Якорные модели: Google Gemini 1.5 Pro, OpenAI GPT-4o
Ключевые возможности: Бесконечный контекст и взаимодействие в реальном времени.

4. Эра агентов (2025)

Якорные модели: OpenAI GPT-5, Google Gemini 3.0 Pro
Ключевые возможности: Автономное действие и «кодирование вибрации».
Текущее состояние (Ноябрь 2025):

Часть II: Прогнозы возможностей (2030)

Основанный на «Тройной экспоненции», наблюдаемой с 2022 по 2025 годы (Масштаб вычислений, эффективность данных и архитектурные улучшения), мы можем проецировать возможности Frontier Models (вероятно, эквиваленты «Gemini 6» или «GPT-8») к 2030 году.

1. Эпистемическое агентство и самонаправленные исследования

К 2030 году модели будут обладать Эпистемическое агентство. Они распознают пробелы в собственных знаниях и самостоятельно разрабатывают стратегии для их заполнения.

Рекомендовано компанией LinkedIn

GPT-5 и запутанный путь к искусственному общему…

Ravi Bhogaraju 1 год назад

Художник против ИИ: кто победит?

Walter Shields 3 года назад

Презентация GPT-4o: последний прорыв OpenAI

Enroute 2 года назад

Возможности: Вместо того чтобы галлюцинировать ответ, ИИ скажет: «Я не знаю, но я узнаю.» Затем он запускает подагенты для просмотра живого веба, доступа к защищённым академическим базам данных или даже запуска симуляций для генерации новых данных.
Сценарий использования: ИИ может быть поручен «Мониторинг глобальных цепочек поставок лития и пересмотр контрактов с поставщиками, если прогнозируется дефицит», что не требует никакого вмешательства человека в течение нескольких недель.

2. Генеративная реальность (Голодек Lite)

Мультимодальность эволюционирует в Генеративная реальность.[ Разница между созданием медиа и воплощением реальности будет размываться.

Возможности: Модели будут генерировать высокоточные, точные по физике видеоигры или виртуальные миры в реальном времени на основе голосовых команд. Вы не будете «играть» в игру; вы будете диктовать симуляцию, которую ИИ строит вокруг вас кадр за кадром.
Влияние: Конец статичных развлекательных медиа. Фильмы и игры будут бесконечными, персонализированными потоками, генерируемыми на лету.

3. Контекст токена в 1 миллиард (Окно жизненного контекста)

Окно контекста расширится с миллионов до миллиардов.

Возможности: ИИ сможет поглотить всю цифровую историю корпорации (все письма, Slack, документы, код) или биологическую продолжительность жизни человека (Все медицинские записи, данные носимых устройств, аудиологи).
Влияние: Гиперперсонализация. ИИ будет не просто умным помощником; Это будет идеальный цифровой двойник, который предвидит потребности на основе всестороннего понимания всей жизненной истории пользователя.

4. Научные инновации как услуга

Модели 2025 года могут Получить науки; Модели в 2030 году будут do наукой.

Возможности: Frontier Models уже освоили «язык» биологии (Сворачивание белков) и физику (Материалознание). Они будут предлагать новые химические соединения, моделировать их взаимодействия и разрабатывать лабораторные протоколы для людей (или роботы) Чтобы проверить.
Прогноз: Значительный фармацевтический прорыв (например, новый класс антибиотиков или лечение рака) к 2030 году будет приписан ИИ как основным изобретателем.

5. Вычисления с нулевым интерфейсом (Окружающая разведка)

Интерфейс «Чат» (Доминирующая парадигма 2022-2025 годов) станет устаревшим.

Возможности: ИИ будет интегрирован в операционный и аппаратный уровень (умные очки, наушники, нейроинтерфейсы). Он будет работать проактивно.
Сценарий: Вы не откроете приложение с вопросом «Какой у меня график?» ИИ прошепчет вам на ухо: «Ваша встреча задерживается, поэтому я уже перенёс бронирование на обед на 13:00 и заказал машину.» Интеллект станет невидимой утилитой, как электричество.

Заключение

Если 2022–2025 годы были посвящены обучению компьютерам Говори и смотри, следующие пять лет (2025–2030) будет о том, чтобы научить их Действуй и изобретай. К 2030 году термин «Большая языковая модель», вероятно, будет заменён в пользу «когнитивных архитектур», поскольку текст станет лишь одним из множества входов в системе, способной ориентироваться и изменять физический и цифровой мир.

Источники

Чтобы просмотреть или добавить комментарий, выполните вход

Ускорение интеллекта: анализ генеративного ИИ

Andrew Gordon

Краткое содержание

Часть I: Исторический анализ (2022–2025)

1. Прорыв в разговоре (Конец 2022 – начало 2023)

2. Рассужде��ие и мультимодальный скачок (2023 – начало 2024)

3. Войны контекста и задержки (Середина 2024 – конец 2024)

4. Эра агентов (2025)

Часть II: Прогнозы возможностей (2030)

1. Эпистемическое агентство и самонаправленные исследования

Рекомендовано компанией LinkedIn

2. Генеративная реальность (Голодек Lite)

3. Контекст токена в 1 миллиард (Окно жизненного контекста)

4. Научные инновации как услуга

5. Вычисления с нулевым интерфейсом (Окружающая разведка)

Заключение

Другие статьи участника Andrew Gordon

Другие участники также просматривали

Декодирование генеративного ИИ: тенденции рынка и технологий

GPT-5: Унификация моделей искусственного интеллекта OpenAI и повышение планки

Краткое содержание

Часть I: Исторический анализ (2022–2025)

1. Прорыв в разговоре (Конец 2022 – начало 2023)

2. Рассужде��ие и мультимодальный скачок (2023 – начало 2024)

3. Войны контекста и задержки (Середина 2024 – конец 2024)

4. Эра агентов (2025)

Часть II: Прогнозы возможностей (2030)

1. Эпистемическое агентство и самонаправленные исследования

Рекомендовано компанией LinkedIn

2. Генеративная реальность (Голодек Lite)

3. Контекст токена в 1 миллиард (Окно жизненного контекста)

4. Научные инновации как услуга

5. Вычисления с нулевым интерфейсом (Окружающая разведка)

Заключение

Другие статьи участника Andrew Gordon

Агентное предприятие: как генеративный ИИ и автономные агенты перепишут правила ERP и CRM

Другие участники также просматривали

Декодирование генеративного ИИ: тенденции рынка и технологий

GPT-5: Унификация моделей искусственного интеллекта OpenAI и повышение планки