Генеральный директор Google DeepMind: AGI ещё через 5–10 лет, и возможности и риски в разработке ИИ идут рука об руку

В финале саммита «AI+SF», проведённого Axios в Сан-Франциско, Демис Хассабис, генеральный директор Google DeepMind, изложил направления исследований DeepMind, технологические достижения, такие как мультимодальные и мировые модели, а также обсудил разработку агентов ИИ и связанные с ними риски. Он также оценил конкуренцию ИИ между США и Китаем и дал редкую оценку хронологии ИИ, полагая, что до появления «систем ИИ с человеческими когнитивными способностями» осталось примерно 5–10 лет.

С благословением Нобелевской ауры научное мышление доминирует в DeepMind

В начале мероприятия ведущий Майк Аллен представил Хассабиса как пятилетнего шахматного вундеркинда и 48-летнего лауреата Нобелевской премии. Хассабис признаёт, что победа в этой награде всё ещё кажется нереальной, но реальное влияние очевидно.

Потому что, когда он разговаривает с государственными чиновниками или трансграничными лицами, принимающими решения, которые не знакомы с ИИ, «Нобелевская премия» — это ключ, который может быстро открыть любую дверь, делая их более готовыми слушать его разговоры о таких вопросах, как безопасность ИИ и ответственное использование, и он планирует в будущем активнее использовать этот титул.

Когда речь заходит о его повседневной работе и стиле управления, Хассабис подчёркивает, что он «всегда на первом месте как учёный, а генеральный директор — на втором месте». По его мнению, научный метод — одно из важнейших изобретений человечества, и он напрямую применяет процесс «формулировки гипотез, проектирования экспериментов и обновления мнений на основе результатов» непосредственно к разработке продукта и организационному управлению.

Преимущества DeepMind связаны с трёх уровнями одновременно: «исследования мирового уровня, инженерные возможности мирового уровня и вычислительная инфраструктура мирового класса». Он считает, что только при одновременном выполнении этих трёх уровней DeepMind сможет быть квалифицирован для лидерства в развитии ИИ.

Планировка на следующие 12 месяцев: мультимодальная эволюция, модель мира и агенты

Говоря о конкретном прогрессе ИИ в ближайшие 12 месяцев, Хассабис отметил, что Gemini с самого начала был разработан как мультимодальная модель, способная одновременно обрабатывать текст, изображения, видео и аудио. Например, его последняя модель изображения «Nano Banana Pro» способна создавать очень точные инфографики, что свидетельствует о быстром улучшении визуальных возможностей модели.

Второе внимание уделяется мировой модели (World Models). Genie 3, разработанный DeepMind, может генерировать интерактивные видео, позволяющие пользователям не только смотреть видео, но и входить на экран, словно входя в игру, сохраняя последовательность и связность в мире примерно на минуту. Такой тип модели считается ключевым шагом в понимании ИИ реальных внешних видов и правил.

Третья — агенты ИИ. Хассабис признал, что нынешние агенты ИИ не могут быть облегчены тем, что напрямую перекладывают целый пакет задач, обеспечивая выполнение с нуля. Но он ожидает, что через год доверие агентов ИИ определённо вырастет. Цель Google — сделать Gemini «универсальным помощником», который не только существует на мобильных телефонах и компьютерах, но и может быть рядом с пользователем в любое время через носимые устройства, такие как очки, став обычным помощником в повседневной жизни и работе.

( тест: Gemini 3 Nano Banana Pro автоматически генерирует юмористические мультфильмы после размышлений, превращая Трампа обратно в маленькую свежую мясную )

Будущее обещает космические исследования, но риски безопасности столь же критичны, как и понимание видео

Говоря о лучших сценариях, которые может предложить ИИ, Хассабис выдвигает гипотезу, что ИИ может помочь человечеству преодолеть ряд ключевых узких мест, таких как ядерный синтез или новые батареи, новые прорывы в материаловедении и полупроводниках, а также решения основных заболеваний, и человеческое общество получит возможность двигаться дальше в освоении космоса с более богатыми ресурсами.

Но он также указал на худший сценарий, который делится на несколько уровней:

Злоумышленники используют ИИ для создания или улучшения патогенов.

ИИ ускоряет кибератаки иностранных сил на критически важную инфраструктуру, такую как энергетика и водные ресурсы, и подобные события, вероятно, будут происходить, но используемый ИИ пока не продвинулся.

Высокоавтономные агенты ИИ отклоняются от своих первоначальных инструкций и человеческих ожиданий, поэтому им приходится вкладывать значительные ресурсы и внимание, чтобы их предотвратить.

Что касается способностей, он считает, что недооценённой частью внешнего мира является глубокое понимание видео ИИ. Хассабис поделился, что однажды попросил Близнецов проанализировать сцену, и модель не только понимает картину, но и даёт очень глубокую интерпретацию символов и эмоций, а не просто описывает поверхностные действия.

Он также отметил, что Gemini Live позволяет получить мгновенную помощь в ремонте, направляя камеру телефона на механическое оборудование, но считает, что по-настоящему идеальным автомобилем будут очки, потому что ваши руки должны быть пустыми во время работы на месте, чтобы одновременно работать и взаимодействовать с ИИ.

Между США и Китаем осталось всего несколько месяцев, а AGI всё ещё в одной-двух милях

Когда речь заходит о международной конкуренции, Хассабис считает, что США и Запад по-прежнему лидируют в целом Китай по возможностям моделей и инновациям, но последние модели Китая, такие как DeepSeek, уже очень сильны, и большинство из них быстро догоняют их благодаря существующим технологиям. Он отметил, что раньше Соединённые Штаты и Запад могли лидировать годами, но теперь осталось всего несколько месяцев впереди Китая.

Хассабис довольно ясно определяет AGI, а именно:

«Вы должны обладать всеми основными когнитивными способностями человека, включая долгосрочное планирование, долгосрочную память, непрерывное обучение, реальное мышление и креативность и так далее.»

Он отметил, что хотя LLM на данном этапе уже способны обращаться к ведущим врачам в некоторых областях, они всё равно будут совершать ошибки во многих случаях, и между настоящим AGI всё ещё существует разрыв, который оценивается в 5–10 лет. Хассабис добавил, что даже если масштаб существующих LLM будет доведён до предела, этого всё равно недостаточно, чтобы преодолеть порог AGI, и области ИИ может потребоваться один-два крупных технологических прорыва, которые значительно улучшат возможности, такие как трансформаторы, прежде чем появится шанс действительно достичь AGI.

(IBM генеральный директор: Индустрия ИИ — это риск, который «трудно восстановить», при этом LLM имеют лишь 1% шансов успешно создать AGI )

Публикация Google DeepMind CEO: AGI — через 5–10 лет, возможности разработки ИИ и риски идут рука об руку, впервые появилась на Chain News ABMedia.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить