Вашему вниманию представлен перевод статьи DeepMind’s Losses and the Future of Artificial Intelligence за авторством Гэри Маркуса (Gary Marcus), вышедшей 14 августа на wired.com
Гэри Маркус является основателем и генеральным директором Robust.AI, а так же профессором психологии и нейробиологии в Нью-Йоркском университете. Вместе с Эрнестом Дэвисом он является автором готовящейся к изданию книги «Перезагрузка ИИ: создание искусственного интеллекта, которому мы можем доверять».
DeepMind, принадлежащий Alphabet, потратил 572 млн долларов в прошлом году. Что это может означать?
Что ещё за Alphabet?
Холдинг, владеющий Google и смежными проектами, про которые обычно говорят, что они принадлежат Google, — прим. ИА Красная Весна
DeepMind, вероятно, крупнейшая в мире научно-исследовательская затея в области искусственного интеллекта, быстро тратящая много денег: более 1 млрд долларов за последние три года. У DeepMind также имеется задолженность в размере более 1 млрд долларов, которая должна быть погашена в течение ближайших 12 месяцев.
Значит ли это, что ИИ разваливается?
Ничуть. Исследования стоят денег, и DeepMind наращивает исследования с каждым годом. Долларов привлечено уйма, возможно, больше, чем в любой предыдущий исследовательский проект по искусственному интеллекту, но далеко не беспрецедентно по сравнению с суммами, потраченными на некоторые из крупнейших научных проектов. Большой Адронный Коллайдер стоит около 1 млрд долларов в год, а общая стоимость открытия бозона Хиггса оценивается более чем в 10 млрд долларов. Конечно, подлинный машинный интеллект (также известный как общий искусственный интеллект), который мог бы привести в действие компьютер, подобный показанному в Star Trek, способный анализировать всевозможные запросы, заданные на обычном английском языке, стоил бы гораздо больше.
Всё же рост величины затрат DeepMind стоит учитывать: 154 млн в 2016 году, 341 млн в 2017 году, 572 млн в 2018 году. На мой взгляд, есть три основных вопроса: находится ли DeepMind на правильном пути с научной точки зрения? Являются ли инвестиции такого масштаба разумными с точки зрения Alphabet? И как эти траты повлияют на ИИ в целом?
По первому вопросу есть основания для скептицизма. DeepMind кладет большую часть своих яиц в одну корзину: в метод, известный как глубокое обучение с подкреплением. Этот метод сочетает в себе глубокое обучение, в основном используемое для распознавания шаблонов, и обучение с подкреплением, строящееся на сигналах вознаграждения, таких как набранные очки в игре, победа или поражение в игре вроде шахмат.
DeepMind дал методу свое название в 2013 году в захватывающей статье, в которой было показано, как одна нейронно-сетевая система может быть обучена играть в разные игры Atari, такие как Breakout и Space Invaders, так же или лучше, чем люди. Публикация продемонстрировала инженерное мастерство и, по-видимому, стала ключевым фактором в приобретении DeepMind в январе 2014 года Google. Дальнейшее развитие метода подпитывалось впечатляющими победами DeepMind в Го и компьютерной игре StarCraft.
Что ещё за Atari?
Компания, производившая и издававшая компьютерные игры. В 70-е и 80-е годы на рынке видеоигр Atari занимала лидирующее положение, — прим. ИА Красная Весна
Неприятность в том, что метод очень чувствителен к конкретным условиям. В игре Breakout, например, крошечные изменения, такие как перемещение весла вверх на несколько пикселей — могут вызвать резкое снижение эффективности. В StarCraft у DeepMind результаты имели похожую ограниченность. С лучшими, чем у человека результатами при игре на одной карте с одной «расой», но более скромными итогами на разных картах и с разными расами. Чтобы сменить расу, вам нужно переобучить систему с нуля.
В каком-то смысле глубокое обучение с подкреплением является чем-то вроде прокачанной зубрежки. Системы, которые используют его, способны на удивительные подвиги, но они имеют только поверхностное понимание того, что они делают. Как следствие, нынешним системам не хватает гибкости, и поэтому они не могут компенсировать изменения в мире, порой даже незначительные. (Недавние результаты DeepMind с болезнью почек были подвергнуты сомнению похожим образом.)
Глубокое обучение с подкреплением также требует огромного количества данных — например, миллионы самостоятельных игр в Го. Это гораздо больше, чем человеку потребовалось бы для достижения мирового класса игры в Го, и зачастую сложно или дорого. Это приводит к необходимости использования компьютерных ресурсов масштаба Google, из чего следует, что во многих реальных проблемах одно лишь компьютерное время уже будет слишком дорогостоящим для большинства пользователей. По имеющейся оценке, время обучения для AlphaGo обошлось в 35 млн долларов; по той же оценке, количество потребляемой энергии сравнивалось с энергией, потребляемой 12760 человеческими мозгами, работающими непрерывно в течение трех дней без сна.
Что ещё за AlphaGo?
Искусственный интеллект от DeepMind, специально натренированный на игру в Го. Имеется аналог для игры в StarCraft, который так и называется — AlphaStar, — прим. ИА Красная Весна
Но это всего лишь экономика. Реальная проблема, как мы с Эрнестом Дэвисом утверждаем в нашей готовящейся книге «Перезагрузка ИИ», — это доверие. На данный момент глубокому обучению с подкреплением можно с некоторыми оговорками доверять только в хорошо контролируемой среде. Это отлично работает для Го — ни доска, ни правила не изменились за 2000 лет, но вам бы не захотелось полагаться на него во многих реальных ситуациях.
Скромный коммерческий успех
Отчасти из-за того, что немногие реальные проблемы так ограничены, как игры, на которых сосредоточился DeepMind, DeepMind еще не нашел крупномасштабного коммерческого применения глубокого обучения с подкреплением. До сих пор Alphabet инвестировала около 2 млрд (включая заявленную цену покупки в размере 650 млн в 2014 году). Прямая финансовая отдача, не считая рекламы, была скромной по сравнению с прошлым годом: около 125 миллионов долларов дохода, частично полученные от применения глубокого обучения с подкреплением в Alphabet для снижения затрат на питание для охлаждения серверов Google.
То, что работает для Го, может не работать для сложных проблем, которые DeepMind стремится решить с помощью ИИ, таких как рак и чистая энергетика. IBM узнала об этом на собственном горьком опыте, когда она попыталась взять программу Watson, которая выиграла в игре «Jeopardy!», и с некоторым успехом применить её к медицинской диагностике. Watson прекрасно справлялся с некоторыми случаями и терпел неудачу в других, иногда пропуская диагнозы, такие как сердечные приступы, которые были бы очевидны для студентов-медиков первого курса.
Что ещё за «Jeopardy!»?
Американская теле-викторина, российским аналогом которой является «Своя игра», — прим. ИА Красная Весна
Конечно, это может быть просто вопросом времени. DeepMind работает над глубоким обучением с подкреплением по крайней мере с 2013 года, возможно, дольше, но научные достижения редко превращаются в продукт в одночасье. DeepMind или другие могут в конечном итоге найти способ получить более глубокие, более стабильные результаты с глубоким обучением с подкреплением, возможно, объединив его с другими методами, или не смогут. Глубокое обучение с подкреплением может в конечном итоге оказаться похожим на транзистор, исследовательское изобретение из корпоративной лаборатории, которое полностью изменило мир, или это может быть своего рода академическим любопытством, которое Джон Мейнард Смит однажды описал как «решение в поисках проблемы». Лично я предполагаю, что он окажется где-то посередине, полезным и широко распространенным инструментом, но не изменяющим мир.
Никто не должен сбрасывать DeepMind со счетов, даже если его текущая стратегия окажется менее плодотворной, чем многие надеялись. Глубокое обучение с подкреплением не может быть «королевской дорогой» к общему искусственному интеллекту, но сам DeepMind — это грозное начинание, плотно управляемое и хорошо финансируемое, с сотнями докторов наук. Публичность, порожденная успехами в Го, Atari и StarCraft, привлекает все больше талантов. Если ветры в ИИ смещаются, DeepMind может оказаться в хорошем положении, чтобы переключиться на другое направление. Едва ли кто-то может сравниться с ним.
Между тем в более широком контексте для Alphabet 500 миллионов долларов в год — это не огромная ставка. Alphabet (мудро) сделал другие ставки на ИИ, такие как Google Brain, который сам быстро растет. Alphabet может изменить баланс своего портфеля ИИ различными способами. Но для компании с доходом в 100 миллиардов долларов в год, которая зависит от ИИ во всем — от системы поисковых запросов до рекламных рекомендаций, это не безумие — сделать несколько значительных инвестиций.
Обеспокоенность чрезмерными обещаниями
На последний вопрос о том, как экономическое положение DeepMind повлияет на ИИ в целом, ответить трудно. Если ажиотаж превышает выхлоп, это может привести к «зиме ИИ», при которой даже сторонники не захотят инвестировать. Инвестиционное сообщество фиксирует значительные потери; если траты DeepMind будут продолжать удваиваться каждый год, даже Alphabet может в конечном итоге почувствовать необходимость отступить. И дело не только в деньгах. Ощутимые финансовые результаты также отсутствуют до сих пор. В какой-то момент инвесторы могут оказаться вынуждены пересмотреть свой энтузиазм на счет ИИ.
Тут не только DeepMind. Многие достижения, обещанные всего несколько лет назад, такие как автомобили, способные ездить сами по себе, или чат-боты, которые могут понимать разговоры, — так и не воплощены. Обещания Марка Цукерберга в апреле 2018 года Конгрессу, что ИИ скоро решит проблему фэйковых новостей, уже были смягчены, как и предсказывали Дэвис и я. Разговоры дешевы; конечная степень энтузиазма к ИИ будет зависеть от того, каким будет выхлоп.
Пока что подлинный машинный интеллект было легче рекламировать, чем строить. Хотя в таких ограниченных областях, как реклама и распознавание речи, были достигнуты большие успехи, но ИИ, несомненно, еще предстоит пройти длинный путь. Нельзя отрицать преимущества рационального анализа больших массивов данных. Даже в ограниченной форме ИИ уже является мощным инструментом. Корпоративный мир может стать менее оптимистичным в отношении ИИ, но он не может позволить себе полностью отказаться от него.
Мое собственное предположение?
Через десять лет мы придем к выводу, что в конце 2010-х годов глубокое обучение с подкреплением было переоценено, и что многие другие важные направления исследований игнорировались. Каждый доллар, вложенный в обучение с подкреплением, — это доллар, не вложенный где-то еще, в то время как, например, идеи из когнитивных наук о человеке могут дать ценные подсказки. Исследователи машинного обучения теперь часто спрашивают: «Как машины могут оптимизировать сложные проблемы, используя огромные объемы данных?» Мы могли бы также спросить: «Как дети приобретают язык и приходят к пониманию мира, используя меньше энергии и данных, чем современные системы ИИ?» Если бы мы потратили больше времени, денег и энергии на последний вопрос, чем на первый, мы могли бы добраться до искусственного общего интеллекта намного раньше.
Юрий Носов