Роботы наступают - Мартин Форд
Шрифт:
Интервал:
Закладка:
Существует ряд подходов к машинному обучению, но наиболее эффективной и удивительной является методика, связанная с использованием искусственных нейронных сетей — систем, спроектированных в соответствии с теми же фундаментальными принципами, что лежат в основе работы человеческого мозга. Мозг состоит из 100 млрд нейронных клеток и многих триллионов межклеточных связей, но для построения эффективных обучаемых систем достаточно куда более простой системы искусственных нейронов.
Работу отдельного нейрона можно сравнить с выскакивающими пластиковыми фигурками развивающих игрушек, которые так нравятся малышам. Когда ребенок нажимает клавишу, перед ним появляется цветная фигурка — это может быть, например, персонаж мультфильма или животное. Легкое нажатие на клавишу ни к чему не приводит. Даже если нажать чуть сильнее, все равно ничего не произойдет. Но достаточно достигнуть определенного порога усилия — и фигурка тут как тут. Приблизительно так и работает нейрон, за исключением того, что вместо клавиши для его активации требуется определенная комбинация входных параметров.
Чтобы наглядно представить нейронную сеть, вообразите устройство наподобие машины Руба Голдберга[25], которое состоит из нескольких таких развивающих игрушек, составленных рядами на полу. Над каждой клавишей, приводящей в действие фигурки, три механических пальца. Правда, вместо того, чтобы просто выпрыгивать, фигурки так расположены, что срабатывание одной из них приводит к опусканию нескольких механических пальцев в последующих рядах игрушек и нажатию связанных с ними клавиш. Ключевым фактором, определяющим способность нейронной сети обучаться, является возможность регулирования усилия, с которым палец нажимает на соответствующую клавишу.
Чтобы обучить нейронную сеть, необходимо загрузить имеющиеся данные в первый ряд нейронов. В качестве примера можно представить ввод изображений написанных от руки писем. При получении входных данных некоторые механические пальцы нажимают на кнопки с различным усилием, уровень которого зависит от их настройки. Это, в свою очередь, приводит к активации некоторых нейронов и срабатыванию клавиш в следующем ряду. Результатом срабатывания последнего ряда нейронов становятся выходные данные, т. е. ответ. В нашем примере в качестве выходных данных будет получен двоичный код, который укажет на букву алфавита, соответствующую полученному на входе изображению. Сначала ответ будет неверным. Но нужно помнить, что у нашей машины есть встроенный механизм сравнения и формирования обратной реакции. Выходные данные сравниваются с правильным ответом, который известен, что автоматически приводит к корректировке усилия у механических пальцев во всех рядах, а это, в свою очередь, изменяет последовательность срабатывания нейронов. По мере ввода в сеть все новых и новых изображений, сопровождающегося непрерывной калибровкой усилия, с которым пальцы нажимают на клавиши, сеть будет все чаще и чаще выдавать верный ответ. Обучение считается оконченным, когда достигается состояние, при котором частота правильных ответов перестает расти.
Если вкратце, то именно так выглядит процесс, благодаря которому нейронные сети приобретают способность распознавать изображения и речь, переводить с одного языка на другой и выполнять множество иных задач. Результатом обучения является программа — по сути, список всех последних настроек механических пальцев, располагающихся над клавишами активации нейронов, — которая затем может быть использована для конфигурирования новых нейронных сетей. Иными словами, после загрузки программы эти сети смогут автоматически формировать ответы на основе новых данных без повторения обучения.
Впервые идея искусственной нейронной сети возникла в конце 1940-х гг., когда был проведен ряд экспериментов. В течение долго времени они использовались для выявления закономерностей. Однако в последние годы был совершен ряд революционных открытий, которые привели к значительному увеличению производительности, особенно при использовании многоярусных нейронных сетей, построенных по технологии, которая получила название «углубленное обучение» (deep learning). Системы углубленного обучения уже применяются при распознавании речи в голосовом помощнике Siri компании Apple; ожидается, что их внедрение будет способствовать ускорению темпов развития во многих прикладных областях, предполагающих выявление и анализ закономерностей. Например, в 2011 г. ученые из Университета Лугано в Швейцарии спроектировали нейронную сеть со способностью к углубленному обучению, которая смогла правильно идентифицировать свыше 99 % изображений из обширной базы данных о дорожных знаках — с таким уровнем точности не смог сравниться никто из соревновавшихся с системой людей. Исследователи из Facebook также разработали экспериментальную систему, состоящую из девяти уровней искусственных нейронов, которая может определить, что на двух фотографиях изображен один и тот же человек, в 97,25 % случаев, несмотря на условия освещения и ориентацию лица. Для сравнения: участвовавшие в эксперименте люди давали правильный ответ в 97,53 % случаев{125}.
Один из ведущих экспертов в этой области Джеффри Хинтон из Университета Торонто отмечает, что технология углубленного обучения «отлично поддается масштабированию. Просто сделайте ее больше и быстрее, и она будет лучше работать»{126}. Другими словами, даже если оставить в стороне совершенствование принципов работы таких сетей, можно с уверенность утверждать, что системы машинного обучения на основе сетей со способностью к углубленному обучению ждет этап стремительного роста — этот простой вывод следует из закона Мура.
По мере того как работодатели — и в особенности большие корпорации — все больше и больше усиливают контроль над режимом работы и социальными связями своих сотрудников, постоянно расширяя круг отслеживаемых показателей и параметров, большие данные и используемые для их обработки сложные алгоритмы начинают напрямую влиять на условия работы и карьерный рост сотрудников. Так называемая «аналитика трудовых ресурсов» (people analytics) играет все большую роль при принятии компаниями решений о найме, увольнении, оценке результативности и повышении сотрудников. Объем собираемых данных о конкретных людях и о выполняемой ими работе поражает воображение. Некоторые компании контролируют каждое нажатие клавиши каждым сотрудником. Сообщения электронной почты, расшифровки телефонных разговоров, поисковые запросы, обращение к базам данным, доступ к файлам, нахождение на территории работодателя — все эти, а также другие данные самых разных видов, точное количество которых даже трудно определить, подлежат сбору и анализу (в одних случаях с согласия самих сотрудников, а в других — без их ведома){127}. Разумеется, изначально целью сбора и анализа всех этих данных являются повышение эффективности управления и оценка результатов работы сотрудников. Но в определенный момент эти данные могут быть использованы совсем для других целей: например, для разработки ПО, автоматизирующего большую часть выполняемой работы.
Если говорить о последствиях революции в области больших данных для будущего профессий, связанных с умственным трудом, вероятно, стоит выделить два самых главных. Во-первых, во многих случаях собранных данных может оказаться достаточно для автоматизации конкретных задач и даже целых видов профессиональной деятельности. Подобно тому, как человек может научиться новой профессии, изучив опыт предшественников и опробовав его на практике при решении конкретных задач, современные сложные алгоритмы, по сути, способны проделать то же самое и полностью заменить человека. Чтобы убедиться в этом, достаточно вспомнить, что в ноябре 2013 г. компания Google подала заявку на регистрацию патента, описывающего систему, предназначенную для автоматического создания персонализированных сообщений электронной почты и ответов в социальных сетях{128}. Принцип работы системы таков: сначала она анализирует существующие письма и посты в социальных сетях определенного человека. Основываясь на полученных знаниях, она затем автоматически пишет ответы на новые сообщения электронной почты, сообщения в Twitter и посты в блоге, используя при этом характерные для данного человека индивидуальный стиль и манеру письма. Легко представить, как такая система может быть использована в будущем для автоматизации существенной части повседневного общения.
Еще одним примером, указывающим на наиболее вероятное направление дальнейшей эволюции технологий автоматизации с использованием больших данных, являются роботы-автомобили компании Google, впервые представленные в 2011 г. Инженеры Google сразу отказались от идеи создания робота, который бы мог заменить человека за рулем обычного автомобиля, — это в любом случае было бы за пределами возможностей современных технологий искусственного интеллекта. Вместо этого они упростили задачу, спроектировав высокопроизводительную систему обработки данных и поставив ее на колеса. Автомобили Google перемещаются в пространстве, опираясь на точные данные о местоположении, определяемом с помощью GPS в сочетании с огромным объемом чрезвычайно подробных картографических данных. Разумеется, автомобили также оснащены радарами, лазерными дальномерами и иными системами, обеспечивающими непрерывный поток актуальных данных и помогающими машинам адаптироваться к изменению условий и новым ситуациям, таким, например, как выход пешехода на проезжую часть. Причислять водителей к белым воротничкам, конечно, никто не будет, но использованная Google общая стратегия может быть легко применена во множестве других областей. Сначала берется огромный массив исторических данных, на основе которого создается общая «карта», и затем эта «карта» используется специальными алгоритмами при выполнении рутинных задач. Следующий шаг — в игру вступают самообучающиеся системы, которые способны адаптироваться к отклонениям от алгоритма и непрогнозируемым ситуациям. В результате получаем интеллектуальное ПО, которое может качественно выполнять многие виды работ, связанные с умственным трудом.