
Быстрее, проще, дешевле: ИИ становится более доступным
В ближайшие 3 года мировые расходы корпораций на технологии машинного обучения вырастут втрое и достигнут$52,2 млрд. Какие разработки в этой области окажут решающее влияние на развитие бизнеса в ближайшие несколько лет? На какие ключевые тренды в области ИИ нужно обратить внимание сейчас, чтобы не отстать от лидеров?
Искусственный интеллект стоит на 3 китах: это железо, данные и алгоритмы. Умная система видеонаблюдения в магазине, робот-юрист для автоматического составления контрактов или сложнейшая банковская инвестиционная система – все они используют вычислительные мощности для обработки информации, работают на «топливе» из видеофайлов, изображений и документов и на выходе получают результаты работы алгоритма: распознают лицо покупателя, формируют договор или находят источник финансового риска. Давайте разберемся, что сейчас происходит на рынке с этими составляющими любого ИИ-решения.
Железо
Одна из причин сегодняшнего бума в развитии ИИ связана, как это ни парадоксально, с видеоиграми: именно для них компании изначально разрабатывали и совершенствовали графические процессоры (GPU). Когда вы лет двадцать назад играли в шутер, вы вряд ли думали, что помогаете развитию искусственного интеллекта. Дело в том, что обучать искусственные нейронные сети, используя GPU, оказалось удобнее и дешевле, чем с использованием классических процессоров (CPU). Вычислительные мощности, которые десять лет назад казались фантастикой, сейчас доступны любому энтузиасту. Более того, аналитики прогнозируют, что видеокарты продолжат дешеветь на фоне ослабления интереса к криптовалютам и майнингу. Помимо видеокарт, на рынке появляется всё больше специальных решений, созданных для машинного обучения. Проще говоря, железо становится быстрей и дешевле само по себе, а облачные технологии делают его ещё доступней и позволяют легко масштабироваться, если вдруг ваш продукт стал резко расти. Machine learning as a service (MLaaS) в том или ином виде есть и в облаке Amazon, и у Microsoft, и у Google. Эти компании предоставляют в аренду готовые и настроенные для работы машины, что упрощает и ускоряет разработку продуктов и прикладных решений с использованием машинного обучения.
Данные
Если с железом дела обстоят неплохо, то с данными всё не так радужно. С одной стороны, разработчики знают, насколько важны качественные датасеты. Несколько крупных игроков объявили о своих инициативах в этом направлении. К примеру, Google недавно объявила о сервисе для поиска данных Google Dataset Search: пока в системе можно искать информацию об окружающей среде, социальных науках, данные правительственных организаций, со временем будут добавляться новые источники. С другой стороны, всё больше компаний начинают понимать, что данные — это ценный ресурс, который надо беречь и прятать от конкурентов. Пока не очень ясно, какая из двух тенденций возьмёт вверх. В любом случае, открытых данных будет больше, однако, на фоне роста популярности интернета вещей, носимой электроники, дальнейшего проникновения мобильного интернета в самых отдалённых уголках мира, процент «айсберга» данных, который видных учёным, скорее всего, будет всё меньше. Бизнес и пользователи генерируют новые данные значительно быстрее, чем мы успеваем их обрабатывать.
При этом, во многих случаях машинное обучение требует огромного количества узкоспециализированных данных. К примеру, если это рентгеновские снимки, эксперт отмечает на них участки с опухолью, чтобы научить технологию определять такие проблемные зоны самостоятельно. Но как быть, если данных о конкретном типе опухоли слишком мало? Решить проблему «малых данных» призваны новые методы машинного обучения. Пока это отдельные эксперименты, но именно они повлияют на развитие ИИ в бизнесе в ближайшее время. Это перенос обучения (transfer learning) и обучение с первого раза (one-shot learning). Но здесь мы уже от данных плавно переходим к алгоритмам.
Алгоритмы
Метод transfer learning заключается в том, что если обучить глубокую нейронную сеть выполнять одну задачу, то можно будет использовать ту же архитектуру сети для обучения на другом наборе данных. Если говорить совсем просто, то какую бы задачу машинного зрения вы не решали, сначала нужно, чтобы ваш алгоритм умел находить на изображении линии или углы. И если один алгоритм уже научился делать это, пока вы его учили отличать фотографии собаки от фотографии кошки, то дальше этот же алгоритм можно обучать выделять на изображении лицо человека. «Умение» находить линии и углы пригодится в любой задаче машинного зрения, надо переобучить только последние слои сети, отвечающие за то, что называется верхнеуровневыми признаками. ABBYY использует transfer learning в новой версии интеллектуальной платформы FlexiCapture: мы предварительно обучаем сеть для классификации документов на своей стороне, чтобы на стороне партнёра алгоритм мог начать работать на минимальном количестве примеров.
One-shot learning сводится к следующей идее: если мы хотим, чтобы алгоритм распознавал какие-то объекты, то можно заложить в него базовую модель предметной области, которая позволит алгоритму строить правдоподобные гипотезы на минимальном количестве примеров. Это ещё один из способов, направленный на то, чтобы алгоритм начал эффективно работать, получив минимальное количество данных.
Ещё одно значимое направление: обучение с подкреплением. При использовании этого метода нейросеть анализирует обстановку с помощью искусственной модели, которая повторяет особенности внешней среды. В этом виртуальном мире машина учится находить оптимальную цепочку решений для той или иной сложной задачи, получая информацию о том, успешна та или иная цепочка действий только в отдельные моменты, а не на каждом шаге. Один из примеров – это игра в шахматы: перед знаменитым матчем, на котором программа AlphaZero обыграла человека, она поиграла сама с собой 9 часов. За это время она сыграла 44 миллиона партий – в несколько раз больше, чем все шахматные профессионалы за всю историю человечества. А информацию о том, правильно ли были приняты решения или нет, алгоритм получал только в конце каждой партии, когда «узнавал», какая из сторон выиграла. Алгоритмы, обученные с подкреплением, уже не первый год участвовуют в соревнованиях по игре Dota. Год назад алгоритм, созданный Open AI, выиграл у человека один на один. В этом году «команда» ботов не справилась с командой профессиональных игроков-людей. Чем более детерминирована среда, тем проще в ней алгоритму, чем более изменчивая — тем труднее, если среда требует эффективной коммуникации и кооперации, то алгоритмам становится ещё труднее.
Алгоритмы искусственного интеллекта изучают многие десятилетия, но именно сейчас их возможности совпали с задачами крупного бизнеса, а новые технологические разработки делают его все более доступным для банков, нефтяных, энергетических компаний, розничных сетей, телекоммуникационных операторов и других сфер бизнеса. К 2020 году элементы ИИ будут присутствовать в 90% программных продуктов и приложений для корпоративного сегмента – такую оценку приводит компания Oracle. Эти технологии станут приоритетом для инвестиций почти трети компаний в мире и основой для роста мирового ВВП, а в ближайшие 2-3 года помогут снизить ваши затраты, привлекать больше клиентов и повышать доходы.
Иван Ямщиков, старший научный сотрудник Института Макса Планка в Лейпциге, евангелист ИИ в ABBYY