
Dbrain — открытая платформа для краудсорсинга в сфере ИИ
По данным исследовательской компании Tractica, мировой рынок ПО для искусственного интеллекта в ближайшие годы будет стремительно расти. Ожидается, что выручка вырастет с $9,5 млрд в 2018 году до $118,6 млрд к 2025-му. Основную роль в этом сыграет автоматизация на основе технологии машинного обучения, в которой людям отводится важная роль.
Данные важнее алгоритмов
В основе большинства систем ИИ сегодня лежат сверточные (CNN) и рекуррентные (RNN) нейронные сети. Они решают задачи классификации объектов, помогая распознавать устные команды, рукописный ввод, товары на полках, лица на фотографиях, номера автомобилей, дорожные знаки и другие типовые данные.
Такие сети сравнительно легко создать (есть множество готовых инструментов, ускоряющих разработку), но сложно настроить. Для этого требуются огромные массивы данных, которые сейчас есть в распоряжении только самых крупных компаний уровня Google и Facebook.
Более того, основная модель тренировки нейросетей — обучение с учителем. То есть группа людей постоянно контролирует качество данных на входе, оценивает и корректирует результат работы нейросети. С каждым циклом повышается ее точность, и таких циклов требуется неопределенно много. Поэтому подход получил название man in the loop — «человек в цикле (петле)».
Как ИИ создает рабочие места
Проще говоря, чтобы научить ИИ делать рутинную работу, сначала нужно проделать ее самому. Для этого требуется предварительно отсортировать данные вручную и снабдить их метками. Гиганты ИТ-индустрии нанимают тысячи людей, чтобы они выполняли эти скучные задания. Люди часами сидят перед монитором и отмечают на фотографиях разные объекты или набирают увиденные на них слова и цифры.
Если вам нужен быстрый результат любой ценой, эта тактика оправдана, но что делать стартапам, у которых каждый доллар на счету? Где взять данные для обучения? Кому поручить их обработку? Как вариант — воспользоваться технологией краудсорсинга и собрать «с миру по нитке».
Наверняка вы помните вариант капчи (CAPTCHA), в котором вас просят отметить все изображения автобусов, витрин и светофоров. Так вы доказываете, что не робот, а заодно участвуете в обучении систем автопилотов. По сути это бесплатная работа, которая отнимает у вас пару минут в день, а каждый интернет-пользователь становится волонтером поневоле.
Более продвинутый вариант краудсорсинга предлагает Dbrain — открытая платформа для коллективной работы над проектами в сфере ИИ. Ее запустили в 2017 году российские предприниматели Дмитрий Мацкевич, Алексей Хахунов и Дмитрий Девинн. Начало было очень многообещающим.
Объединяющая платформа
Гипотетически для компаний Dbrain может стать мощным инструментом краудсорсинга: с ним нет нужды нанимать людей в штат, считать их трудозатраты и обеспечивать соцпакет. Обычным пользователям это дает гарантированную работу без необходимости обращаться в центры занятости и проходить собеседования.
Основная идея была в том, чтобы удаленно объединить усилия разных людей, работающих над общими проектами в области машинного обучения. Программисты пишут нейросети, компании с доступом к обширной статистике размещают в Dbrain сырые данные для обучения, пользователи их сортируют и снабжают метками, а фирмы покупают наборы размеченных данных или размещают заказы на доработку инструментов под свои специфические требования.
В такой системе обычными средствами было бы сложно учитывать вклад каждого и избегать накруток, поэтому разработчики Dbrain ориентировались на технологию распределенной базы данных в виде цепочки взаимно удостоверяющих блоков (blockchain).
Экономические хитрости
Считается, что расчеты на базе блокчейна максимально защищены от фальсификации, а с учетом экономической ситуации в развивающихся странах криптовалюта может оказаться даже надежнее местных денежных знаков. Для примера взгляните на гиперинфляцию в Сомали и Венесуэле.
Предполагалось, что блокчейн сделает все взаимодействия прозрачными, а выплату вознаграждения — автоматическим процессом, не зависящим от воли отдельных людей. С точки зрения теории игр такое кооперативное взаимодействие называется игрой с ненулевой суммой, или биматричной. Смысл в том, что в ней нет проигравших: в результате совместных усилий все участники остаются в выигрыше. Американские экономисты называют такую стратегию win-win, а по-русски это называется взаимовыгодным сотрудничеством.
Однако на практике всегда есть те, кто извлекает большую прибыль, и те, кто ее физически обеспечивает своим трудом. В алгоритмы Dbrain заложена комиссия 10%, взимаемая с любой операции для поддержания самой платформы. Также не будем забывать, что команда Dbrain получает доллары от инвесторов и заказчиков, а платит за труды по разметке данных в токенах с очень волатильным курсом и непредсказуемой судьбой. Живые деньги зачисляются на счета Dbrain сразу, а выплату в криптовалюте приходится долго ждать безо всяких гарантий.
У Dbrain был очень быстрый старт, но затем что-то пошло не так. Все платежи происходили в форме внутренней криптовалюты dbraincoin (DBR) — токенах на платформе Etherium. Их первичное предложение было отмечено премией ICO Pitch Competition в Кремниевой долине и принесло компании в апреле — июне 2018 года $2,5 млн инвестиций на посевном раунде.
Компания оставила себе 30% всех токенов и еще 20% поместила в резерв. Стартовая цена выставленных на продажу токенов была $2. Они до сих пор не торгуются а криптовалютных биржах,что вызывает немало вопросов.
Реакция общественности
У компании есть англоязычный чат в Telegram, который создавался в расчете на привлечение зарубежных инвесторов и активистов. Сейчас он изобилует гневными сообщениями. Люди пишут о том, что даже спустя полгода после ICO так и не произошло перераспределение токенов, а они устали ждать, когда им начислят вознаграждение.
Первые начисления произошли только в конце декабря 2018 года, причем минимальная сумма выплаты составила $100. Многие набрали меньше и не смогли получить деньги. Это сильно контрастирует с заявлением команды Dbrain о том, что «каждый немедленно получает выплаты за выполнение простых заданий», а платформа технически способна «обрабатывать тысячи защищенных транзакций каждую секунду». Судя по разгоревшейся дискуссии, многие люди до сих пор ждут начислений как за проделанную работу, так и за поддержку на раннем этапе через BountyHive.
Представители Dbrain пока оставляют уклончивые ответы насчет сложившейся ситуации (…we are in touch with BountyHive and hope to resolve the situation soon). Иногда они просят набраться терпения и угрожают удалить из чата особо гневливых (…try to stay polite and be patient, otherwise we’ll have to remove you from this chat) либо вовсе никак не комментируют эти сообщения.
Перезапуск
Весной этого года произошел своеобразный ребрендинг: Dbrain ушла в тень, а сообществу явился новый проект Handl, основанный на Dbrain. Это краудсорсинговая платформа для разметки данных с теми же инструментами. Она хорошо подходит для выполнения рутинных операций по маркировке данных, кроме тех случаев, когда от человека требуются специальные познания — например, в какой-то области науки или владение иностранными языками. На данный момент Handl поддерживает только русский и английский.
Разработчики заявляют, что сейчас Handl объединяет более 25 тысяч исполнителей и аккумулировал свыше 6 млн промаркированных фрагментов данных. Заказчикам услуга предоставляется по модели почасовой оплаты или подписки. Один человеко-час работы краудсорсинговой команды стоит $3. Самостоятельное использование утилит Handl для маркировки данных обойдется в $399 за месяц. Посмотреть, как они выглядят, и опробовать их можно на демонстрационных примерах прямо из браузера.
На фоне новой восходящей звезды Handl все посвященные Dbrain ресурсы приходят в запустение.В официальном твиттере и русскоязычном телеграм-канале Dbrainio последние сообщения датируются 4 марта 2019 года. На Medium публикации от команды Dbrain прекратились в январе.
Англоязычный чат Dbrain, объединивший более 4 тысяч человек, пока еще держится. Последнее информативное заявление от команды Dbrain в нем было сделано 12 апреля. В нем администратор чата Екатерина (@katkek) уверила, что «Dbrain все еще существует» и обратила внимание на то, что проект Handl является частью Dbrain. Также она пояснила позицию компании: «Причина, по которой мы откладываем решение по программе вознаграждений, заключается в том, что мы не нашли способа удовлетворить запросы каждого. Мы сотрудничаем с Bountyhive и пытаемся найти решение вместе».
Вместо заключения
Сейчас Dbrain налаживает партнерство с крупными компаниями и предлагает услуги по доработке приложений с элементами ИИ под нужды заказчиков. Например, недавно они доработали функцию оптического распознавания текста для консьерж-сервиса Alfred. На уровне B2B взаимодействия Dbrain происходят по классической схеме «деньги за услугу». Ситуация внутри самой краудсорсинговой платформы остается неясной. Как и большинству простых пользователей, выполнявших задания Dbrain, нам тоже остается набраться терпения и посмотреть, что выйдет из этого амбициозного проекта.