Все грани искусственного интеллекта

newImg
Искусственный интеллект (ИИ) и машинное обучение применимы во всех областях бизнеса. Попробуем разобраться в том, какие проблемы ИИ помогает решать, каковы перспективы и проблемы на пути развития технологии и насколько с финансовой точки зрения оправданно внедрение и применение ИИ. Кирилл Дубовиков, технический директор компании "Синимекс Дата Лаб", об искусственном интеллекте на comnews.ru
Искусственный интеллект (ИИ) и машинное обучение применимы во всех областях бизнеса. Попробуем разобраться в том, какие проблемы ИИ помогает решать, каковы перспективы и проблемы на пути развития технологии и насколько с финансовой точки зрения оправданно внедрение и применение ИИ.

Какие проблемы ИИ помогает решать

"AI (artificial intelligence) is the new Electricity". Такой фразой открыл доклад в 2017 году один из ведущих в мире специалистов по машинному обучению (МО) Эндрю Ын. Искусственный интеллект (ИИ) и машинное обучение применимы во всех областях бизнеса - ИТ-компаниях, банках, ретейле, страховых компаниях, медицинских учреждениях, промышленных и агропромышленных предприятиях, автомобильных и строительных компаниях и др. В ретейле ИИ помогает отслеживать покупки клиентов и прогнозировать спрос на товары. Крупные производства повышают качество продукции путем тонкой настройки производственных процессов и оборудования, а врачи получают мощный диагностический инструмент. Банки оптимизируют процессы поддержки, а автомобильные компании экспериментируют с беспилотными автомобилями. Современные технологи решают огромный круг задач. Новые варианты применения появляются чуть ли не каждый день, поэтому компании, игнорирующие область анализа данных, рискуют оказаться позади конкурентов.

Любые бизнес-процессы, порождающие данные в цифровом форме, имеют большой простор для улучшений на базе современных технологий анализа данных. В B2C, например, решения на базе ИИ повышают эффективность маркетинга, процент конверсии и удовлетворенность клиентов. В B2B же ИИ может помочь оптимизировать внутренние процессы, предсказать утилизацию ресурсов серверов, упростить работу HR-служб и осведомлять службу безопасности при помощи видеоаналитики.

Какие ожидания у бизнеса от ИИ?

Ожидания у всех разные. В некоторых случаях люди неоправданно оптимистичны и ждут от технологий магии, в других - недостаточно доверяют возможностям алгоритмов. В основном это связано с низкой степенью осведомленности о возможностях современных технологий. Машинное обучение - достаточно свежая для массового рынка технология. Поэтому повышать степень демократизации ИИ - крайне важная задача. Проведение обзорных семинаров и сессий по генерации идей помогает направить ожидания бизнеса в правильное русло и найти практическое решение с наибольшим ROI. У каждой организации внутри - десятки, если не сотни сценариев применения новых технологий. Идеи появляются как внутри, благодаря сотрудникам компании, так и снаружи, от компаний, предоставляющих услуги и продукты в сфере ИИ. Эти идеи требуют оценки и нуждаются в тщательном ранжировании. Понимание базовых принципов работы алгоритмов машинного обучения помогает ответить на вопросы о способах реализации и эффективности каждого проекта.

Каковы перспективы и проблемы на пути развития технологии

Многие этого не замечают, но ИИ уже значительно влияет на нашу ежедневную жизнь: расчетное время прибытия в навигаторах, погода, подсказки слов на телефоне, реклама в социальных сетях - все работает на базе технологий анализа больших данных. В ближайшее время область применения ИИ будет расширяться. Так, Amazon открывает автоматизированные магазины без кассиров, Uber тестирует беспилотные такси, а Google разрабатывает персонального помощника, способного самостоятельно совершать звонки и бронировать столики в ресторанах.

Наука совершила гигантский скачок за последние годы: прорывные результаты исследований, развитие открытых платформ для анализа данных и рост научного и инженерного сообщества расширили горизонты возможного. В качестве примера упомяну международное соревнование ImageNet, открытое в 2010 году. На соревновании необходимо реализовать систему, успешно идентифицирующую объект, изображенный на фотографии. Всего в ImageNet - около 10 тыс. таких объектов и 14 млн изображений. Ошибка человека при определении объекта на фотографии из ImageNet составляет 5,5%, а ошибка глубокой нейронной сети на 2016 год составляла 3,1%.

Ведущие технологические корпорации инвестируют большие средства в открытые платформы машинного обучения, доступные для использования каждому желающему. Наличие открытых библиотек помогает росту сообщества и стандартизации решений.

Без проблем, конечно, не обходится. Даже у крупнейших игроков возникают неожиданные неприятности. Система поиска Google Photos путала людей с животными. Бот Tay от Microsoft был закрыт через несколько дней после выпуска в связи с жалобами на расистские сообщения и некультурную речь. Проблема оказалась в пользователях: бот учился онлайн на потоках сообщений в Twitter. Amazon прекратил использовать систему интеллектуального рекрутинга собственной разработки в связи с тем, что алгоритмы делали систематически нечестный выбор в пользу мужской половины населения.

Во всех случаях проблемы вызваны двумя факторами - данными и метриками. К примеру, проблемы возникали при решении задачи диагностики пневмонии по рентгеновскому снимку. Клиника предоставила набор данных из 30 тыс. снимков легких, где каждый снимок предварительно анализировался врачами-радиологами. Эксперты по компьютерному зрению обучили глубокие нейронные сети и получили точность работы алгоритма, значительно превышающую точность работы врачей. На практике оказалось, что решение не работает. В наборе данных присутствовали снимки, сделанные как в больнице, так и портативным сканером дома у пациента. Последние имели небольшую маркировку в углу. В результате алгоритм обучился решать задачу максимально эффективным способом - отделять больных пациентов от здоровых по наличию маркировки. Причиной послужило то, что большинство случаев, заснятых портативным сканером, были положительными. Если пациент не в состоянии доехать до больницы и врачи вынуждены проводить диагностику с выездом к пациенту, то шансы на обнаружение заболевания высоки. Этот феномен называется утечкой данных. Такие проблемы крайне тяжело выявить на стадии формирования выборки, хотя дефект кажется очевидным после обнаружения.

Таким образом, некачественная подготовка данных может сделать алгоритм нечестным по отношению к определенным группам людей или даже подвергнуть риску их жизни.

Обеспечить честность и непредвзятость ответов моделей машинного обучения - приоритетная задача, стоящая перед научным сообществом. Потенциальных путей решения существует много, но "серебряной пули" пока никто не изобрел.

Вторая проблема - выбор бизнес-метрики - числа, отражающего качество работы системы с точки зрения бизнеса. Так же как и постановка KPI для бизнес-подразделения, метрика будет определять характер работы алгоритма. Неправильный выбор бизнес-метрики приводит к неправильному решению задачи. На старте проекта следует тщательно продумывать способы расчета метрики, определяющей успешность решения. Крайне важно, чтобы это число рассчитывалось быстро и без ручной работы.

Следующая важная проблема - создание гибкого и быстрого процесса разработки. Решения на базе ИИ требуют проведения множественных экспериментов. Часть из них неизбежно безуспешны, поэтому следует максимально уменьшать цену ошибки. Долгие циклы внедрения налагают большие риски на проект. Как следствие, создание организационной среды, позволяющей быстро внедрять и проверять идеи, - фундаментальны для успеха.

Насколько с финансовой точки зрения оправданно внедрение и применение ИИ

Финансовый успех целиком и полностью зависит от целей, которые преследует компания. В первую очередь необходимо найти сценарий применения ИИ, дающий наибольший финансовый рычаг.

Один из наших клиентов - зарубежная микрофинансовая организация. У них возникла идея использовать машинное обучение в пассивной форме для получения отчетов по своей клиентской базе. Отчеты предполагалось строить путем анализа большого объема внутренних и внешних данных по клиентской базе: профили социальных сетей, текстовые сообщения пользователей и др. После совместного исследования мы выяснили, что наиболее эффективным способом использования собранных данных является разработка качественной скоринговой модели на основе алгоритмов машинного обучения. Таким образом, технологии анализа данных могут напрямую принимать участие в бизнес-процессе и положительно влиять на прибыль.

Другая компания искала способы монетизации данных мобильных приложений. Вместе мы разработали подходы к алгоритмизации маркетинга. Разработанные нами интеллектуальные маркетинговые стратегии автоматически сегментируют пользователей, определяют вероятность покупки и шансы оттока клиентов. Результат разработки - платформа, которая может подключать к себе любые мобильные приложения и выдавать их клиентам таргетированные маркетинговые предложения.

С несколькими клиентами мы прорабатываем решения на основе ИИ, нацеленные на уменьшение рисков и операционных издержек. Системы учатся управлять процессами поддержки и мониторинга: маршрутизировать и реагировать на заявки пользователей и осуществлять предиктивный мониторинг оборудования.

ИИ - это шаг вперед или деградация?

С каждым новым витком технического прогресса люди задавались подобными вопросами: автомобили - шаг вперед или деградация? А электричество? Атомная энергия? У каждой медали есть обратная сторона. Область влияния ИИ крайне широка, и использоваться он может как во благо, так и во вред. Пока одни организации решают проблемы потребления энергии, ищут пути для предотвращения суицидов и помогают в определении эмоций обратившегося на горячую линию экстренной службы человека, другие с помощью машинного обучения разрабатывают систему социального рейтинга (или кредита) на государственном уровне. Система оценивает поведение человека 24/7 при помощи камер наружного наблюдения. При наличии видимых отклонений от социальных норм система занижает рейтинг человека. Впоследствии это может влиять на жизнь человека: низкий балл повышает стоимость билетов в общественном транспорте, снижает вероятность устройства на работу в определенные компании или дает повод отказывать в обслуживании в гостиницах и ресторанах. Система социального кредита - не фантастика. Она разрабатывается в Китае с 2014 года, уже внедрена и работает в отдельных городах.

Крупные игроки в области ИИ создали собственные отделы этики. К примеру, в отделении DeepMind Ethics & Society исследуются вопросы о влиянии ИИ на наше общество. Цель этого подразделения - предотвратить пагубные и потенциально опасные сценарии использования новых технологий. Важно понимать, что ИИ - лишь инструмент. Будущее, которое мы строим, полностью зависит от нас. Принятие правильных решений зависит от осведомленности всех слоев общества о возможностях современных технологий. Ждет ли нас прогрессивное и технологическое общество или антиутопия Оруэлла? Покажет только время.

Нужно ли бояться ИИ?

Основная причина страха перед новыми технологиями заключается в непонимании принципов их работы. Сам термин ИИ уже широко употребляется в СМИ, но используется некорректно. В большинстве случаев технологии придается смысл, взятый из художественных произведений, где он - лишь плод фантазии авторов.

На деле же наука еще крайне далека от создания истинного искусственного интеллекта, обладающего способностью рассуждать и действовать, как человек.

При общении с клиентами мы всегда говорим о концепции улучшенного интеллекта (Augmented Intelligence). Основной смысл концепции заключается в том, что технологии улучшают и дополняют человеческую деятельность, делают работу более интересной и простой, а результат - более качественным.

Однако некоторые разработки действительно могут значительно повлиять на жизнь людей. Применение беспилотных автомобилей уже угрожает представителям более 100 профессий. Интеллектуальные HR-системы могут поставить под вопрос необходимость в найме специалиста по набору персонала или, как минимум, снизить потребность в нем. Это далеко не первый случай в истории, когда большое количество людей нуждались в переквалификации. Появление принципиально новых технологий во много раз снижало потребность в представителях одной профессии, создавая кадровый голод в новой, только что образовавшейся области. Как примеры упомянем индустриальную революцию и фермеров, роботизацию производства и работников фабрик, системы документооборота и клерков. О решении этих проблем стоит задумываться на государственном уровне - создавать программы переквалификации и обеспечивать специальные льготы.

Информационная безопасность и ИИ

Информационная безопасность аналитических систем - актуальный вопрос, обсуждаемый научным сообществом. В публикациях перечислено много способов обмануть современные алгоритмы компьютерного зрения. Хороший способ защититься - не допускать возможности совершения подобных атак на практике при помощи построения архитектуры информационной безопасности и учитывать особенности используемых алгоритмов. К примеру, техника под названием adversarial examples может незаметно для человека изменять изображения так, что алгоритмы компьютерного зрения будут совершать серьезные ошибки при их анализе и принимать одни объекты за другие. Для обмана модели также возможно сделать специальный стикер и поместить его на объект или человека.

Информационная безопасность алгоритмов машинного обучения - молодая дисциплина, и пока ей занято не так много исследователей. Тем не менее учеными постоянно разрабатываются новые виды атак и новые методики защиты. Так же как и классическая информационная безопасность, это бесконечная игра в кошки-мышки.

Цена ошибки ИИ для бизнеса

Ошибки в работе алгоритмов неизбежны, как и в работе людей. Как правило, ИИ применяется там, где доля совершаемых системой ошибок меньше, чем у человека, или там, где человек просто не в состоянии сделать выводы из-за необходимости в обработке чрезвычайно большого количества данных.

Чем важнее решения, принимаемые на основе работы алгоритмов, тем выше цена ошибки. Если оценивается вероятность отклика на маркетинговую стратегию, то цена ошибки мала и измеряется бюджетом, который компания готова вложить. Так сказать, "заплатить за опыт". Если же речь заходит об определении аварийной ситуации на производстве или о здоровье человека, то ставки возрастают во много раз. Тщательная проработка процедуры тестирования и оценки качества - неотъемлемый элемент любой задачи машинного обучения.
Источник: Comnews

Форма обратной связи

Предыдущая публикация
Отечественный ИИ всех обогнал
25 марта 2019 | Публикация
Следующая публикация
Компания «Синимекс» штурмует рейтинги
12 ноября 2018 | Публикация