20.09.2018
машинное обучение

Алгоритмы машинного обучения: гордость и предубеждение

Рейтинг:  5 / 5

Звезда активнаЗвезда активнаЗвезда активнаЗвезда активнаЗвезда активна
 

В течение последних двух десятилетий, с появлением мощных компьютеров, интернета и массового оцифровывания информации, машинное обучение переживает настоящий бум.

Сам же термин используется в науке уже более полувека, для описания запрограммированного распознавания образов. Концепция еще старше, математики впервые начали говорить о таких процессах в начале XIX века. Аналитики компании McKinsey размышляют над преимуществами использования алгоритмов машинного обучения в бизнесе и над рисками, связанными с ним. Подробнее в адаптированном переводе материала.

Миф про совершенный интеллект. Машинное обучение в сфере искусственного интеллекта все чаще касается процесса принятия решений с помощью компьютера, что основывается на статистических алгоритмах. Среди наиболее очевидных применений модели прогнозирования, которые широко используются в известных бизнес-приложениях, например, для автоматического предоставления рекомендаций клиентам или для процесса одобрения кредитов. В автоматизированных бизнес-процессах алгоритмы машинного обучения принимают решения быстрее и дешевле, чем люди. Машинное обучение также обещает улучшить качество принятия решений вследствие предполагаемого отсутствия человеческих предубеждений.

Однако, взглянем правде в глаза: искусственный интеллект так же склонен к предвзятости, как и люди. Например, при оценке кредитоспособности клиентов, в многолетней истории кредитного обслуживания которых не наблюдается правонарушений, обычно определяются, как клиенты с низким риском. Но представьте, что ипотечные кредиты этих клиентов оплачивались в течение многих лет за счет существенных налоговых льгот, которые больше не предоставляются. Степень риска меняется, однако, если программа об этом «не знает», она не может дать адекватную оценку. Более того, машинное обучение может увековечивать и даже усиливать поведенческие предубеждения людей. Мы все сталкиваемся с этой проблемой в социальных сетях: фильтрация ленты новостей базируется на пользовательских предпочтениях, тем самым усиливая естественное предубеждение читателей. Сайт может даже систематически предотвращать появление доказательств противоположной точки зрения.

Предубеждение алгоритмов один из крупнейших рисков, ведь для бизнеса он может стать причиной дорогостоящих ошибок, направляя проекты и цели организации в ложном направлении. Хорошая новость заключается в том, что при условии осознания этой проблемы, предубеждения в алгоритмах можно выявлять и исправлять.

Решение проблемы предвзятости на трех уровнях

Можно принимать меры для устранения предвзятости или защиты от ее разрушительных последствий. Для этого пользователи алгоритмов машинного обучения, во-первых, должны понимать недостатки алгоритма, которым они пользуются, и воздерживаться от вопросов, ответы на которые будут однозначно порочными через предубеждения алгоритма. Использование моделей машинного обучения больше похоже на езду на автомобиле, а не на лифте. Чтобы добраться от точки A до точки B, пользователи могут просто нажать кнопку; они должны сначала узнать про рабочие процедуры, правила дорожного движения и практику безопасности.

Во-вторых, специалисты по обработке данных, которые разрабатывают алгоритмы, должны формировать образцы данных таким образом, чтобы возможность возникновения предубеждения была минимизирована. Этот шаг является важной и сложной частью процесса. На данный момент заметим, что доступные исторические данные часто являются недостаточными для этой цели, а свежие, объективные данные должны быть сформированы с помощью контролируемого эксперимента.

В-третьих, руководители компаний должны знать, когда использовать, а когда не использовать алгоритмы машинного обучения. Они должны понимать настоящие ценности, связанные с компромиссом: алгоритмы предлагают скорость и удобство, тогда как модели, разработанные вручную (как вот традиционные «деревья решений» или логистическая регрессия), являются более гибкими и прозрачными.

Что в вашем черном ящике?

Рассмотрим подробнее роль пользователей. С точки зрения пользователя, алгоритмы машинного обучения это черные ящики. Они предлагают простые и быстрые решения для тех, кто знает мало или вообще ничего о том, что находится внутри. Их используют на свое усмотрение. Но усмотрение должно основываться на знаниях. Бизнес-пользователи, которые стремятся избежать вредных применений алгоритмов, несколько похожие на потребителей, которые стремятся есть здоровую пищу: таким потребителям необходимо изучить литературу о питании и читать этикетки, чтобы избежать избыточных калорий, вредных добавок или опасных аллергенов. Пользователи также должны изучать алгоритмы, которыми они пользуются в ходе осуществления своей деятельности.

Например, при оценке кредитоспособности встроенное предубеждение стабильности препятствует алгоритмам машинного обучения учитывать определенные быстрые поведенческие изменения заявителей на получение кредита. Предметом, который часто становится признаком риска в этом контексте, является срок кредитования. Клиенты с более высокой степенью риска, как правило, отдают предпочтение более длительным по срокам кредитам, несмотря на возможные трудности в возврате средств. Много клиентов с низким уровнем риска, наоборот, стремятся минимизировать расходы на проценты, выбирая кредиты с коротким сроком выплат. Алгоритм машинного обучения ухватится за такую модель, предоставляя заявкам на получение кредита с более длительным сроком высшую оценку риска. Однако, если клиент, именно с целью избежания получения высокой оценки риска, выберет кредит с коротким сроком, а потом не сможет выполнить свои обязательства из-за высокой суммы ежемесячного платежа (за короткий срок кредита), система не сможет отреагировать на такое поведение, что повлечет за собой рост кредитных убытков.

Роль организаций-пользователей

Учреждение, которое рассматривает возможность использования алгоритма для решения бизнес-проблемы, должно руководствоваться стремлением достичь компромисса в вопросе затрат и преимуществ. При выборе алгоритмов машинного обучения стоит обратить внимание на такие вопросы:

Как быстро нам нужно решение? Фактор времени часто имеет первостепенное значение для решения бизнес-задач. Оптимальная статистическая модель может быть устаревшей к моменту завершения. Когда деловая среда быстро меняется, алгоритм машинного обучения, разработанный в течение ночи, может значительно превзойти традиционные модели, на разработку которых тратятся месяцы. По этой причине алгоритмы машинного обучения являются лучшими для борьбы с мошенничеством.

Какова наша аналитическая картина? Работа алгоритмов зависит от данных. Если количество входных данных недостаточна, часто лучше привлечь консультанта, чтобы помочь организации разработать их.

Какие проблемы стоит решить? Одним из обещаний машинного обучения является то, что оно может решать проблемы, которые прежде не признавались или считались слишком дорогими для решения с помощью ручных моделей. Решая задачи, такие учреждения должны определить те, которые существенно влияют на хозяйственную деятельность, и привлечь лучших специалистов по обработке данных для их решения.

Реализация

Как компания может реализовать эти рекомендации? Критически важными являются такие аспекты:

1. Бизнес-стандарты для утверждения машинного обучения. Необходимо разработать шаблон для документации моделей, стандартизирует процесс принятия заявок на моделирование. Он должен включать бизнес-контекст и быстрые запросы с конкретными вопросами про бизнес-влияние, данные и компромиссы относительно трат и расходов. Такой процесс предусматривает активное участие пользователей для поиска наиболее приемлемого решения бизнес-проблемы (обратите внимание, что пассивные контрольные списки или наставления, как правило, игнорируются). Необходимо определить ключевые параметры модели, включительно со стандартным набором анализов, которые будут выполняться на исходных данных, обработанный образец и результаты моделирования. Модель необходимо обсудить с бизнес-пользователями.

2. Профессиональная проверка алгоритмов машинного обучения. Необходим четкий процесс для проверки и утверждения алгоритмов машинного обучения. В зависимости от отрасли и бизнес-контекста, особенно экономических последствий ошибок, он может быть не таким же жестким, как формальная проверка моделей рисков банков, однако, процесс должен создать стандарты проверки и постоянную программу мониторинга новой модели. Стандарты должны учитывать характеристики моделей машинного обучения, например, автоматические обновления алгоритма при появлении новых данных. Если алгоритмы обновляются например неделю, то процедуры проверки должны быть завершены в течение нескольких часов или дней, а не недель или месяцев.

3. Культура постоянного развития знаний. Организации должны инвестировать в разработку и распространение знаний в области информационных технологий и бизнес-приложений. Необходимо постоянно следить за новыми идеями и лучшими практиками в области применения машинного обучения, чтобы создать культуру улучшение знаний и с целью информирования о трудности и преимущества, которые возникают при использовании таких программ.

  1. Последние
  2. Популярные
Загрузка...

Новости технологий сегодня

Самые популярные метки