• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

12 интересных книг об искусственном интеллекте

От научно-популярной манги до фундаментального учебника по подготовке и разметке данных

ISTOCK

Всего пять лет назад выход любой книги о машинном обучении, нейросетях или какой-либо другой технологии искусственного интеллекта становился настоящим событием. Переводные новинки, а тем более труды отечественных авторов можно было пересчитать по пальцам одной руки. Сейчас ситуация изменилась: калейдоскоп обложек, десятки названий, тысячи страниц. Что почитать самому, будь ты опытный аналитик данных или пока начинающий инженер, а что можно порекомендовать подростку, своей девушке или пожилым родителям для быстрого и популярного знакомства с ИИ? В подборке от IQ.HSE каждый сможет найти книгу для себя. Сюда включены только те издания, что вышли на русском языке и доступны для покупки и прочтения.

Для всех

Занимательная манга. Искусственный интеллект

Автор текста: Сакамото Маки. Художник: Савада

В российских магазинах самые востребованные комиксы — японская манга. При этом среди жутко популярных у тинейджеров сёнэн, сёдзё и прочего яой и юри периодически встречается настоящая жемчужина для любителей научпопа — серия «Образовательная манга». В ноябре 2022 в ней вышла уже 48 книга, на этот раз посвященная искусственному интеллекту. Впрочем, подход к теме японские популяризаторы делали уже неоднократно — здесь и такой важный для любого аналитика данных раздел математики, как «Линейная алгебра», и вышедшая ещё в 2020 году манга про «Машинное обучение».

Скажу сразу, несмотря на свою огромную любовь к серии, предзаказ книги с момента выхода анонса и ежедневно отдавливаемую клавишу F5 при посещении сайта издательства, манга «Искусственный интеллект» оказалась первой и единственной, которая разочаровала меня в этой серии. Во-первых, во всех предыдущих комиксах был сюжет, чаще всего построенный вокруг какой-то любовной линии, симпатичные персонажи, трудности, преграды на пути их чувств, злые антагонисты и прочее. Даже если вам совсем не интересен какой-нибудь регрессионный анализ или такие темы как бетон (да-да, в серии есть толстенная и очень интересная манга о бетоне!), то можно было просто переключиться на перипетии сюжета. Здесь уже у нас скорее популярное изложение темы с картинками и вставками миникомиксов. Вот вообще не манга!

Во-вторых, меня не устроило и изложение темы. Если раньше на пальцах раскладывали довольно сложные вещи, вроде айгенвекторов, то сейчас было ощущение, что тебе рассказывают просто о простом. Впрочем, даже в этом случае в книге множество прекрасных рисунков и схем, которые вполне наглядно, хоть и на поверхностном уровне, иллюстрируют многие принципы, подходы к обработке информации или построению нейросетей. Например, что такое автокодировщик или машина Больцмана.

Ещё одним достоинством вновь вышедшей манги является раздел про генетические алгоритмы. В популярных и вводных изданиях эта тема освещается крайне редко, так что здесь зачёт. Ну и в конце концов — после прочтения я узнал новое слово — ономатопея!

Резюме

Для специалистов манга будет малоинтересна (в отличие от других книг серии, где даже крутые мастера могут поймать инсайты или, как минимум, найти референсы для презентаций). А вот если у вас есть младший брат-отаку или ваша девушка не прочь почитать на досуге мангу, то если вы хотите увлечь их своим делом, ну или хотя бы объяснить, чем занимаетесь, то при всех недостатках эта книжка будет лучшим выбором.

Как договориться с роботом

Табита Голдстауб

Российские издатели стыдливо не стали переводить подзаголовок этой маленькой книжечки, вполне понимая, что он, скорее всего, уронит им продажи. И правда, «Путеводитель для девочек в будущем мире, где доминирует ИИ» звучит для русского уха странно.

Феминистки скажут, что ещё не свергли гегемонию мужчин, чтобы взваливать ещё и созданный ими же — со всеми унаследованными предвзятостями — искусственный интеллект, и ракритикуют книгу. Ну а девочки, кстати, абсолютно по-сексистски, в нашей стране не считаются целевой аудиторией для книг про технологии.

И абсолютно зря! Сейчас на хакатонах нередко можно встретить команды сплошь из девчонок, в других — они лидеры. Среди девушек немало талантов и настоящих фанатов ИИ. Да и вообще — без активного привлечения женщин в STEM, нам не решить проблему кадрового голода в отечественном IT.

Кстати, не знаете что такое STEM? Не проблема — книжка Голдстауб открывается маленьким, но чётким и понятным словарем терминов. Среди них есть даже социально-технологический «пузырь фильтров». Затем идёт краткий экскурс в историю ИИ с особым акцентом на достижения женщин на этом поприще, вроде Грейс Хоппер или Венди Холл (думаю, что вы слышите их имена впервые). Неплохое вводное объяснение — что такое ИИ, что он уже умеет делать, чего нет — и каковы его перспективы развития в будущем.

Далее идут две очень важные главы, необходимость которых хорошо понимает феминистка Табита Голдстауб, но мало учитывают даже топ-менеджеры технологических корпораций — это рассказ о возможностях ИИ, развенчание связанных с ним мифов и объяснения по поводу главных общественных страхов, обусловленных повсеместным внедрением нейросетевых моделей. Полезно почитать всем. Ну а завершается книга серией интервью с бизнесменками, основательницами стартапов, программерками, учёнками и прочими девушками из IT-индустрии.

Резюме

Хорошая вводная книга для всех, кто не в теме. Но если у вас есть дочь, младшая сестра, подруга или даже бодрая мама, то вы вполне можете мотивировать их войти в IT, подарив на День рождения данную книжку. Ибо, как пишет автор: «Я была счастлива не знать, что гендер может вообще что-то значить в мире технологий. Интерес к ним был не мужским и не женским. Он был моим». Разделы про общественные страхи вообще полезно прочитать каждому разрабу-фанату хайтека, ибо жизнь в башнях из стекла и бетона внутри коммьюнити таких же гиков даёт мало представлений о реальных людях, их чаяниях и опасениях.

ИИ-2041. Десять образов нашего будущего

Кай-Фу Ли и Чэнь Цюфань

В Сан-Франциско появляется индустрия «перераспределения рабочих мест» из-за ИИ с глубоким обучением. В то же время в Сеуле виртуальные компаньоны с совершенными навыками обработки естественного языка предлагают близнецам-сиротам новые способы общения. Параллельно в Мюнхене поглощенный жаждой мести учёный-мошенник использует квантовые вычисления, компьютерное зрение и другие технологии искусственного интеллекта для реализации заговора, который ставит под угрозу весь мир. А в Токио меломан погружается в захватывающую форму поклонения знаменитостям, основанную на виртуальной и смешанной реальности.

Всё вышеперечисленное — лишь несколько сюжетов из десяти фантастических рассказов, написанных писателем Чэнь Цюфанем. Каждый из них показывает перспективу какой-либо технологии, уже разработанной в наши дни, — в мире 2041 года. Ну а бывший президент Google China, ныне успешный венчурный капиталист, учёный и автор нашумевшего бестселлера «Сверхдержавы искусственного интеллекта» Кай-Фу Ли снабдил все новеллы обширным комментарием, с рассказом о сути упомянутых технологий, их текущем уровне развития, проблемах и перспективах.

Получилась с одной стороны антология добротной фантастики, с другой — сборник визионерских научно-технических эссе, а с третьей — пока невиданный на современном российском книжном рынке жанр-кентавр. Впрочем, целевая аудитория данной книги не до конца ясна. Чэнь Цюфань прекрасный фантаст, во всех рассказах интересные, изобретательные и провокационные сюжеты. Однако исполнение и язык как-то отстаёт от задумки, возможно, из-за того, что проект коммерческий и делался в сжатые сроки. Известный литературный критик Василий Владимирский метко сравнил их с «фантастикой ближнего прицела» в СССР 1950-х годов, служившей формой литературной пропаганды. Так что скорее всего фэнам «твёрдой» научной фантастики не зайдёт.

А эссе-комментарии хотя и содержат много любопытных сведений, но всё-таки довольно поверхностны. Их трудно сравнить с творчеством в том же жанре Станислава Лема или Умберто Эко. Тем не менее эксперимент довольно интересный и заслуживает быть отмеченным.

Резюме

Если очень любите фантастику, то стоит почитать хотя бы ради забористых сюжетов. В плане технологий ничего нового не узнаете, но фантазию и видение разовьете. А вот заинтересовать созданием ИИ школьников — с пока ещё невзыскательным литературным вкусом — через такую книгу вполне можно. Вероятно, на них она и рассчитана. Кстати, сборник входит в «Библиотеку Сбера».

Для джунов

Грокаем алгоритмы искусственного интеллекта

Ришал Харбанс

Неологизм «грокнуть» придумал фантаст Роберт Хайнлайн в романе «Чужак в чужой стране», написанном в далёком 1961 году. Этим словом воспитанный марсианами землянин, вернувшийся на родную планету, называл процесс понимания, мгновенное проникновение в суть какого-либо познаваемого объекта. Близкой по форме, но далёкой по содержанию можно назвать популярную в бизнес-сленге фразу «словить инсайт».

Программисты всегда уважали фантастику, цитировали её, или, как известный хакер Крис Касперски, использовали для эпиграфов к своим статьям и книгам. Так, слово «грокнуть» постепенно проникло в хакерскую (в России конца 1990-х его активно продвигал печально известный Арви Хэккер), а затем и в гик-культуру.

Поэтому когда Адитья Бхаргава написал в 2015 году свой бестселлер и эталонную популярную книгу о технологиях, то неудивительно, что для заголовка он также выбрал этот неологизм. Успех его «Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих» в итоге породил целую серию «Грокаем…». На английском уже вышло 11 книг, из них на русский перевели только пять, и последняя из них — «Грокаем алгоритмы искусственного интеллекта».

Как обычно, независимо от автора и темы, книга наполнена отличными иллюстрациями и прекрасной инфографикой: здесь и таймлайны по истории искусственного интеллекта, и диаграммы Венна, всевозможные блок-схемы, матрицы и аннотированные графики. При этом начиная с наглядного объяснения простых концепций автор всё глубже погружает нас в технологии ИИ.

Это единственная известная мне книга, где подробно и досконально разбираются такие темы, как генетические алгоритмы, а также роевый интеллект, управляющий коллективным поведением децентрализованной самоорганизующийся системы — от живых муравьёв до стай беспилотников. Решения конкретных задач представлены в псевдокоде, что позволяет понять алгоритмы и перенести их на любой известный читателю язык программирования верхнего уровня.

Резюме

Отличная книга для первоначального знакомства с широким спектром концепций и технологий искусственного интеллекта для людей, уже имеющих программистский бэкграунд. Если опустить ряд технических моментов, то она вполне может быть интересна и массовому продвинутому читателю.

Антология машинного обучения.
Важнейшие исследования в области ИИ за последние 60 лет

Терренс Сейновски

Очередные трудности перевода у российских издателей. Совершенно странное название для книги, в оригинале звучащее как «Революция глубокого обучения». Единственное, что правдиво — её содержание и правда захватывает последние 60 лет. Ещё больше вопросов вызывает структура и организация материала. В сущности, даже сложно определить жанр этого опуса — то ли биография автора на фоне эпохи, то ли серия очерков об истории искусственного интеллекта, то ли введение в ИИ с уклоном в историю и личными мемуарами.

Тем не менее книга весьма интересная и занимательная. Широкими мазками даны портреты всех героев, обеспечивших нынешний взлёт технологий ИИ, — в те годы по большей части маргиналов научного и инженерного миров. Например, таких как обласканный, а затем жестоко раскритикованный создатель перцептрона Фрэнк Розенблатт или упорный энтузиаст нейросетей Джеффри Хинтон, создатель алгоритма независимого компонентного анализа Тони Белл или малоизвестный подвижник Дэвид Румельхарт.

Живо описаны все всплески энтузиазма и последовавшие за ними периоды разочарования — так называемые «зимы искусственного интеллекта». Здесь и разгромная критика перцептронов математиком Марвином Минским, и создание сетей с ассоциативной памятью Джоном Хопфилдом, и возрождение нейросетевого подхода с появлением глубокого обучения.

Научные анекдоты перемежаются объяснениями сложных концепций, меткие описания личности и биографий исследователей — анализом развития различных технологий ИИ в тот или иной момент времени. В итоге из хаоса казалось бы связанных только общей зонтичной темой очерков вырастает многомерное понимание истории, оснований и принципов современного ИИ.

Резюме

Хорошие инженеры и разработчики всегда интересуются историей создаваемых ими технологий. Стоять на плечах гигантов лучше, чем быть безродным гением. Книга Терренса Сейновски не только позволяет понять, как мы все оказались в текущем водовороте событий, но и осознать, что нынешний всплеск энтузиазма тоже может закончиться разочарованием, а то и не дай бог Батлерианским джихадом.

Байесовская статистика:
Star Wars, LEGO, резиновые уточки и многое другое

Уилл Курт

Байесовские методы используются практически везде — от разработки игр до открытия новых лекарств. Они дают суперспособности многим алгоритмам машинного обучения: обработка недостающих данных, извлечение гораздо большего количества информации из небольших датасетов и т.д.

Кроме того, байесовские методы позволяют оценить неопределённость в прогнозах, а это очень желательное качество для таких областей применения ИИ как, например, медицина. Когда же байесовские методы применяются к глубокому обучению, то оказывается, что они позволяют сжимать модели в 100 раз и автоматически настраивать гиперпараметры, экономя время и деньги.

Короче говоря, без байесианства сейчас никуда: необходимо понимать основы, уметь строить вероятностную модель, делать на её основе предсказания и т.д. Лучшим введением в тему, безусловно, является книга Уилла Курта.

В какой-то мере она наследует лучшим образцам из серии «Грокаем…», но без акцента на визуальное объяснение — графики и схемы тут появляются только по необходимости и носят функциональный характер, а вот формул прямо очень много. Единственное — и удачное — объяснение через наглядные образы здесь можно найти в главе «Теорема Байеса и Lego». Использовать детали из детского конструктора для рассказа об условных вероятностях — идея, бесспорно, блестящая!

Вдобавок автор ещё и явный фанат «Звёздных войн» и хоррор-антологии «Сумеречная зона», поэтому досконально разбирает ошибки в статистических рассуждениях андроида C-3PO о вероятности пройти целыми и невредимыми сквозь пояс астероидов, а также пророчества загадочной машины «Мистический предсказатель». Читается интересно и захватывающе, но всё же примеры из реальной жизни были бы более к месту.

Резюме

Краткое, местами остроумное, понятное и интересное введение в байесовскую статистику и её реализацию на языке R. Мастрид для первого, но вполне глубокого погружения в тему. Помимо теории есть и практические упражнения для закрепления полученных знаний.

Алгоритмы неформально. Инструкция для начинающих питонистов

Брэдфорд Такфилд

Эта книга — очередная вариация знаменитого хита последних лет от Адитьи Бхаргавы «Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих», однако с большим упором на развитие алгоритмического мышления и его реализации на языке Python. Иными словами, тут можно сразу переходить от понимания к реализации.

Помимо этого, вы окончательно и в деталях поймёте, что такое градиентный спуск, прочитав главу «Максимизация и минимизация». А три последних главы прямо посвящены интересующей нас теме: «Машинное обучение» (детальный разбор построения дерева принятия решений), «Искусственный интеллект» (пишем программу-чемпиона для игры «Точки и квадраты») и «Полный вперёд» (делаем простенький чат-бот).

Резюме

Глубин вы здесь не постигнете, но изучая алгоритмы в целом, получите представление, а также научитесь реализовывать на практике, ряд подходов из области ИИ. Для джуна освоить алгоритмическое мышление — задача №1, иначе так и придётся конкурировать с шиткодерами из Индии, а они всё равно будут побеждать.

Для мидлов

Инженерия машинного обучения

Андрей Бурков

Если предыдущая книга Андрея Буркова «Машинное обучение без лишних слов» напоминала хокку Басё или удар катаной Миямото Мусаси в своей строгости и лаконичности — ничего лишнего, краткость и совершенство формулировок, формул и графиков, то новый труд напоминает уже скорее сборник танку или ката из кэндо. Кажется, что их стоит читать друг за другом, расширяя собственные представления.

В своей рецензии Кэсси Козырков, главный специалист по теории принятия решений в Google вполне справедливо замечает: «Если вы собираетесь использовать машинное обучение для решения крупномасштабных практических задач, могу только порадоваться, что вы наткнулись на эту книгу». И действительно, Бурков помогает системно взглянуть на весь пайплайн: от ответа на вопрос — «А нужно ли вообще для решения данной задачи машинное обучение?», через грамотную организацию сбора и разметки данных, конструирования фичей, обучения разных вариантов моделей — к оцениванию и развёртыванию финальной модели.

Отдельно стоит отметить главу про сопровождение модели. У человека явно огромный опыт реальной работы на рынке, ничем иным появление разделов вроде «Не переутомляйте пользователя» не объяснить. Другой момент — из книги легко понять, чем именно в ходе реализации проекта должен заниматься бизнес-аналитик и инженер по данным, а чем аналитик данных и разработчики. В российской практике функционалы этих профессиональных позиций часто смешиваются и путаются, что приводит как конфликтам, так и к проблемам в реальном и эффективном имплементировании технологий искусственного интеллекта в бизнес.

Что ещё хочется отметить, так это внимание к качеству классификации в моделях и подробное и понятное изложение всех необходимых для её оценки метрик. Прекрасная визуализация ROC-кривых и AUC по-настоящему эффективных классификаторов.

Резюме

Если вы из миддла метите в синьоры и тимлиды, то книга Андрея Буркова должна стать для вас настольной. Вы выработаете внимательный к мелочам, дзенский подход к работе, сформируете системное мышление (в книге есть все необходимые для этого фреймворки), научитесь ориентироваться на реальные нужды бизнеса и поймете проблемы конечных пользователей.

Шаблоны и практика глубокого обучения

Эндрю Ферлитш

Наверно самая толстая книга в этом списке. В руках — увесистый талмуд — и настоящая энциклопедия архитектур. Автор начинает с объяснения азов, включая терминологию, рассказывая о переходе от классического или семантического ИИ к узкому или статистическому ИИ, описывая основные шаги машинного обучения. А затем переходит к основной теме — машинному обучению, основанному на консолидации моделей.

Сразу важно оговорить, основной используемый инструмент — это TensorFlow от Alphabet и модуль Keras (также активно применяются scikit-learn и NumPy), что не удивительно, ведь автор сотрудник Google Cloud AI. Поэтому если вы поклонник PyTorch от Meta (признана в России экстремистской организацией), то и вся книга может не зайти. Но если вы не ярый фанат одного из фреймворков — сможете почерпнуть немало полезной информации.

Во-первых, Эндрю Ферлитш детально излагает подходы к конструированию, а также преимущества и подводные камни крупных моделей, обнаруженные исследователями не только при движении послойно вглубь, но и послойно в ширину. Последний метод привёл к достижению сравнимой точности, сокращению числа параметров и увеличению прироста информации в промежуточном латентном пространстве внутри моделей, так что он вполне продуктивен.

Отдельно разбирается такая модная тема, как использование внимания в трансформерах для понимания естественного языка. Целая глава посвящена переносу обучения (трансферному обучению), концепциям и методам манипулирования переносом весов и настройкам моделей под аналогичные и отдалённые задачи. Здесь же есть довольно интересные размышления и предложения автора по переносу предметных знаний с целью повторного использования весов во время предварительной тренировки моделей.

Резюме

Автор ветеран индустрии, это объясняет несколько тяжеловесное изложение и высокий градус фундаментальности всей книги. Полезно читать перед сном, для нормализации циркадных ритмов. Но есть загвоздка — периодически в тексте открываются интересные идеи или блестящие объяснения, так что в итоге вместо сна можете провести всю ночь за компьютером, да ещё и смахнув пыль с TensorFlow.

Биологическое и компьютерное зрение

Габриэл Крейман

Как известно, современная революция глубокого обучения во многом основывалась на исследованиях и достижениях нейробиологов. Отмеченные Нобелевской премией работы Дэвида Хьюбела и Торстена Визеля о нейронной организации зрительного восприятия в коре головного мозга легли в основу построения современных систем компьютерного зрения. Однако до сих лишь малое число инженеров и разработчиков действительно глубоко знакомы с психофизиологией и нейробиологией зрительных сенсорных систем животных и человека.

Книга Габриэла Креймана уверенно закрывает этот пробел. Даже будучи по первому образованию психофизиологом, написав курсовую по цветовому зрению у человека и прослушав немало спецкурсов, я нашёл в книге не только уже знакомые концепции и результаты экспериментов, но и много нового, например, теорию зрительного сознания. По сути, Крейману в первой части удалось собрать все сливки из университетских курсов психофизики, когнитивной психологии (от гештальтистов до радикальных конструкционистов) и физиологии сенсорных систем. Я смело могу порекомендовать эту книгу всем студентам соответствующих специальностей.

Кстати, для оформления обложки используется известная зрительная иллюзия движения — пространство из цветных точек как будто развевается на ветру, идёт волнами. Что интересно, на бумажной обложке эффект не так силён, а вот если открыть pdf-файл на компьютере, то долго вглядываясь в обложку можно испытать приступ морской болезни.

Начиная с седьмой главы автор переходит уже к технологиям как таковым. Сперва общие концепции: здесь уже и знакомые нам по книге Терренса Сейновски перцептроны и сети Хопфилда, детальное описание операции свёртки, глубокие свёрточные нейросети и т.д. Интересный рассказ о визуальном тесте Тьюринга и генеративных состязательных сетях (Generative Adversarial Network, GAN), которые сейчас часто используются для создания дипфейков.

Впрочем, чувствуется, что для Креймана технологии лишь способ моделирования и исследования, а также практического применения полученных в нейробиологических экспериментах знаний. Его больше завораживает сам поиск и красота природы зрения.

Резюме

Мастрид для специалистов по компьютерному зрению. Для всех остальных может быть как достаточно понятным введением в физиологию сенсорных систем и психологию зрительного восприятия, так и источником вдохновения и новых идей в своей работе.

Для синьоров

Машинное обучение с участием человека

Роберт (Манро) Монарх

Наконец и на русском языке можно прочесть фундаментальное руководство по одной из самых сложных и наверно центральных проблем в современных системах искусственного интеллекта — Human-in-the-loop (HITL). Однозначно перевести на русский это понятие сложно, выбранный переводчиками и редакторами вариант — машинное обучение с участием человека скрывает некоторые нюансы, ведь по сути сейчас не существует никакого машинного обучения без участия человека, как бы это парадоксально не звучало.

Итак, люди могут или помогать в обучении модели, или уточнять создаваемые ею прогнозы. Сейчас много говорят о возможности кентавр-систем, когда уже в ближайшем будущем любая человеческая деятельность будет реализовываться рука об руку с моделями ИИ — будь ты иллюстратор, дизайнер, писатель, врач, учёный или трейдер. Однако создание систем, сочетающих машинный и человеческий интеллекты, идёт уже сейчас, правда не в области практического применения, а только лишь на стадии разработки.

Первый этап участия человека в обучении моделей — это разметка или аннотирование данных. Считается, что этим могут заниматься домохозяйки или необразованные безработные в Азии, но в реальности крупные компании для разработки ключевых приложений, например, чат-ботов внутри мобильных банков, создают подразделения для разметки in-house. А сложные медицинские датасеты аннотируют врачи высшей категории и с большим опытом в диагностике различных заболеваний.

Почти половина книги Манро Монарха рассказывает о множестве нюансов разметки данных для различных задач: где, как и каких асессоров набирать, как обустроить пайплайн, что можно учесть и предусмотреть заранее, как улучшить процессы? Если вы тимлид, то это далеко не праздные вопросы для успеха вашего проекта.

Другая половина посвящена активному обучению — это «процесс принятия решения, какие данные использовать для аннотирования человеком. Не существует универсального алгоритма, архитектуры или набора параметров модели машинного обучения, которая была бы точной для всех вариантов и стратегий использования данных. Однако есть более успешные подходы анализа, которые стоит пробовать в первую очередь», — пишет Манро Монарх. Задача нетривиальная, но существует целый ряд методов для её решения. И если вы будете их знать, то ваш проект ИИ не провалится, как 80% других, а дойдёт до стадии внедрения.

Резюме

Важная книга для развития тимлидов и проджектов в области искусственного интеллекта.

Объяснимые модели искусственного интеллекта на Python

Прадипта Мишра

Даже среди разработчиков, уже занимающихся технологиями искусственного интеллекта, робототехникой или беспилотным транспортом, часто можно услышать: «Модели искусственного интеллекта — это “чёрный ящик”. Вы не знаете, что происходит у них внутри, а также как и на основании чего они делают свои выводы и прогнозы». В большинстве случаев это чистая правда. ИИ остаётся вещью в себе, он неподконтролен и необъясним. Многие специалисты внутри ИИ-сообщества считают это проблемой.

Чтобы её преодолеть, необходимо создавать объяснимые или интерпретируемые модели искусственного интеллекта (Explainable (Interpretable) AI, XAI). Объяснимость необходима для повышения доверия к модели, особенно при решении определённых критически важных задач, например, при медицинской диагностике. И врачи, и пациенты должны понимать, «как это всё работает». Во-вторых, важна безопасность. А в-третьих, — оспоримость. При делегировании моделям принятия решений, для людей становится всё более важно иметь возможность оспорить любое подобное решение. У моделей, действующих по принципу «чёрного ящика», такой возможности нет, так как их вердикты невозможно разложить на какие-либо оспоримые элементы.

При этом, чем выше объяснимость, тем ниже эффективность. Системы, основанные на правилах полностью понятны, но результаты их ничтожны. Определённая золотая середина — статистические модели. Все они хорошо объяснимы, но всё же уступают в эффективности машинному обучению и тем более глубокому обучению. Но двигаться к увеличению их интерпретируемости всё же необходимо.

Как это сделать — рассказывает Прадипта Мишра. Процесс нужно начинать с разметки данных, убирая из них малейшую предвзятость, плюс контролировать весь процесс обучения. Каждая из глав книги посвящена развитию XAI в конкретном классе моделей. Особенно интересной кажется глава об алгоритмах обработки естественного языка (Natural Language Processing), так как тема очень бурно развивается, активно применяется в бизнесе, но публикаций по интерпретации результатов языковых моделей очень мало.

Резюме

Общество и политики всё больше будут требовать повышения интерпретируемости и прозрачности моделей от разработчиков систем искусственного интеллекта, поэтому думать над решением этой проблемы и изучать международный опыт всем синьорам и тимлидам необходимо уже сейчас.
IQ

Автор текста: Кузнецов Даниил Александрович, 6 октября, 2023 г.