Стоковые изображения от Depositphotos
Александр Ведяхин
— Искусственный интеллект специалисты делят на слабый и сильный. Где находится грань? Какой интеллект развивают в Сбере?
— Обычно считается, что слабый искусственный интеллект — это нейросеть, которая может решать одну задачу, а сильный искусственный интеллект умеет самообучаться новым задачам, понимать человеческий язык, объяснять и принимать решения в условиях неопределенности. Модели-лидеры в мире сейчас могут решать до 600 задач.
Модель, которую с нашей помощью развивают в научно-исследовательском институте искусственного интеллекта AIRI, планируется запустить в 2023 году. Она будет решать до 800 разных задач.
Это анализ текста, изображений, видео, аудио и других форм данных.
— Как называется эта многозадачная нейросеть?
— Проект называется Fusion Brain. Это совокупность нейросетей. А сегодня мы представляем новую мультимодальную нейросеть — Kandinsky, которая генерирует картинки по описанию на русском языке. Использовать ее можно для создания любых видов изображений — например, вариантов дизайна интерьера, иллюстраций, материалов для рекламы, архитектурного и промышленного дизайна, даже изображений в области цифрового искусства.
Это самая большая на данный момент модель генерации изображений по текстовому описанию на русском языке,
продолжение нейросетевого вычислительного проекта прошлого года ruDALL-E. Команды Sber AI и SberDevices смогли существенно улучшить качество работы базовой модели, дообучив ее на 179 млн изображений, снабженных текстовыми описаниями.
— Это то, чем занимались оперативные работники раньше…
— Они рисовали «фотороботы».
Наш Kandinsky рисует настоящие живописные картины. Вот посмотрите: это «Ночная Москва», а это — «Лиса в лесу».
Предыдущие сети могли нарисовать лису с тремя глазами (или, наоборот, с одним), у них было много ошибок, потому что они расставляли пиксель за пикселем и иногда сбивались. А эта нейросеть уже умеет «смотреть» на всю картину: сначала рисует лису, потом сравнивает то, что получилось, с изображениями в интернете. Если что-то не так, перерисовывает.
— Для чего это нужно Сберу?
— Сбер — это больше чем банк, и в наших сервисах и продуктах эти алгоритмы могут применяться очень широко. Например, у нас есть интересные эксперименты, доказывающие, что модели, которые раньше применялись в нефинансовых областях (скажем, для работы с теми же картинками), решают и чисто банковские задачи по одобрению кредитов гораздо лучше, чем модели, изначально заточенные только под финансы.
— Почему?
— Мы сейчас изучаем этот феномен. Думаю, это как у ребенка: он развивается в разных направлениях, занимаясь математикой, вокалом, рисованием, каким-то спортом. Эта многозадачность позволяет сформировать максимальное количество нейронных связей внутри мозга. Так происходит процесс нашего обучения. Потом, при большом количестве нейронных связей, ребенку гораздо проще выбирать какую-то отдельную специальность и в ней совершенствоваться. Здесь то же самое.
Мы поняли, и это подтверждено в цифрах, что чем больше задач, не связанных с финансами, решает эта модель, тем лучше она прогнозирует уровень одобрения кредитов.
— Иными словами, нейросеть, которая умеет рисовать, лучше прогнозирует, вернет человек кредит или нет?
— Да. Мы вышли на этот феномен опытным путем. Наш коэффициент Джини (коэффициент точности попадания) улучшился по физическим лицам на 10%. Это очень много, это прямо драматическое увеличение.
— Что еще ИИ на данном этапе развития умеет делать лучше, чем человек?
— Он уже точно лучше различает дипфейки. Тут ИИ обгоняет человека на 30 с лишним процентов: ИИ — 99%, человек — 66%. Сейчас ИИ уже лучше человека разбирается и классифицирует изображения. При стандартной проверке — сколько машин или светофоров на картинке — побеждает робот.
В отношении понимания языка, где искусственный интеллект почти всегда отставал, соотношение на сегодняшний день примерно одинаковое. Это подтверждено тестом SuperGLUE, который отвечает за смысловое понимание языка компьютером. Известный пример: во фразе «Человек сел за стол, и он был голоден» искусственный интеллект долго не понимал, кто был голоден — стол или человек. В итоге он и эту сложность преодолел.
— А фразеологизмы ИИ понимает?
— Это вообще легко. Фразеологизм — устойчивое словосочетание с определенным значением, которое просто можно ввести в систему. Сложнее искусственному интеллекту даются выводы из текста и объяснение своих ответов. Если выводы он делает уже неплохо, то с объяснениями дела пока обстоят средне. ИИ может рассказать про текст, интерпретировать его, но на вопрос «почему?» ему ответить пока сложно.
Конечно, если сам ответ не содержится в тексте.
— С чем это связано?
— ИИ в отличие от человека не понимает контекста. Например, если мы видим предложение: «Человек сел за стол, когда пришел с занятий спортом», — мы можем догадаться, что, скорее всего, в спортзале человек проголодался и сейчас сел за стол, чтобы поесть. А у искусственного интеллекта нет предыстории, он не может дорисовать картину, исходя из своего предыдущего опыта, и ответить на вопрос, зачем человек сел за стол.
— Ну, можно же погуглить?
— Теперь он так и делает. Активно выходит в интернет и находит ответ на свой вопрос. Так ИИ выясняет, что занятия спортом требуют много калорий, и начинает что-то понимать. Но сложных логических цепочек слишком много, поэтому требуется целая система знаний. Над этим сейчас активно работают.
— В чем еще искусственный интеллект пока отстает от человека?
— Он не может сам ставить себе цели. Но это скорее хорошая новость для людей. Когда ему ставишь цель, он реализует ее, когда не ставишь — не реализует. У него нет собственной воли, нет желания.
— Так это же хорошо? Или нет?
— Плохо то, что внешняя воля может направить ИИ не туда, куда нужно. Поэтому возникла такая тема, как этика искусственного интеллекта. Она говорит, что мы должны заранее во всех алгоритмах искусственного интеллекта прописывать, чтобы ИИ не пошел в своем развитии по траектории, которая людям точно не нужна. Это как воспитание ребенка: ему надо прививать с самого начала какие-то знания в виде правил и объяснять, что такое хорошо и что такое плохо. Хорошая новость состоит в том, что искусственный интеллект очень хорошо учится и воспринимает то, что ему говорят.
— Если ИИ пока отстает от человека, то на каком уровне он сейчас находится?
— Он развивается гораздо быстрее, чем многоклеточные организмы на Земле. У нас в мозге примерно 100 млрд нейронов, между ними от 800 до 1000 трлн синаптических связей. Чем более развит человек, тем больше этих связей. Примерно то же и с нейросетями: там синаптическим связям живого мозга соответствуют параметры нейросети — чем их больше, тем она умнее. И в последние годы нейросети резко прибавили в количестве параметров.
— Сколько сейчас таких нейронных связей-параметров у самой мощной компьютерной нейросети мира?
— Еще в 2018 году самая продвинутая нейросеть имела 94 млн параметров — это меньше, чем количество нейронных связей у хомяка. Современные нейросети — Megatron-Turing или китайская WuDao — находятся уже примерно на уровне собаки: 530 млрд и 1,7 трлн параметров соответственно. А нейросеть M6 от Alibaba (10 трлн параметров) — даже на уровне обезьяны. Такими темпами уже скоро ИИ по количеству нейронных связей сравнится с человеческим мозгом.
— Где именно «живут» нейросети Сбера?
— В нашем облачном кластере — в Christofari Neo, нашем втором суперкомпьютере.
— И весь этот суперкомпьютер заточен на хранение и поддержание жизни нейросети?
— Это не единственная задача, которую решает Christofari Neo, но если совсем просто говорить, то да. Внутри его «головы» как раз и живёт эта нейросеть.
— Каковы ближайшие задачи по ее развитию?
— Это решение всех задач экосистемы Сбера и самого Сбера как финансового института. Как сказал вице-премьер Дмитрий Чернышенко, только за 2021 год ИИ принес российской экономике более 300 млрд рублей.
— Сколько специалистов сейчас в Сбере занимаются искусственным интеллектом?
— У нас сейчас около 1000 дата-сайентистов, но разработкой и внедрением ИИ занимаются не только они, но ещё дата-аналитики, ML-инженеры и целый ряд других специалистов, включая продуктовых. А всего в Сбере трудится более 45 тысяч ИТ-профессионалов с экспертизой во всех основных прорывных технологических направлениях, в том числе и в ИИ, и по этому показателю мы являемся крупнейшим работодателем для айтишников в России.
— Какие проекты сейчас в Сбере реализуются при помощи ИИ?
— Это выдача всех кредитов физлицам, наши виртуальные ассистенты, беспилотные автомобили. ИИ подсказывает нашим сотрудникам в отделениях, как правильно обслужить клиента, что ему предложить. Учет и распознавание документов, расчет того, сколько денег положить в каждый банкомат, — все эти операции происходят при помощи искусственного интеллекта.
На самом деле он уже во всем, а в будущем нас ждёт ещё много новых прорывов в этой области, и искусственный интеллект кардинально изменит не только бизнес-процессы, но и жизнь каждого человека.
По сообщению сайта Газета.ru