«Солнечный пик» Воробьёвых гор.Как большая вычислительная наука в МГУ стала секретной и при чём тут дочь Путина

«Солнечный пик» Воробьёвых гор.
Как большая вычислительная наука в МГУ стала секретной и при чём тут дочь Путина

НАСТОЯЩИЙ МАТЕРИАЛ ПРОИЗВЕДЕН, РАСПРОСТРАНЕН И НАПРАВЛЕН ИНОСТРАННЫМ АГЕНТОМ T-INVARIANT, ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА T-INVARIANT. 18+

Ссылка для просмотра без VPN

You can read this article in English

МГУ объявил о создании «второго-третьего в мире по мощности» суперкомпьютера, закупив для этого комплектующие через китайскую фирму, торгующую на AliExpress. «МГУ-270» обошёлся федеральному бюджету как минимум в 2,8 миллиарда рублей: именно столько, судя по данным сайта госзакупок, МГУ заплатил за комплектующие под торговой маркой SOLAR PEAK (такого бренда не существует на мировом рынке). Покорять «Солнечный пик» позволено только сотрудникам самого МГУ, тогда как ранее заявки на вычисления на топовых суперкомпьютерах «Ломоносов» и «Ломоносов-2» могли подавать любые академические НИИ и вузы всей России. Главный академический супервычислитель будет специализироваться на тематике искусственного интеллекта, а профильный институт ИИ в МГУ возглавляет Катерина Тихонова. Высокопоставленная академическая начальница понимает, что Россия сейчас в этой «экзафлопсной гонке» скорее «следует за трендами, чем создаёт их». Зато, по мнению Тихоновой, у страны «более прагматичный подход в развитии искусственного интеллекта», «обусловленный задачами и вызовами, стоящими перед Россией» — это «применение в БПЛА и в нефтегазовой отрасли». Уже сейчас все четыре лаборатории Института ИИ занимаются наукой «двойного назначения».

English version

T-invariant рассказывает, почему самый новый и современный университетский суперкомпьютер России, который по всем показателям должен оказаться в верхней части мирового ТОП-500, не числится там вовсе. Это очень нетипично для гражданских суперкомпьютеров крупных университетов. До этого был один известный случай в Китае, когда в 2021 году объявили с большим опозданием, что в стране заработали вычислители уровня ТОП-500.

Это второе расследование T-invariant, посвящённое суперкомпьютерам. Первый материал рассказывал, как силовики разрушили самую яркую суперкомпьютерную компанию России и уже пять лет преследуют её основателя.

Слева направо: Всеволод Опанасенко, Виктор Садовничий, единоросс Борис Грызлов в суперкомпьютерном центре МГУ, 2010 год. Фото: сайт МГУ.

Как в университете узнали о запуске «МГУ-270»

Коллектив МГУ и даже научные сотрудники, проводящие вычисления на суперкомпьютере «Ломоносов-2» и находящиеся в постоянном контакте с Научно-исследовательским вычислительным центром (НИВЦ), узнали о запуске «МГУ-270» из СМИ. Об этом заявили T-invariant не менее 10 собеседников в университете.

О запуске ректор МГУ Виктор Садовничий объявил 30 августа 2023 года. «Мы официально открываем новый, созданный нами, супервычислитель. Это 400 петафлопс. Он, может быть, будет вторым-третьим в мире по мощности», — цитирует его ТАСС. Пресс-служба МГУ распространила более подробную информацию 1 сентября: на машине планируют создавать российские языковые модели, аналогичные ChatGPT.

«Мы узнали об этом из новостей. Он [новый суперкомпьютер] вообще многих застал врасплох. Мы в нашей группе гуглили, что же получилось. Разные одиозные личности, не будем их называть [Садовничий на пресс-конференции в ТАСС], стали говорить, что это лучший компьютер в мире, «аналоговнет». Наша лаба постоянно работала на «Ломоносов-2», и мы вообще были не в курсе, начали связываться с коллегами, собирали информацию по крупицам. Стало ясно, что всё делалось в обстановке секретности», — рассказывает T-invariant бывший сотрудник университета с опытом расчётов на суперкомпьютерах МГУ.

Главные новости о жизни учёных во время войны, видео и инфографика — в телеграм-канале T-invariant. Подпишитесь, чтобы не пропустить.

Опрошенные T-invariant специалисты из индустрии отказались всерьез комментировать слова ректора МГУ Виктора Садовничего о том, что получившаяся машина — «вторая-третья в мире по мощности». «Никто не будет обсуждать это профанство. Ими принято решение не подаваться в рейтинг [ТОП-500] суперкомпьютеров. Ну, тогда и комментировать нечего», — заявил T-invariant руководитель одной из суперкомпьютерных компаний.

Суперкомпьютер «МГУ-270».

Что о «МГУ-270» говорят официально?

Пресс-служба МГУ сообщает следующую информацию. Компьютер поможет в проведении научных исследований в области искусственного интеллекта (ИИ), решении задач по разработке отечественного программного обеспечения. Компьютер с новой архитектурой, основанной на активном использовании графических процессоров, составит единый вычислительный кластер с суперкомпьютером «Ломоносов-2». Суммарная производительность нового суперкомпьютера составит 400 AI Петафлопс (точность вычислений не указывается). Архитектура компьютерной системы была «вдохновлена» передовыми образцами реализованных проектов суперкомпьютеров в лучших университетах мира, а используемые технологии основаны на практиках и существующих разработках ведущих производителей. В качестве вычислительной сети используется сеть с пропускной способностью 200 Гбит/с. Она обладает высокой надёжностью и характеризуется минимальными задержками. Сеть хранения имеет аналогичные показатели. Для управления и интеграции с внешними системами выбрана сеть с пропускной способностью 100 Гбит/с и необходимым резервированием компонентов. В супервычислительный комплекс также входят новые системы энергообеспечения, охлаждения и коммуникации. При создании комплекса активно применялись отечественные узлы и компоненты.

Какие вычисления планируют производить по официальной информации

Приказ «Об эффективном функционировании исследовательского аппаратно-программного комплекса «270 лет МГУ» появился 7 сентября 2023 года (есть в распоряжении T-invariant). Был сформирован управляющий комитет во главе с Садовничим, который включает в себя ещё 13 человек.

В этом же приказе перечислены основные вычислительные задачи:

прогнозирование качества гетерогенных каналов в сетях передачи данных на основе вероятностных моделей и методов машинного обучения.
развитие комбинированных методов молекулярного моделирования и машинного обучения
разработка алгоритмов ИИ для работы с данными графового типа
разработка матметодов машинного обучения для обработки текстовой информации большого объема
интеллектуальный анализ изображений для широкого круга задач, включая высокопроизводительное фенотипирование растений и задачи точного земледелия
разработка нейросетевых подходов к задачам установок мегасайнс
интеллектуальный анализ больших данных многоволновых телескопов и космических миссий, динамическое моделирование эволюции галактик по 3D-стереоскопическим данным.

Все суперкомпьютеры МГУ обычно курируются Научно-исследовательским вычислительным центром (НИВЦ) МГУ. В этот раз в сообщении пресс-службы особо подчёркивалось, что «МГУ-270» станет рабочим инструментом механико-математического факультета и факультета вычислительной математики и кибернетики (ВМК), а также научно-образовательных школ МГУ «Математические методы анализа сложных систем» и «Мозг, когнитивные системы, искусственный интеллект».

«МГУ-270» может ускорить «появление решений, которые смогут помочь преподавателям контролировать внимание младших школьников на уроках, — рассказал тогда ТАСС декан факультета ВМК МГУ Игорь Соколов. «Мы занимаемся сейчас помощью учителям: младшие школьники очень быстро теряют внимание. Учитель должен быстро это отслеживать и реагировать, а это буквально несколько минут. Поэтому <…> [необходимы] системы, которые будут подсказывать учителю, на кого обратить внимание», — цитирует его слова агентство.

Откуда деньги?

Известно о двух распоряжениях правительства РФ по выделению финансирования на «МГУ-270». 16 декабря 2021 года появился документ, в котором ставилась задача успеть выделить в том же 2021 году МГУ 1 миллиард 182 миллиона рублей на аппаратно-программный комплекс для исследования в области ИИ. Второй документ датирован 31 марта 2022 года — в нём говорится о 2 миллиардах 424 миллионах рублей на те же цели.

Судя по сайту госзакупок (первый и второй контракты), МГУ провел два тендера с единственным участником. Один контракт — на 1 миллиард 935 миллионов рублей, второй — на 899 миллионов рублей. То есть всего около 2,8 миллиардов рублей.

Можно ли оценить бюджет «МГУ-270»? Открытой информации, сколько стоила тем или иным странам сборка суперкомпьютеров, входящих в мировой ТОП-50, не существует. Есть только предположения экспертов. По мнению крупнейшего российского специалиста по суперкомпьютерам Сергея Абрамова, на данный момент супервычислитель номер один в рейтинге ТОП-500 может стоить до 250 миллионов долларов.

Если считать формально, то «МГУ-270» обошелся российскому бюджету в сумму около 25-28 миллионов долларов. Сколько из этой суммы осело в цепочках импорта, опрошенные T-invariant эксперты оценивать не берутся. Однако схема покупки была достаточно типичной для последних «санкционных» лет, об этом мы расскажем ниже.

Кто собрал суперкомпьютер для МГУ?

Исполнителем обоих контрактов на создание суперкомпьютера МГУ стала компания ООО «Арго Технолоджи Ист». Один из её учредителей — Андрей Кучинский. Ранее он работал директором по продажам в компаниях Hewlett-Packard, EMC, Dell EMC, Lenovo. В EMC Россия и СНГ занимал должность директора по работе с партнёрами.

Сейчас на рынке больше известна другая компания — ООО «Майнд Софт», где Кучинский — гендиректор. Наиболее заметны её контракты по созданию облачных сервисов в качестве импортозамещения ушедших западных компаний: для Мегафона или Билайна, а также для государственной облачной системы «Базис». Также компанией «Арго Технолоджи Ист» была запатентована система хранения данных (СХД) «Арго», которую активно продвигал на российский рынок крупнейший вендор — ГК «Ланит». Компания давно занимается импортозамещением ключевых технологий, а информация о швейцарской компании с аналогичным названием (Argo Technologie S.A.) фигурирует, как минимум, с 2015 года.

Интересно, что еще в 2021 году сообщалось, что СХД «Арго» используется в системе «Платон» (сервис взимания платы с грузовых автомобилей), а также в инфраструктуре НТЦ «Модуль» (создан в начале 90-х, учредители — крупнейшие организации ВПК РФ: НПО «Вымпел» и НИИ «Радиоприборостроения»). При этом в работе НТЦ «Модуль» применялась высокопроизводительная СХД «Арго» именно с прицелом на задачи ИИ (в частности для кластеров DGX NVIDIA), CNEWS сообщал, что там установлен «второй по производительности в России кластер DGX NVIDIA». Таким образом можно сделать вывод, что компания «Арго Технолоджи Ист» была выбрана для поставок оборудования для суперкомпьютера «МГУ-270» не случайно.

Кучинский также является гендиректором ООО «ЦТТ МИРЭА». Эта компания создана Центром технологической поддержки образования крупнейшего технического университета России, более 70 лет работающего на российский ВПК — МИРЭА — Российский технологический университет (ранее — Московский институт радиотехники, электроники и автоматики).

Важно отметить, что Центр базируется в Институте искусственного интеллекта этого вуза.

T-invariant написал Кучинскому запрос на комментарий. На момент публикации ответ мы не получили.

Андрей Кучинский

Справка

Чем ещё известен МИРЭА в последнее время?

В МИРЭА много занимаются тематикой БПЛА, в том числе с помощью возможностей ИИ. На своих ресурсах вуз сообщает, что в ускоренном режиме производит БПЛА, которые тестируются 45-й бригадой ВДВ Вооруженных сил России. А ещё недавно в вузе разработали комплекс антидронного радиопротиводействия в двух версиях: «Вивальди-К» и «Вивальди-Р». При этом в это же время МИРЭА в обход санкций Канады купил за 4,5 миллиона рублей канадский радар-детектор для обнаружения беспилотников и три антидроновых ружья «Дрон 1200» за 400 000 рублей.

Как и из чего собрали суперкомпьютер для МГУ?

До полномасштабного вторжения России в Украину суперкомпьютеры в России собирались в прямой коммуникации с ведущими технологическими гигантами: NVIDIA, Intel, IBM, HPE и другими. Закупка комплектующих сопровождалась сервисной и инженерной поддержкой. Вот как ранее описывал процесс в интервью T-invariant Сергей Абрамов:

— Серьёзный чип через параллельный импорт привезти — это полдела. Каждый проект уровня ТОП-500 (тем более, ТОП-100) — это не просто закупка железок. Когда всё было нормально, мы не просто закупали, мы напрямую общались с компаниями. Как пример: мне приходилось общаться с вице-президентами Intel: мы с ними обсуждали проект, чтобы определенная партия процессоров была в срок нам доступна, чтобы они вписывали ее в свои планы, чтобы были правильные цены и чтобы мы вместе продвигали проект в СМИ. Нам выделялась горячая инженерная поддержка в случае проблем. Инженерная поддержка критична: такие системы строятся на самых новых, значит, не совсем обкатанных чипах. И если возникали проблемы, то наши разработчики и инженеры Intel (или AMD, или Mellanox, или NVIDIA, или Dolphin…) порою часами и днями плотно общались (email, телефон — проблема должна быть решена)».

Как собирался суперкомпьютер «МГУ-270» сейчас? В документации на сайте госзакупок все закупаемые комплектующие значатся под брендом SOLAR PEAK (солнечный пик). Эта торговая марка значится в декларациях ЕАЭС, однако такого бренда на мировом рынке не существует.

T-invariant смог найти упоминание торговой марки SOLAR PEAK в декларациях о соответствии с требованиями технического регламента Евразийского экономического союза (ЕАЭС) самой компании «Арго Технолоджи Ист». Там же указана китайская компания, поставляющая продукцию под этим брендом. Она называется GREATZC TECHNOLOGY (HK) LIMITED, и она, например, торгует техникой на сайте AliExpress.

Также компания находится в списках организаций, поставляющих товары в Казахстан. Встречается упоминание торговой марки SOLAR PEAK от компании GREATZC TECHNOLOGY (HK) LIMITED в декларациях компании «Имэкспрофи». Интересно, что компания специализируется именно на поставках из Китая и у них на сайте фигурирует такой рекламный текст (стилистика, пунктуация и орфография сохранены):

«В новых логистических реалиях командой из 25 сотрудников, начиная со сложного 2022 года, мы привезли более 900 поставок из-за рубежа, в основном с оборудованием».

T-invariant отправил запрос о комментарии на почту GREATZC TECHNOLOGY и ожидает ответа.

Все комплектующие в тендерной заявке подписаны как SOLAR PEAK, но если искать информацию по другим параметрам закупаемых кабелей, узлов, модулей и прочего, всё это оборудование идентифицируется как продукция компании Nvidia (а коммутаторы — как HUAWEI), которые прекратили все официальные отношения с российским рынком после 24 февраля 2022 года. T-invariant отправил запрос в европейский, китайский и американский офисы компании Nvidia и ответа на данный момент не получил.

Компания GREATZC TECHNOLOGY, судя по её сайту, преимущественно торгует встраиваемой компьютерной техникой. «Сегмент очень специфичный. Чаще всего это бортовая техника для авиации, транспорта, включая военную технику, конечно. Стационарная тоже может быть, но реже — для работы в тяжёлых условиях: пыль, грязь, карьеры, шахты, химпроизводство, что-то такое», — объясняет T-invariant эксперт рынка.

«У Nvidia жёсткая политика по противодействию нелегальному импорту и обходу санкций. Проводятся регулярные тренинги среди сотрудников. Но если китайская компания купила её легально, то дальше она может перепродать комплектующие, и что с этим можно сделать?!.. Что касается сервисной и инженерной поддержки, то тут могут быть два варианта. В первом случае «чёрный» конечный покупатель, не имея саппорта с нашей стороны, теряет в производительности 20-30%, но получает, тем не менее, рабочую машину. Во втором случае условная китайская компания может собрать тестовый кластер у себя, апробировать новое «железо», процессоры, посмотреть, всё ли работает, получив всю необходимую поддержку от Nvidia», — рассказывает T-invariant инженер, знакомый с правилами работы компании.

Актуальные видео о науке во время войны, интервью, подкасты и стримы со знаменитыми учёными — на YouTube-канале T-invariant. Станьте нашим подписчиком!

Кто имеет право проводить вычисления на «МГУ-270»?

На предыдущих суперкомпьютерах МГУ («Чебышев», «Ломоносов» и «Ломоносов-2») заявку на вычисления мог оставить любой коллектив из любого вуза или НИИ России. «Я не помню, чтобы кому-то с адекватным запросом отказывали. Более того — самыми интересными работами других организаций отчитывались перед чиновниками, самыми передовыми исследованиями гордились и собирали в годовой отчёт. Момент престижа очень важен: МГУ показывал, что хорошая наука делается на «Ломоносове». А сами научные группы должны были в своих отчётах (например, грантовых) сообщать, что результаты были получены с помощью «Ломоносова» и присылать в НИВЦ отчёты на полстранички о результатах. Особенно региональным учёным помогали с доступом инфраструктурные гранты РНФ. С «МГУ-270» это работает не так: на нём, как я понимаю, считают только МГУшники», — рассказывает T-invariant бывший сотрудник университета с опытом расчётов на суперкомпьютерах МГУ.

С ним согласен и руководитель одной из крупнейших компаний отрасли. «Машину контролируют специальные люди, которые теперь гораздо бóльшую роль играют в любом университете, — люди в погонах. Насколько я знаю, доступ ограничен даже внутри МГУ, работать дают только отдельным группам и людям, политически зрелым и проверенным», — рассказывает собеседник T-invariant.

«Процедура получения доступа всегда была очень прозрачна», — рассказывает один из сотрудников МГУ, — «В публичном доступе есть документы и список организаций, которые работали на суперкомпьютерах “Ломоносов”. Раньше для получения доступа писали письмо на имя ректора МГУ с просьбой предоставить доступ конкретным сотрудникам (примеры есть в распоряжении T-invariant)».

Сейчас же правила изменились, и формулировка звучит так: «Руководителем и ответственным исполнителем планируемых работ должны являться штатные сотрудники Московского университета. В рамках последующего исполнения работ возможно сотрудничество коллективов МГУ с другими организациями». Оригинал сообщения сохранился в архиве, также есть пример с сайта химфака МГУ. Желающим дают опросный лист, в котором значится следующее:

Опросный лист к заявке на использование суперкомпьютера «МГУ 270»

На суперкомпьютере «270 лет МГУ» будут выполняться вычислительные эксперименты по решению задач, связанных с технологиями искусственного интеллекта (ИИ). Архитектура суперкомпьютера «270 лет МГУ» основана на использовании высокопроизводительных графических ускорителей. Суперкомпьютер планируется использовать для решения задач, требующих больших вычислительных ресурсов (связанных с анализом больших объемов данных). Для получения доступа к суперкомпьютеру необходимо пройти первичный отбор проектов.

«На вычисления всегда были долгие очереди в МГУ, и внутри университета было очень много желающих. Возможно, сейчас МГУ-270 используется для задач по ИИ, а они [задачи] жутко прожорливые и требуют много ресурсов», — рассказывает один из бывших сотрудников НИВЦ МГУ.

Новый суперкомпьютер, видимо, будет также использоваться руководством МГУ в качестве некоего щедрого жеста в адрес других избранных коллег и институций. Например, в конце ноября 2023 года соглашение о сотрудничестве подписали МГУ и ОИЯИ (Дубна) и в пресс-релизе ректор Садовничий, помимо прочего, говорит, что «готов задействовать потенциал Научно-исследовательского вычислительного центра МГУ, в том числе новейший, введенный в строй 1 сентября этого года суперкомпьютер «МГУ-270» с уникальными вычислительными характеристиками». Это единственное найденное T-invariant публичное заявление МГУ о предоставлении доступа к новому супервычислителю кому-либо вне университета.

У ОИЯИ есть свой суперкомпьютер под названием «Говорун», но он, по словам опрошенных в Дубне учёных, «устарел и постоянно ломается», а для полноценной работы нового коллайдера NICA понадобятся немалые вычислительные мощности. T-invariant планирует рассказать о суперкомпьютере в Дубне, созданном одной из крупнейших компаний отрасли — РСК Групп — в одном из следующих материалов этой серии.

А что стало с «Ломоносов-2»?

Если обратить внимание на фотографии «МГУ-270», можно заметить поразительное сходство новой машины со старыми «Ломоносовыми», обращают внимание собеседники. Отчасти это объясняется в пресс-релизе университета: «Компьютер с новой архитектурой, основанной на активном использовании графических процессоров, составит единый вычислительный кластер с суперкомпьютером “Ломоносов-2”». Один из участников вычислений в МГУ комментирует это так: «важно заявлять, что строилось новое, а не модернизировалось старое: и чисто по маркетинговыми причинам, и гораздо приятнее отчитываться и интервью потом давать».

«Чёрные ящики на фото не Nvidia, а обычные Supermicro (но внутри все равно карточки Nvidia и процессоры AMD. Это своего рода «клон», дженерик оригинального DGX от Nvidia. Выглядит так, что они просто убрали все панели «T-Платформ» (компания, которая собирала «Ломоносовых», — T-invariant), а шкафы остались еще от давно разобранного “Ломоносов-1”, их снова использовали », — рассказал бывший сотрудник МГУ, ранее работавший на «Ломоносове-2».

Почему «МГУ-270» — тёмная лошадка и что произошло с российским рейтингом суперкомпьютеров ТОП-50, который вёл МГУ?

Опрошенные T-invariant эксперты неохотно берутся оценивать уровень нового суперкомпьютера МГУ, потому что университет не предоставил данные в мировой ТОП-500, а российский рейтинг, который много лет вёл НИВЦ МГУ, перестал обновляться после вторжения России в Украину. Эта причина, естественно, не названа напрямую, но на сайте значится следующее объявление:

«В сложившихся условиях сформировавшаяся практика списков ТОП-50 объективно отразить изменения как в области применения высокопроизводительных вычислительных систем, так и касательно передовых суперкомпьютерных технологий не способна и может способствовать некорректной трактовке статистики, что противоречит целям проекта. В связи с этим мы приняли решение временно приостановить публикацию новых редакций рейтинга. Мы признательны всем тем, кто на протяжении многих лет делал свой вклад в развитие данного проекта и пополнял его, и искренне надеемся, что в обозримом будущем сможем анонсировать возобновление публикации списков. Составители рейтинга ТОП-50».

Рейтинг перестал обновляться, потому что после 24 февраля 2022 года все комплектующие (как для МГУ-270, так и для апгрейда остальных российских машин — трёх у Яндекса, двух у Сбера и одной у МТС) поставляются с помощью серого или чёрного импорта, — считают несколько опрошенных участников рынка.

Виктор Садовничий показывает Путину суперкомпьютерный центр. Фото: kremlin.ru

ChatGPT — наш! Кто курирует и финансирует работу над ИИ в МГУ

В своем последнем послании Федеральному собранию в начале 2024 года Путин заявил, что Россия «должна достичь технологического суверенитета в областях генеративного искусственного интеллекта и больших языковых моделей». Он отметил, что утверждена новая госстратегия развития ИИ. «Мощность отечественных суперкомпьютеров до 2030 года должна быть увеличена в 10 раз», — поставил задачу президент РФ. Тема суперкомпьютеров (как и всё цифровое) включена в нацпроект «Экономика данных», на который власти РФ запланировали потратить 700 миллиардов рублей до 2030 года (конец нынешнего срока Путина).

Катерина Тихонова

Ведущий центр искусственного интеллекта должен быть создан в МГУ — об этом ещё в мае 2019 года гендиректор Российского фонда прямых инвестиций (РФПИ) Кирилл Дмитриев заявил на совещании с участием президента. Путин тогда эту идею поддержал и назвал важнейшим элементом при выработке национальной стратегии ИИ. В итоге в 2020 году в МГУ был создан Институт искусственного интеллекта, который, по информации ряда СМИ, возглавила Катерина Тихонова — дочь Путина и генеральный директор фонда «Национальное интеллектуальное развитие» (работает под брендом «Иннопрактика», учредитель — МГУ). Связь двух организаций описана в новостях сайта фонда. Помимо этого «Иннопрактика» реализует масштабный многомиллиардный инвестиционный проект по созданию в Москве научно-технологической долины МГУ.

Информации об участии Тихоновой в жизни МГУ на официальных страницах университета мало (есть упоминания на страницах «Иннопрактики» и есть страница на портале научной активности МГУ «Истина»). Среди прочего, Тихонова фигурирует и как член Учёного совета МГУ (архив, 2015 год).

Катерина Тихонова в МГУ в 2012 году. Фото: сайт МГУ

У Института ИИ много интересных исследований и публикаций (вот годовой отчет за 2023 год), в том числе работа над языковыми моделями, аналогичными популярным чат-ботам. Обсуждается задача создать отечественный ответ ChatGPT, и этим сейчас занимаются в университетах, подтвердили несколько собеседников T-invariant.

В апреле 2023 года сотрудники МГУ и Сколтеха, выступая на конференции Data Fusion, говорили, что предполагаемая дата его появления — 2025 год. Руководитель лаборатории семантического обучения искусственного интеллекта (сейчас — в составе Института ИИ МГУ) Константин Воронцов тогда предлагал его назвать «Наш GPT», а директор Центра технологий искусственного интеллекта Иван Оселедец рассуждал, что «обучение ИИ языкам и культурам народов страны требует значительных инвестиций и ресурсов, включая этнографические экспедиции, филологов и философов».

«До февраля 2022 года у института Тихоновой были свои вычислительные мощности, и они считали многое на своей базе. У Тихоновой и так целый свой корпус в МГУ, и насколько под них строился «МГУ-270», трудно сказать. Но в деньгах и ресурсах она не нуждается, “Иннопрактику” поддерживает практически весь крупный бизнес России», — говорит один из сотрудников НИВЦ МГУ, уже не работающий в университете.

Большие языковые модели и другое соревнование с компаниями типа OpenAI или Google — это красиво и эффектно, но, по мнению самой Тихоновой, в России «более прагматичный подход в развитии искусственного интеллекта», «обусловленный задачами и вызовами, стоящими перед Россией» — это «применение в БПЛА и в нефтегазовой отрасли». Об этом она рассказала, выступая на конференции Data Fusion-2024. Пятиминутное видео выступления Тихоновой названо «Многополярность технологического мира будущего: роль России».

«У российского искусственного интеллекта есть своя национальная специфика, есть свои исследования по большим языковым моделям и генеративному ИИ, но Россия отстает в темпе развития от общемирового и пока мы скорее следуем за трендами, чем создаем их», — считает Тихонова. Не страшны, по её мнению, и международные санкции для университетов и институтов: «Россия не была полностью исключена из мирового контекста, учёные продолжают публиковаться в топовых мировых журналах и выступать на топовых мировых конференциях. У нас есть всё: люди, кадры», подчеркнула она.

Кроме многополярности, Тихонову очень волнует суверенитет. Так, открытие Института искусственного интеллекта МГУ «при экспертной поддержке» «Иннопрактики», было «согласовано со стратегией безопасности РФ». Об этом дочь Путина рассказывала крупнейшим бизнесменам и чиновникам страны на последнем, юбилейном форуме «Иннопрактики», тематикой которого стал «Совокупный суверенитет».

Выступление Катерины Тихоновой

Чем занимается Институт ИИ МГУ и при чём тут технологии двойного назначения?

Полное название этого центра — «Институт перспективных исследований проблем искусственного интеллекта и интеллектуальных систем МГУ имени М. В. Ломоносова». Если судить по отчёту за 2023 год, центр производит вполне живое впечатление. Работы публикуются в нормальных журналах (в том числе журналах группы Nature). Темы, которыми занимаются сотрудники Института, актуальны для современной научной повестки. Среди учёных, работающих с Институтом ИИ МГУ, необходимо отметить известного специалиста — это нейробиолог Михаил Лебедев. По информации на сайте, в Институте ИИ работают четыре лаборатории: «Машинное обучение и семантический анализ», «Интеллектуальный анализ видео»,

«Искусственный интеллект в биоинформатике и медицине», «Разработка инвазивных нейроинтерфейсов». Есть ещё четыре научные группы, которые, вероятно, имеют перспективу стать полноценными лабораториями.

Первые две лаборатории — это чистая цифра, третья и четвертая — это, в том числе, «мокрая» биология и нейробиология. Учёные много выступают и на научных конференциях (в Китае, в основном), и перед широкой публикой, публикуют статьи, в том числе и научно-популярные.

Большинство работ во всех четырёх лабораториях, которые отражены в отчёте за 2023 год, — это, так сказать, наука двойного назначения. Практически про любой проект можно рассказать, как он работает на войну, хотя и в гражданских целях полученные результаты тоже можно использовать.

Самый известный проект лаборатории «Машинное обучение и семантический анализ» — это нейросеть поиска релевантной научной информации SciRus-tiny. Академик Алексей Хохлов так охарактеризовал эту работу в своём телеграм-канале: «…нейросеть SciRus-tiny теперь применена в варианте, когда пользователь может загружать в поисковое поле произвольный текст любой длины. Нейросеть тогда определит те статьи из базы данных eLIBRARY, которые ближе всего по тематике к введенному тексту». Правда, следует отметить, что eLIBRARY не самая полная и не самая авторитетная научная библиотека.

Меньше известно о другом проекте лаборатории, получившем название «Новостной коллайдер». Разработчики пишут в отчёте, в частности, следующее: «Инструмент обработки больших текстовых массивов «Новостной коллайдер». В ходе проекта разрабатываются технологии семантической разметки текстов, используемых в социогуманитарных исследованиях. Основные операции включают выделение текстовых фрагментов, их классификацию, связывание и комментирование при необходимости. Такие методы позволяют анализировать большие объемы данных (СМИ, соцсети, архивы) для исследований, например, воздействия на общественное мнение и выявления потенциально опасных дискурсов».

Какие дискурсы сегодня считаются российскими властями «опасными», хорошо известно. То, что для «прочёсывания» соцсетей и публикаций СМИ можно использовать нейросетевые инструменты, тоже хорошо известно. Вероятное применение такого «новостного коллайдера» вполне можно себе представить. Скорее всего, это и будет поиск «опасного дискурса».

Не менее важным делом занимается и лаборатория «Интеллектуальный анализ видео». Судя по отчёту, важным направлением работы лаборатории являются нейросетевые методы сжатия видео и восстановления высокой чёткости. Эти методы могут использоваться, например, при передаче видео по узким каналам, в том числе — по спутниковым. Во время войны спутниковая съемка для военной разведки очень важна.

Лаборатория «Искусственный интеллект в биоинформатике и медицине» занимается мультиомикой, то есть самыми разными направлениями геномики, протеомики (исследования белков) и т.д. Здесь суперкомпьютер просто необходим, чтобы использовать такие передовые методы, как предсказание структуры белков по аминокислотной последовательности. Это делает, например, нейросеть AlphaFold компании Google DeepMind, но есть и другие подобные решения. Главные направления работы лаборатории — это фармакология и диагностика на основе машинного обучения.

Лаборатория «Разработка инвазивных нейроинтерфейсов» занимается созданием нейропротезов и разными методами нейрореабилитации. Здесь работают над лечением нейропатических и фантомных болей, которые часто сопутствуют травмам и ампутациям. Война — это эпидемия травматизма.

Необходимо отметить, что пока этот центр сравнительно небольшой. В мире существуют сотни куда более мощных исследовательских центров, занятых исследованием ИИ, мультиомики и нейроинтерфейсов (в основном, в США и Китае). Когда Илон Маск решил построить свой суперкомпьютер, он его построил меньше чем за год, и его детище, насколько можно судить по открытой информации, примерно на порядок мощнее, чем «МГУ-270». Вычислительные возможности — даже с учётом запуска суперкомпьютера — у Института ИИ довольно скромные. Охват тем — довольно ограниченный, даже по сравнению с отделениями Сбера, занятыми ИИ, или с Яндексом. Но это вполне современный центр.

Как использовать суперкомпьютер, учёные Института ИИ, судя по всему, понимают. Простаивать он не будет. Скорее всего, большинство приложений будет иметь военное или двойное назначение и о многих из них открытой информации мы в ближайшие годы не получим.