Используются материалы Financial Times Financial Times
Поддержите VTimes, чтобы мы могли работать для вас.

Время чтения: 2 мин
Обновлено:

ВТБ и «Ростелеком» пробуют совместную обработку данных

Их СП тестирует технологию: объединить данные для анализа, но не раскрывать их друг другу

У каждой компании есть данные о клиентах, но каждой хотелось бы иметь больше. Задачу, как сделать картинку более полной, не делясь данными с конкурентами, пытается решить совместное предприятие ВТБ и «Ростелекома» — «Платформа больших данных» (ПБД). В роли подопытных ПБД использует материнские компании. ВТБ и «Ростелеком» предоставляют ей свои данные для тестирования технологии совместных, но конфиденциальных вычислений (multi-partial computations, MPC). Об эксперименте ПБД рассказали на конференции ВТБ DataFusion директор департамента анализа данных и моделирования ВТБ Дмитрий Берестнев и директор отдела исследований и разработки компании Ubic Петр Емельянов. Ubic специализируется на анализе больших данных и предоставляла технологическое решение для эксперимента с ПБД, рассказали гендиректор Ubic Виталий Саттаров и представитель ВТБ.

Эксперимент показал, что технология работает, но пока медленно. Представитель госбанка назвал ее перспективной для масштабирования. 

Как это работает 

ВТБ важно как можно больше знать о клиенте, чтобы предлагать максимально релевантные продукты и услуги и больше на них зарабатывать, объяснял на конференции Берестнев. При этом у каждой компании есть только часть знаний о клиенте, и объединение данных может помочь обогатить знания разных сторон. Для этого нужно соблюсти множество юридических ограничений по работе с данными, отметил Берестнев. 

MPC позволяет нескольким сторонам проанализировать общий массив их данных, не раскрывая свою часть информации партнерам, объясняет Саттаров: даже конкуренты могут обрабатывать данные друг друга, получая более качественную и полную аналитику для всех сторон. Кроме того, применение MPC упрощает совместную работу с данными, свободно делиться которыми друг с другом компаниям не позволяет закон, например биометрическими или медицинскими, перечисляет он.

Сейчас заметная проблема технологии — ограничение по производительности (MPC подразумевает сетевой обмен данными, вычисления в целых числах и множество вспомогательных операций — все это влияет на скорость вычислений), говорил в выступлении Емельянов. Однако он уверен, что можно ускорить работу, если оптимизировать криптостойкость и добавить распределенность вычислений.

Боевой пилот

На первом этапе эксперимента ПБД использовала пять наборов публичных данных и два сервера, между которыми передавались не сами данные, а специальным образом сформированная информация на основе этих данных. Опыт показал, что качество моделей, обученных с помощью MPC и без нее, идентично, при этом MPC сохранила конфиденциальность исходных данных, подтвердил представитель ВТБ.

Сейчас ПБД проводит «боевой пилот» на совместных данных ВТБ и «Ростелекома», заявил он, не раскрыв подробностей. Представитель «Ростелекома» не ответил на запрос.

Зачем это нужно

После окончания пилотов технология может понадобиться в работе скоринговых сервисов, системах лидогенерации, оценки спроса и в других платформах обмена данными, рассчитывает представитель ВТБ. Ее также можно использовать в рекомендательных сервисах на базе искусственного интеллекта, добавляет директор по аналитике и алгоритмам компании ОneFactor Максим Воеводский. По его словам, в мае 2019 г. OneFactor запатентовала в России технологию применения алгоритмов машинного обучения на объединенных данных нескольких компаний. По его словам, платформу компании используют несколько российских банков, но их названия он не раскрыл. Для развития и массового использования технологии необходимы уточнения в законодательстве, добавляет представитель «Мегафона» (вместе с OneFactor входит в холдинг USM Алишера Усманова). По его словам, вопрос применения объединенных данных, в том числе с использованием конфиденциальных вычислений, сейчас прорабатывает Ассоциация больших данных (в нее входят крупные банки, IT-компании, телеком-операторы).

Еще до ВТБ в технологию MPC поверил Департамент информационных технологий Москвы (ДИТ). По контракту с городом Ubic должна создать общегородскую платформу совместных вычислений на агрегированных данных. Стоимость контракта — 201 млн руб. В техническом задании указано, что система нужна для сбора дополнительной информации и развития сервисов для пользователей городской инфраструктуры. Сейчас действует много регуляторных ограничений, полученные единожды данные быстро устаревают, владельцы других систем скептичны к прямому обмену данными, сетует ведомство в техзадании.

Московские чиновники не раскрывали планы использования системы. Саттаров говорил РБК, что платформа может помочь городу усовершенствовать антифрод-мониторинг, устраивать более безопасные онлайн-голосования и аукционы, проводить социологические и медицинские исследования. В ответ на запрос VTimes представитель ДИТ указал, что система еще разрабатывается и не введена в промышленную эксплуатацию, поэтому оценивать ее эффективность преждевременно.

ВТБ вложит 35 млрд рублей в развитие облачных сервисов «Ростелекома»

Хотите сообщить об ошибке? Выделите текст и нажмите Ctrl+Enter




Спасибо, что читаете эту статью!

Поддержите VTimes, чтобы мы могли продолжать работать для вас.