Нейросети: всевидящее око и будущее медицины?

 

Нейросети используются повседневно и эффективно в различных областях: в поисковых системах, в банковском деле, на фондовом рынке, в прогнозировании. Количество разработок увеличивается день ото дня, а сфера их применения постоянно расширяется. Свою систему с огромным практическим потенциалом создали и молодые ученые СПбПУ.   

Мы говорим с лидером проекта Федором Кондратенко, студентом 4-го курса Высшей школы теоретической механики и математической физики Санкт-Петербургского политехнического университета Петра Великого по направлению «Механика и математическое моделирование», руководителем направления оптимизации и повышения эффективности фондов компании «Газпромнефть-Ноябрьскнефтегаз».

- Не так давно в популярном еженедельнике появилась статья под интригующим названием «Большой брат? В Петербурге создали нейросеть для предотвращения ЧП». Не погорячились ли журналисты? Она действительно разработана?

- Нет, они не погорячились, она разработана. Если быть точным, архитектура этой нейросети не новая, коллеги из Massachusetts Institute of Technology (MIT) представили ее в 2020 году. Но мы архитектуру несколько изменили. И сам процесс обучения придумали мы. Это, собственно, не одна нейронная сеть, а комплекс. Система безмаркерного анализа движений человека. Она может работать с чем угодно. Представьте, что у вас висит уличная камера видеонаблюдения. Мы с вами люди – мы смотрим на картинку и сразу понимаем, что на ней происходит. Но машина, она же глупая – она понимает эту картинку просто как некую матрицу. И возникает вопрос, как можно картинку перевести в какой-то машинопонятный, машиночитабельный вид, чтобы дальше мы могли уже последовательность картинок, то есть видео, как-то анализировать. Поэтому первая нейронная сеть из этого видео вытаскивает, так сказать, ключевые точки, их координаты: глаза человека, нос, рот, плечи, все суставы – получаем по факту скелетик. И мы можем его в видео отслеживать, то есть матрицу непонятной размерности мы свели к положению человека на этом кадре. Далее мы уже знаем, как части тела двигаются со временем, ищем совпадения в базе данных с какими-то сценариями: человек курит или неожиданно падает. И если находим совпадения, то пишем, что это у нас критическая ситуация и нам нужно что-то делать. Мы можем предугадать: если видим, что человек полез в карман, то, наверно, он оттуда вытащит пачку сигарет.

- Или пистолет?

- Ну, вряд ли он будет вытаскивать на улице пистолет, стоя прямо под камерами наблюдения. Нелогично. Или, допустим, у вас собирается группа лиц, они стоят кругом, активно машут руками, ведут полемику явно на повышенных оборотах – скорее всего, дальше будет происходить что-то очень интересное, и на основании этих данных мы можем подать сигнал, что что-то пошло не так. 

- Если сравнить реакцию диспетчера, который следит за происходящим на экране монитора, и реакцию системы, есть ли вероятность, что машина раньше распознает тревожные признаки, чем человек?

- Самое интересное, что машина сможет проанализировать ситуацию даже со спины – она дорисовывает все остальные части тела, даже если она их не видит. Например, поймет, что вы закурили сигарету. Мне кажется, что человек вряд ли сможет так однозначно установить, что делает на съемке фигурант.

- И в какой степени практической готовности сейчас находится система?

- Я бы сказал, процентов семьдесят. У нас реализовано распознавание базовых сценариев – то есть, опять же, примеры: человек курит, человек падает, человек кого-то бьет. Если речь идет том, чтобы собрать какие-то более интересные ситуации, то нужен датасет, набор данных для обучения. Главный вопрос, где мы возьмем этот датасет и каким он должен быть? Каким он должен быть – определяется заказчиком. Например, к нам приходит какая-то компания, которая занимается установкой систем профбезопасности на предприятии, и говорит, что в таком-то месте нельзя курить, в таком-то месте рабочий не должен работать гаечным ключом, а должен работать только отверткой, а вот в этом месте ему вообще запрещено появляться. В теории мы можем даже отслеживать технологические процессы. Скажем, у вас есть какой-то порядок сборки аппарата, который будет бурить землю где-то на скважине. У вас есть четкая последовательность действий, какую деталь куда поставить, какой винт затянуть, и так далее, и можно как раз-таки распознать, делают ли рабочие на месте все правильно или нет. 

- Но если вернуться от широких принципиальных возможностей системы к конкретной теме предотвращения нарушений общественного порядка. С одной стороны, улицы города становятся небезопасны, когда происходят какие-то столкновения, например на расовой, национальной почве. С другой стороны, возникает призрак пресловутого «большого брата», серьезные сомнения в этичности такого способа предотвращения преступлений, такого, в сущности, ограничения свободы любого, в том числе законопослушного человека.

- Да, вопрос очень скользкий. Лично я противник таких систем. Потому что прекрасно понимаю их возможности и мне не очень хочется, чтобы каждый мой шаг протоколировался, фиксировался. Однако внедрение такой системы позволит сократить число вопиющих правонарушений. Скажем так: все зависит от того, какие действия система будет распознавать и какой датасет удастся собрать. С учетом того, что камеры у нас покрывают, я думаю, процентов девяносто территории Санкт-Петербурга, можно очень четко отследить весь путь человека и что он на этом пути делает: где курит, где останавливается, где переходит на красный свет. 

- То есть вышел на улицу и все – забудь о приватности.

- Да, этого я боюсь. При огромных вычислительных мощностях можно следить за действиями всего Петербурга и при этом еще и распознавать лица. Поэтому мы сознательно ограничиваем систему.

- Помимо того, что они способны следить за всеми и каждым, такие системы могут принести пользу людям?

- Могут. Они, скажем, могут проанализировать вашу походку. Речь не о том, выпил человек или нет,  я говорю про куда более сложные вещи: можно выявить какие-то заболевания, травмы конечностей. То есть вместо того, чтобы идти на прием к ортопеду, вы можете записать свою походку перед камерой, и система вам скажет: у вас с большой долей вероятности, допустим, повреждена лодыжка. Мы сможем определить не только нарушения опорно-двигательного аппарата, но и диагностировать нейродегенеративные заболевания, записав моторные тесты.

- Кто платит, тот и заказывает музыку. Кто сейчас может заплатить за ориентирование вашей системы на конкретные задачи, кому под силу ее внедрить в практику?

- Основными покупателями будут крупные корпорации, такие как «Газпромнефть», «Полюс», «Русал» и так далее. Это будет решение задач промбезопасности. С медициной все интереснее, медицинское сообщество у нас консервативно, убедить его перейти на какие-то цифровые решения крайне тяжело. Переход в медицинской сфере возможен, только если это будет идти от Министерства здравоохранения. Из личного опыта: вы приходите к врачу, показываете ему систему, говорите, что она оценивает состояние пациента точнее, чем врач, раза в четыре. Врач говорит: очень хорошо, а что вы заложили в ваш «черный ящик»? Вы начинаете пытаться объяснять человеку, который не посвящен в эту тему, как это все работает. Он, разумеется, не понимает, что к чему, и говорит: это как-то сложно, давайте-ка я уж как-нибудь по старинке.

- Но проблема с работой по старинке состоит в том, как мы знаем, что в провинции, особенно на селе, катастрофически не хватает кадров. Речь не просто о недостатке высококвалифицированных специалистов – во многих местах отсутствуют врачи как таковые, и даже фельдшерский персонал.

- Да. Нет даже врачей общего профиля. А представьте положение с теми же неврологами-паркинсонологами. Их на всю страну сто двадцать тысяч человек. И вот пациент из села хочет обратиться к специалисту, а специалист – в райцентре, а до райцентра 400 километров. 

- Да, ситуация непростая. С одной стороны, мы видим, что развитие дистанционной медицины и диагностики открывает огромные перспективы, а с другой, что это, во-первых, дорого и все расходы лягут на бюджет, а во- вторых, существует момент консерватизма в медицинском сообществе. Не будем сбрасывать со счетов и то, что во многих областях развитие искусственного интеллекта вызовет сокращение количества рабочих мест. Даже в СМИ например, мы знаем, что в некоторых зарубежных информационных агентствах новости уже сейчас пишут машины. Каков ваш прогноз в связи с этим? 

- Я придерживаюсь точки зрения, что во всех областях, где решение критично, где от него будут зависеть человеческие жизни, к принятию решений нейронные сети в ближайшие лет сто никто не допустит. Искусственный интеллект будет лишь рекомендательной системой, он будет говорить человеку, что в такой-то ситуации логично сделать то-то и то-то. Этот момент связан и с бюрократией: представьте, что нейронная сеть ошиблась – такое бывает – и погибли люди. Кто будет за это отвечать? Алгоритм в суд не приведешь. Поэтому в «Яндекс-такси» с искусственным интеллектом, которое есть в Иннополисе, на всякий случай сидит водитель, и у него есть красная кнопочка, которую он всегда может нажать.