Газета.Ru в Telegram
Новые комментарии +

МегаФон и Nlogic создали виртуального Черчилля

МегаФон совместно с Nlogic создали бота, с помощью которого стало возможным взять интервью у бывшего премьер-министра Великобритании сэра Уинстона Черчилля. Бот был разработан для РБК, издание опубликовало интервью с британским политиком.

«Когда мы услышали про идею об интервью с Уинстоном Черчиллем, мы поняли, что можем ее реализовать, опираясь на наш опыт работы с нейронными сетями», — рассказал изданию директор по правовым вопросам «МегаФона» Сергей Переверзев.

Работа над ботом началась в августе 2021 года. За основу была взята генеративная модель GPT-3 от компании OpenAI, которую дообучили на книгах Черчилля. Столкнувшись с рядом проблем, разработчики начали заново, и в основу нового подхода заложили проверку фактов. Для этого дата-саентисты обучили нейронную сеть на базе разработанной компанией Google архитектуры BERT на всех оцифрованных книгах Черчилля. Это позволило создать алгоритм, который для любого вопроса подбирал релевантные отрывки из высказываний Черчилля.
Следующим шагом стало создание датасета из тысяч вопросов. Бот генерировал ответы на вопросы, а живые люди указывали, прав ли он или нет. Также разработчики применили технологию сиамских сети, которая на основании данных определяет степень сходства объектов.

Далее ответы бота попытались сделать похожим на речь живого человека. Для этого разработчики изучили интервью различных политиков. Как оказалось, в ответе они часто выражают сразу несколько идей, при этом они являются непрерывной речью. Для этого разработчики обучили еще одну нейросеть, которая могла определить конкретный тип связи между двумя предложениями. Благодаря этому речь виртуального Черчилля стала структурированной и «человечной».

Виртуальный Черчилль - не единственный подобный проект МегаФона. Первым ботом, разработанным на основе нейронных сетей, стал LegalApe. На Петербургском международном юридическом форуме бот состязался в мастерстве с реальным юристом Романом Бевзенко. Машина проиграла человеку со счетом 178 против 243 очков, но смогла эффектно выступить.

В 2020 году МегаФон выпустил сервис «Цифровой юрист», который нацелен на автоматизацию рутинной работы юристов. Он представляет собой натренированную нейросеть вместе с технологией оптического распознавания символов. Бот создает типовые договоры, выполняя работу, на которую раньше уходило полчаса, всего за 2-5 минут.

Разработчики видят в боте Черчилля большой потенциал. Во-первых, бот может сэкономить время на поиск цитат Уинстона Черчилля. Также на его основе можно сделать бота, обученного на текстах любой исторической личности — от Платона до Маркса. Но главное - потенциал в развитии поисковых систем. Специалисты компаний МегаФон и Nlogic отмечают, что обычная поисковая строка устарела. На смену придут боты, которые смогут обрабатывать запрос, самостоятельно отбирать нужные результаты и компилировать их в единый связный текст.

Загрузка