Газета.Ru в Telegram
Новые комментарии +

Форму определяет тепло

Предложен принципиально новый метод компьютерного распознавания образов

«Нагревая» виртуальные объекты и вычисляя их «тепловую подпись», можно получить универсальный инструмент компьютерного распознавания образов, не зависящий от субъективных параметров, определяемых программистом. Новый метод может совершить революцию в развлекательной и шпионской индустрии.

Нет ничего проще, чем распознать руку в сжатом кулаке, но для вычислительного устройства, «думающего» алгоритмически, пятерня и кулак — формально разные объекты, процесс распознавания которых выливается в запутанную и нетривиальную процедуру с вероятностным исходом, не всегда приемлемым, если цена ошибки является критичной (например, при различении опухолей и нормальных тканей в трехмерной томографии или пешехода и мотоциклиста при автонавигации в условиях городской среды).

Даже независимо от того, что скажет нейрофизиология о представлении и обработке визуальной информации в мозгу (хотя в дальнейшем и такая информация может оказаться важной), интуиция подсказывает, что

естественная способность различать образы зиждется на умении автоматически разбивать сложные объекты на более простые.

Какую бы форму мы ни наблюдали — кулака, раскрытой пятерни или указующего перста — мы всегда распознаем руку по составным частям — одной ладони и пяти пальцам, четыре из которых, в свою очередь, состоят из трех отдельных элементов и один из двух (разбивать руку на еще более мелкие составляющие можно, но нет практической необходимости, если вы не хиромант).

В случае относительно простых моделей мы можем сообщить компьютеру заранее, как и на какое число элементов следует разбить объект. Но что делать в ситуации, когда объекты очень сложные (молекула белка), непредсказуемые (незнакомый ландшафт) и тем более когда простые элементы образуют бесконечно разные конфигурации — сами, или если смотреть на них под разными углами, или и то и другое одновременно?

В этом случае требуется найти независимое от нас, универсальное и устойчивое правило, по которому вычислительное устройство без предварительной подсказки будет разбивать сложные объекты на более простые и, высчитывая их соотношение, правильно распознавать какие угодно формы.

Поиск и формулировка такого правила — та самая жар-птица, за которой гоняются теоретики и практики систем распознавания образов.

Прогресс здесь достигнут немалый, но все существующие методы от вышесформулированного правила пока что далеки, так как требуют участия человека, задающего параметры разбиения объекта на тех или иных стадиях распознавания.

Остроумное решение проблемы предложила исследовательская группа Картика Рамани, профессора Университета Пердью (США), выступающего с соответствующим докладом на проходящей сейчас в Колорадо-Спрингс (штат Колорадо, США) ежегодной конференции по компьютерному зрению и распознаванию образов.

Итак, как сформулировать универсальный алгоритм, сегментирующий незнакомые сложные объекты по одному и тому же правилу? Группа Рамани предложила искать такое правило не в математических абстракциях, а в

физической реальности, управляемой общими законами. И нашла подходящий вариант в уравнениях теплопроводности, описывающих диффузию тепловой энергии в сплошных средах.

Если известна теплоемкость и теплопроводность среды, уравнения тепловой диффузии описывают зависимость температуры среды от пространственных координат и времени. Другими словами, зная форму объекта и его физические параметры, мы можем точно знать, как будет меняться температура его отдельных точек. Теперь, предварительно разложив трехмерную поверхность на простейшие треугольники (классическая процедура триангуляции, давно используемая в трехмерной графике), виртуально нагреем получившуюся фигуру в одной точке и получим, используя уравнения теплопроводности, карту распространения тепла (Заметим, что нас в данном случае интересуют не реальные физические свойства объекта, а его форма, влияющая на диффузию тепловой энергии, то есть коэффициенты теплоемкости и теплопроводности фиксируем как одинаковые во всех случаях.)

Эту карту группа Рамани и предлагает использовать в качестве уникальной «тепловой подписи» объекта.

Зафиксировав градиентную разницу температур между точками, можно перевести тепловую карту в двумерную гистограмму, в которой расстояние между точками будет соответствовать определенному фигурному сегменту. Теперь независимо от того, как расположатся точки фигуры в пространстве, то есть геометрически, градиентные расстояния — рисунок гистограммы — будет одинаковым. Другими словами, как ни крути объект, его «тепловая подпись» останется все время той же.

Таким образом, виртуально нагревая трехмерные фигуры, вычислительное устройство получает универсальное, объективное и независимое от нашей воли правило сегментирования и последующего распознавания образов. Сколько времени пройдет до реального внедрения этого метода, получившего название «теплокартирование», в капиталоемкую индустрию компьютерной томографии, видеоигр, 3D-поисковых систем и шпионской техники, сказать сложно. Авторы уже подали заявку на патент, но, возможно, пока все копирайты будут оформляться, на прилавках уже появятся видеодомофоны, «умеющие стопроцентно распознавать вашего дедушку».

Как бы то ни было, никто не предполагал, что уравнения из области тепловой физики, к которым в разное время приложили руку Франсуа Фурье и Альберт Эйнштейн, получат столь неожиданное применение. Блестящий пример полезной конвергенции наук.

Загрузка