Для метода PSO параметры могут оказывать некоторое негативное влияние на оценку внешней ориентации камеры. Чтобы справиться с этим недостатком, был использован метод поиска глобальной оптимизации, основанный на ветвлении и привязке (BnB). Этот метод находит новые верхние и нижние границы целевой функции путем преобразования задачи сопоставления 2D-3D в задачу оптимизации. При решении задачи оценки позы такого типа могут быть сформированы две стратегии сопоставления набора точек, а именно: фиксация набора точек 3D и фиксация набора точек 2D и системы координат проекции. Первый находит оптимальную ориентацию и положение камеры в соответствии с полученными изображениями cam-era и набором 2D-точек. Последний приводит набор точек 2D-проекции, который был извлечен из проекции 3D-точки, в соответствие с набором точек 2D путем нахождения соответствующих внешних параметров камеры. Эти две стратегии сопоставления гарантируют глобальный оптимум без предварительной информации о позе [25, 26]. Однако у этого метода есть и свой недостаток: большое пространство поиска увеличивает временные затраты и вычислительную сложность.
Методы регрессии позы на основе машинного обучения изучают соответствующую взаимосвязь между изображениями и 3D-объектами сцены из обучающих выборок с различными ориентациями и положениями. Правила принятия решений и регрессионные функции обучения также применяются к выборкам, и полученные результаты используются в качестве оценки отношения тестовых выборок. Метод, основанный на обучении, может улучшить производительность позирования камеры при позиционировании монокулярных изображений с шестью степенями свободы (6DOF) и демонстрирует большие перспективы в области 3D-модели положения камеры. Было предложено несколько решений для работы с сквозной сетью. Кендалл и др. [27] представили сверточную нейронную сеть (CNN), основанную на монокулярной системе повторной локализации 6DOF в реальном времени, чтобы возвращать позу камеры из одного изображения RGB сквозным способом без каких-либо дополнительных вспомогательных условий. Обучающая метка CNN была сгенерирована автоматически из видеозаписи сцены с помощью SfM и многовидового стерео (MVS). Затем обучение передаче было использовано для определения перемещения в крупномасштабных наборах данных классификации, что стало первым применением CNN в сквозном позиционировании положения камеры 6DOF. Ву и др. [28] представили три технологии перемещения камеры на основе CNN и провели углубленное исследование и анализ CNN для перемещения камеры. Все методы, упомянутые выше, могут работать только тогда, когда информация о глубине недоступна, что является наиболее очевидным ограничением CNN в физической области.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.