Читать книгу: «Теория и практика распознавания инженерных сооружений, промышленных предприятий и объектов железнодорожного транспорта при дешифрировании аэроснимков», страница 3

Шрифт:

Относительно реакции глаза на тест-объект с синусоидальным изменением яркости можно сделать следующие основные выводы:

1. Наблюдаемые пространственно-частотные характеристики глаза не являются результатом действия множества узкополосных резонансных фильтров, а не одного пространственного фильтра. Каждый из этих фильтров настроен на свою среднюю частоту, и они взаимно стохастически независимы. Каждый фильтр может быть выбран независимо, и мозг с известным приближением конструирует оптимальный для решения данной задачи обнаружения фильтр, выбирая соответствующие резонансные фильтры из имеющегося их набора.

2. Оптимальные для решения данной задачи наборы фильтров имеют огибающие типичной формы для одной определенной совокупности условий. Чувствительность зрительного анализатора мала при постоянном сигнале, резко возрастает до максимума на низких частотах и спадает примерно по закону Гаусса на высоких частотах. Пространственная частота, на которой наблюдается максимум, увеличивается с ростом яркости поля адаптации, и реакция глаза в целом охватывает широкий частотный диапазон. Диапазон максимума яркостей наблюдается в интервале 0,1–0,4 мрад^-1.

3. При постоянном увеличении максимум яркостей сдвигается в сторону высоких частот с увеличением расстояния аккомодации глаза. Реакция глаза расширяется с увеличением расстояния в связи с меньшей кривизной хрусталика и устранением лучей, идущих под большими углами к оси.

4. Пороговый контраст повышается, если положение штрихов синусоидального тест-объекта составляет угол 45° с вертикалью или горизонталью. Пороговый контраст понижается с ростом яркости поля адаптации и расстояния аккомодации.

Наличие зрительных порогов объясняется воздействием специфических помех (шумов) зрительного анализатора, определяемых спонтанной активностью сетчатки и флуктуацией проводимости нервных каналов. Таким образом, ФПМ зрительного анализатора для случая порогового наблюдения характеризует величину шумов зрительной системы и их зависимость от ПЧ наблюдаемой миры.

Имеющиеся экспериментальные данные указывают на способность зрительного анализатора человека перестраивать свои рецепторные поля, т. е. как бы изменять размер, форму и закон пропускания отождествляемой со зрительным анализатором сканирующей апертуры глаза в зависимости от формы рассматриваемых объектов и их деталей. Это дает основание применять для описания визуального восприятия (обнаружения) методы линейной фильтрации.

Для описания чувствительности к свету зрительного анализатора человека используют так называемый дифференциальный порог – отношение минимальной воспринимаемой визуальной разности фона L_фи расположенной на нем круглой или квадратной площадки (стимула) L_ск яркости фона

k_t = |L_с – L_ф|/L_ф = ΔL/L_ф. (1.9)

Рисунок 1.5 – Зависимость дифференциального порога зрения от яркости фона: 1 – α²=500 угл. мин²(350×350 мкм²), 2 – α²=100 угл. мин²(50×50 мкм²), 3 – α²= 10 угл. мин²(16×16 мкм²)

Экспериментальные данные показывают, что дифференциальный порог зависит от яркости поля адаптации L_ад, углового размера стимула на сетчатке глаза α, степени размытия границы между стимулом и фоном, продолжительности наблюдения, степени флюктуации яркости в пределах фона и стимула и от зоны сетчатки глаза, на которую проецируется стимул.

Если фон и стимул однородны, граница между ними резкая, а продолжительность наблюдения не ограничена, то в фовеальной зоне при яркостях более 10 Кд/м²(дневное зрение) и размерах стимула более 100 угл. мин²дифференциальный порог достигает сравнительно небольших значений – 0,02–0,04 (рисунок 1.5).

При уменьшении размера стимула дифференциальный порог возрастает, и при наибольшей остроте зрения (α=1 угл. мин, L_ф≥100 кд/м²) он равен примерно десяти. Если граница между фоном и стимулом нерезкая, порог увеличивается.

Дифференциальный порог может быть выражен в значениях контраста, а именно: при

Отношение ΔL/L называется отношением Вебера. В практических приложениях принимают отношение Вебера, равным 0,02.

Восприятие цветных изображений характеризуется порогом цветоразличия. Чувствительность зрительного анализатора к изменению цвета наибольшая, когда цвет детали примерно совпадает с цветом окружающего ее фона. Зрительный анализатор может различать несколько тысяч цветов, в пределах которых при наилучших условиях наблюдения цвета деталей с угловыми размерами, равными 2°, воспринимаются как одинаковые. Пороги цветоразличия можно считать примерно равными размерам этих областей. Треугольник «красный-зеленый-синий» ограничивает область цветов, воспроизводимых ЦОЭС. Величина порогов цветоразличия в значительной мере зависит не только от положения в цветовом теле, но и от направления координатных осей, т. е. от цветовой системы. Это обстоятельство может быть использовано для повышения эффективности аналого-цифрового преобразования путем перехода от одной цветовой системы к другой.

Зрительный анализатор, как правило, более чувствителен к изменению яркости деталей, чем к изменению их цветности. Этим, в частности, объясняется то, что в каналах цветности допускается обычно более высокий уровень шумов, чем в канале яркости. Относительная видность шумов в канале передачи зеленой составляющей изображения выше, чем в канале передачи красной составляющей, а в канале красной составляющей выше, чем в канале передачи синей составляющей. При уменьшении угловых размеров деталей изображения контрастная чувствительность зрения падает. Пороговый контраст необходимо учитывать, отмечая конкретно, к каким деталям изображения он относится.

Зависимость порога цветоразличия от размеров деталей и пространственной частоты изображения имеет примерно тот же характер, что и зависимость порогового контраста от этих величин. Установлено, что зрительный анализатор удовлетворительно различает цвет крупных деталей, линейные размеры которых более 12 элементов разрешения изображения. Детали, угловые размеры которых равны 6–18 угл. мин., воспринимаются как окрашенные цветами от оранжевого до зелено-синего. Детали с меньшими угловыми размерами воспринимаются как неокрашенные. Порог цветоразличия растет с увеличением ПЧ изображения независимо от его цвета. Поэтому при оценке уровней помех в каналах цветности широко используются взвешивающие характеристики помех.

Контрастная чувствительность зрительного анализатора зависит также от частоты изменений яркости деталей во времени. Такие изменения могут возникнуть как паразитный эффект при передаче многокадровых изображений. Чем меньше размеры деталей, тем слабее это влияние. С увеличением частоты мельканий их заметность вначале увеличивается, а затем падает. При частоте, превышающей 40 Гц, мелькания незаметны. Изменения яркости могут повысить контрастную чувствительность зрения к обнаружению крупных деталей на порядок. Такое повышение имеет место при частоте мельканий, равной 3–15 Гц.

При кодировании изображений, хранения и передачи в цифровом коде, а также при использовании тех или иных алгоритмов улучшения изображений необходимо оценивать качество результата. Во всех этих задачах общим является вопрос о качестве изображения о том, чтобы в процессе обработки изображений поддерживать, повышать и восстанавливать его.

Для оценки качества передачи изображений любого типа удобно было бы иметь единый обобщенный критерий. Известно, что два цвета практически неразличимы при величине 4–6 ед. МКО. В качестве численного значения цветового различия используется пороговая величина, равная 6 ед. МКО. При любом методе передачи необходимы экспериментальные оценки изображений по нескольким критериям, перечень которых согласуется с общими свойствами трактов передачи данного типа и с перечнем возможных искажений сигналов в таких трактах. При оценке качества передачи изображений на практике иногда используется критерий СКО.

Приближенный характер оценок по приведенным выше критериям делает необходимой субъективную экспертизу качества на реальных изображениях.

В настоящее время субъективное качество оценивается двумя способами: либо определяется верность воспроизведения, либо оценивается дешифрируемость изображения.

Верность воспроизведения характеризует степень отклонения обработанного изображения от некоторого эталонного. Например, при оцифровке и визуализации изображения на мониторе компьютера могут возникать погрешности, проявляющиеся в потере РС, уменьшении контрастов и т. д. Некоторые погрешности воспроизведения улучшают дешифрируемость, поэтому существуют различные процедуры подчеркивания границ, дифференцирования, цветовой коррекции изображений.

Очевидно, что количественные меры верности и дешифрируемости изображений крайне необходимы для проектирования и оценки систем воспроизведения изображений. Эти меры во многом помогут избавиться от трудоемкости и подчас неточной современной методики оценки изображений посредством субъективной экспертизы. Кроме того, на основе количественных мер можно развивать методы оптимизации систем обработки изображений.

В разработке количественных критериев верности и дешифрируемости изображений достигнуты значительные успехи. Однако введенные критерии не являются достаточно совершенными: очень часто можно привести примеры изображений, качество которых формально оценивается как высокое, а субъективно как низкое, и наоборот.

В настоящее время наиболее распространенным способом определения качества изображений является субъективная экспертиза. В качестве экспертов привлекают наблюдателей-неспециалистов. Их оценки определяют качество изображения именно так, как его воспринимает средний наблюдатель.

Кроме того, проводятся опыты со специалистами, имеющими опыт обработки изображений, от которых следует ожидать более обоснованных оценок качества. Предполагается, что опытные наблюдатели замечают небольшие погрешности изображения, которые неспециалист может проглядеть.

Существуют два вида экспертных оценок: абсолютные и сравнительные. В первом случае наблюдатель должен оценить качество изображения по какой-то заранее определенной шкале. При некоторых методиках процесс оценивания облегчается тем, что наблюдателю предоставляется также набор эталонных изображений. Существуют и другие методики, когда наблюдатель вынужден принимать решение только на основании своего собственного опыта. При сравнительных оценках наблюдатель должен ранжировать набор конкретных изображений, т. е. расставить их в ряд по убыванию качества.

Изображения оцениваются экспертами по шкалам снижения и оценки качества. Шкала снижения качества применяется для сравнительной оценки изображений до и после преобразований. Шкала оценки качества применяется для оценки преобразованного изображения при отсутствии оригинала. Как правило, пользуются следующими пятибалльными шкалами.

Шкала снижения качества:

5 – искажения незаметны;

4 – искажения заметны, но не мешают;

3 – искажения заметны, немного мешают;

2 – искажения мешают, надоедают;

1 – искажения сильно мешают.

Шкала оценки качества:

5 – отличное качество;

4 – хорошее;

3 – удовлетворительное;

2 – плохое (неприемлемое);

1 – очень плохое (совершенно неприемлемое).

На основании оценок, данных различными наблюдателями, вычисляется среднеарифметическая оценка.

Распространенным видом шкалы оценок является шкала «общего качества», когда изображениям приписываются баллы, которые соответствуют градациям от «неудовлетворительно» до «отлично», приведенным в таблице 1.1. На практике каждое изображение поступает к наблюдателю, и он выставляет балл той категории, которая, по его мнению, в наибольшей степени соответствует качеству изображения. Вариантом данной шкалы является шкала «места в группе», или относительная шкала (таблица 1.2), когда наблюдатель оценивает качество изображения, сравнивая его со всеми другими изображениями, входящими в рассматриваемую группу.

Таблица 1.1 – Шкала общего качества изображения

Таблица 1.2 – Относительная шкала качества изображения

Еще одной распространенной шкалой оценок является шкала погрешностей (таблица 1.3), согласно которой наблюдатель должен оценить в баллах степень искажений, изменяющихся от «незаметных» до «крайне нежелательных».

Результаты экспертных оценок обычно выражают с помощью среднего балла, определяемого как:

где n_k– число изображений k-й категории; C_k– соответствующий ей балл.

Таблица 3 – Шкала погрешностей

Рисунок 1.6 – Сравнение шкал качества и погрешностей, применяемых для субъективной оценки изображений

Считается, что для получения надежной оценки качества изображения необходимо опросить не менее двадцати наблюдателей. Одной из трудностей, связанных с балльными оценками, является возможная нелинейность шкалы.

На рисунке 1.6 для сравнения помещены шкала абсолютного (общего) качества, шкала погрешностей и еще одна шкала погрешностей, состоящая из трех градаций. Сравнение шкал выполнено на основе субъективных оценок.

Для сравнения и оценки качества съемочных систем в США успешно используется Национальная шкала дешифрируемости снимков (National Imagery Interpretability Scale, NIIRS), которая первоначально разрабатывалась для военных организаций, имеющих в своем штате опытных специалистов и использующих визуальные методы дешифрирования. Шкала NIIRS основана, прежде всего, на пространственном разрешении снимков, но в ней учитываются также факторы, связанные с отношением сигнал/шум и функцией рассеяния точки. Краткое описание 10-уровневой шкалы NIIRS, разработанной для панхроматических снимков, приведено в таблице 1.4. Более подробное описание содержится в работе Лихтенауэра (Leachtenauer и др., 1997) и в документации IRARS (1996). Была также разработана шкала NIIRS для оценки многоспектральных снимков (IRARS, 1995). Процедура оценки заключается в том, что снимок отдают опытному специалистудешифровщику (сертификат NIIRS) и просят его определить уровень деталей, которые он может распознать. Средний балл процедуры для панхроматических снимков, полученных системой IKONOS с разрешением 1 м по шкале NIIRS, составил 4,5.

Таблица 1.4 – Национальная шкала дешифрирования (NIIRS) Баллы Критерий.

На первый взгляд, шкала NIIRS не очень полезна для тех задач, которые решаются в области гражданского применения данных дистанционного зондирования. Однако при существующей тенденции к увеличению разрешающей способности многоспектральных датчиков до уровня таких систем, как IKONOS, QuickBird и Orb View, можно ожидать, что одни и те же данные будут использоваться как для военных, так и для гражданских целей. Кроме того, положенная в основу NIIRS идея о необходимости связывания характеристик съемочной системы и параметров решаемой задачи может оказаться очень полезной для количественного анализа ЦОЭС. В частности, предлагается математически связать параметры датчиков со шкалой NIIRS и оценивать возможность использования той или иной съемочной системы с помощью обобщенной формулы качества изображения (Leachtenauer и др., 1997).

На результаты субъективных экспертных оценок влияют характер рассматриваемых изображений и окружающая обстановка (условия эксперимента). Если наблюдатель видел подобные изображения, то он склонен более строго оценивать погрешности, поскольку имеет сложившееся представление о структуре изображения. С другой стороны, в незнакомом изображении искажения могут оставаться незамеченными, пока наблюдателю не будет на них указано. Условия эксперимента должны в максимально возможной степени соответствовать условиям наблюдения в реальной обстановке. Следует с осторожностью пользоваться экспертными оценками, если изменились условия наблюдения. Так, качество изображения на экране обычного телевизионного монитора может быть расценено как «хорошее», с «еле заметными» искажениями. Однако если то же самое изображение будет представлено в виде фотографии, снятой с помощью высококачественной аппаратуры, то все погрешности, ранее скрытые нелинейностями телевизионного устройства, неожиданно могут стать очень заметными.

2. Основы применения искусственного интеллекта при дешифрировании аэроснимков

2.1. Основные определения искусственного интеллекта

Искусственный интеллект как область знаний охватывает все области человеческой деятельности, включая информатику, математику, философию, психологию, термодинамику, лингвистику, здравоохранение, инженерию, экономику, когнитивные науки и др.

Эти знания используются в таких приложениях, как системы управления, системы принятия решений, многоагентные системы, системы обработки естественного языка, распознавание образов, распознавание речи, обработка знаний, интеллектуальный анализ данных, логистика и другие приложения.

Ниже раскрыты основные термины и определения, принятые в области искусственного интеллекта в соответствии с ГОСТ Р 59277–2020.

Искусственный интеллект – комплекс технологических решений, позволяющий имитировать когнитивные функции человека (включая самообучение, поиск решений без заранее заданного алгоритма и достижение инсайта) и получать при выполнении конкретных практически значимых задач обработки данных результаты, сопоставимые, как минимум, с результатами интеллектуальной деятельности человека. Комплекс технологических решений включает в себя информационнокоммуникационную инфраструктуру, программное обеспечение (в том числе, в котором используются методы машинного обучения), процессы и сервисы по обработке данных, анализу и синтезу решений.

Компьютерное зрение – способность функционального блока получать, обрабатывать и интерпретировать визуальные данные.

Нейротехнологии – технологии, которые используют или помогают понять работу мозга, мыслительные процессы, высшую нервную деятельность, в том числе технологии по усилению, улучшению работы мозга и психической деятельности.

Система искусственного интеллекта (СИИ) – техническая система, в которой используются технологии искусственного интеллекта.

Технологии искусственного интеллекта – комплекс технологических решений, направленных на создание систем искусственного интеллекта.

Автоматизированная система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.

Автоматическая система – совокупность управляемого объекта и автономной СИИ, функционирующая самостоятельно, без участия человека.

Автономность – характеристика СИИ, связанная с ее способностью самостоятельно (без участия человека) выполнять возложенные на нее функции в течение заданного времени и с заданными показателями качества, надежности, безопасности. Системы, работающие в автономном режиме, подлежат обязательному контролю или надзору со стороны человека.

Агент – физический/программный объект, который оценивает собственное состояние, состояние других объектов и окружающей среды для выполнения своих действий, включая прогнозирование и планирование, которые максимизируют успешность, в том числе при неожиданном изменении оцениваемых состояний, достижения своих целей.

Алгоритм – конечное упорядоченное множество точно определенных правил для решения конкретной задачи.

Библиотека знаний – набор информационных (знаковых, символьных) моделей, которые выражают знания (также могут включать в себя определение моделей и их требования) о ряде вещей (понятий) и хранятся и воспроизводятся в электронном виде.

Вычислительные средства (средства вычислительной техники) – технические средства, непосредственно осуществляющие обработку данных.

Данные – предоставление информации в формальном виде, пригодном для передачи, интерпретации или обработки людьми или компьютерами.

Доверие к системе искусственного интеллекта – уверенность потребителя и, при необходимости, организаций, ответственных за регулирование вопросов создания и применения систем искусственного интеллекта, и иных заинтересованных сторон в том, что система способна выполнять возложенные на нее задачи с требуемым качеством.

Интероперабельность – способность двух или более информационных систем или компонентов к обмену информацией, в том числе на организационном, семантическом и техническом уровнях, и к использованию информации, полученной в результате обмена.

Интероперабельная система – система, в которой входящие в нее подсистемы работают по независимым алгоритмам, не имеют единой точки управления, все управление определяется единым набором стандартов – профилем интероперабельности.

Информационная технология – методы, способы, приемы и процессы обработки (сбора, накопления, ввода-вывода, приема-передачи, хранения, поиска, регистрации, преобразования, анализа и синтеза, предоставления, отображения, распространения и уничтожения) информации с применением программных и технических средств.

Киберфизическая система – информационно-технологическая концепция, подразумевающая интеграцию вычислительных ресурсов в физические процессы. В такой системе датчики, оборудование и информационные системы соединены на протяжении всей цепочки в логику управления для создания стоимости, выходящей за рамки одного предприятия или бизнеса. Эти системы взаимодействуют друг с другом с помощью стандартных интернет-протоколов для прогнозирования, самонастройки и адаптации к изменениям.

Многоагентная система – система, состоящая из множества взаимодействующих интеллектуальных агентов. Многоагентные системы могут решить проблемы, которые трудны или невозможны для отдельного агента или для единой (монолитной) системы.

Программное обеспечение (программа, программное средство) – упорядоченная последовательность инструкций (кодов) для вычислительного средства, находящаяся в памяти этого средства и представляющая собой описание алгоритма управления вычислительными средствами и действий с данными.

Распределенная система – распределенная система обеспечивает решение проблемы управления на базе распределенной системы знаний в отличие от многоагентных систем, где базы знаний отдельных агентов взаимодействуют.