2.4.3. Оценка достоверности и точности распознавания

Достоверность и точность распознавания имиджей нейронными сетями крайне важны для их использования.


Точность и надежность распознавания классической нейронной сети определяется путем тестирование нескольких десятков, сотен или тысяч имиджей и подсчета числа правильных и неправильных распознаваний. Это очень спорный тест. Из-за непрозрачности работы классических сетей распознавание сильно зависит от случайных особенностей обучения:

• иногда результаты обучения плохо воспроизводятся, одна и та же сеть, обученная на одних и тех же имиджах, в одних случаях будет распознавать лучше, в других хуже;

• нет способов адекватной оценки точности и надежности распознавания по каждому из имиджей;

• влияние отбора тестовых имиджей. Иногда их подбирают специально для обеспечения нужного результата.


Распознавание сетью PANN оценивается по числовому коэффициенту сходства рассматриваемого имиджа:

1. С любым набором загруженных в сеть отдельных имиджей.

2. Со всеми классами, которым обучена данная сеть.


При этом и классы, и отдельные имиджи ранжируются по степени сходства, что позволяет точно оценить величину различий между всеми сравниваемыми классами и тем самым оценить точность и надежность распознавания.

Безусловно, возможно формально (с точки зрения машины) правильное, но не устраивающее нас распознавание. Даже люди нередко распознают других людей не по главным, а по второстепенным признакам. Например, оценивая сходство не по чертам лица, а по одежде. Бывает, что при распознавании человеческих лиц особенности освещения оказываются более весомыми, чем черты лица.


Но проблемы такого рода вполне решаемы в PANN несколькими путями, в частности:

1. Выравнивание освещенности известными графическими или математическими средствами.

2. Введение системы оценки весомости признаков и фильтрации некоторых признаков.

3. Создание набора пересекающихся классов, как будет показано в ниже.

4. Создание «комитета по распознаванию» – логической экспертной системы, выносящей «приговор» по сумме распознаваний по разным классам и имиджам. То есть фактически воспроизводящей то, что делает человек, внимательно приглядывающийся к объекту.


2.4.4. Индексация числовых последовательностей в BCF

Индексация для быстрого поиска информации.


Сегодня в компьютерной науке широко применяется поисковая индексация. Файлы индексов облегчают поиск информации, и по своему объему они в 10 раз меньше, чем исходные файлы. Но для разных типов файлов (например, графических) индексация сложнее, и поиск не всегда работает адекватно.

PANN обеспечивает более организованный и стандартизированный подход к индексации и поиску.

Использование разработанного компанией Progress Inc формата Binary Comparison Format (BCF) позволяет строить стандартные и универсальные поисковые индексы – идентификаторы для любой числовой последовательности как линейные свертки цифрового массива. Эти индексы представляют собой последовательность матричных сумм с совпадающими номерами строк и столбцов, полученных путем векторного умножения данного цифрового массива на его собственную транспозицию. И они могут быть по объему гораздо меньше, чем при обычной индексации.

При этом процесс поиска по индексам происходит параллельно, что обеспечивает его многократное ускорение.


Например, имеется имидж, описанный в виде матрицы |X| с числом пикселей n =1024 и числом уровней веса k = 10.

Определим векторное произведение матрицы |X| на ее собственную транспозицию |X|>T как индекс I. I = |X| × |X|>T = |Σ| = Σ00, Σ11, Σ22, Σ33, Σ44, … Σ99