Интересная система распознавания дорожных знаков — устройство и работа
Интересная система распознавания дорожных знаков — устройство и работа

Интересная система распознавания дорожных знаков — устройство и работа

Многие модели современных автотранспортных средств оснащаются комплексом систем, предназначенных для поднятия уровня активной и пассивной безопасности. Одни удерживают машину в рамках полосы, другие препятствуют блокировке колес, третьи облегчают вхождение в повороты и т. д. Особняком стоит система по распознаванию знаков дорожного движения. На английском она часто обозначается аббревиатурой TSR.

Что такое система распознавания дорожных знаковЧто такое система распознавания дорожных знаков

Как работает система распознавания дорожных знаков.

Как функционирует TSR

На сегодняшний день ведущие производители автомобилей (такие, как Ford, BMW, Audi, Volkswagen, Opel, Mercedes-Benz) устанавливают ее на свою продукцию. Основным предназначением этой новинки является предупреждение тех, кто в данный момент за рулем, о необходимости соблюдения максимальной скорости движения. В тот момент, когда машина минует очередной знак, установка фиксирует текущую скорость движения и то, насколько водитель ее придерживается. Если же нет, то оборудование напоминает водителю о недопустимости превышения. Интересно, что у разных производителей такие установки могут называться по-разному, хотя выполняют схожие функции. Так, у Mercedes Benz она именуется Speed Limit Assist (буквально, система по контролю за ограничением скорости), у Opel — Opel Eye (признана лучшей инновацией в сфере автобезопасности за 2010-й год). Производитель Вольво назвал свое детище Road Sign Information, что в переводе звучит, как комплекс информирования о дорожных знаках.

Что такое OCR?

OCR (англ. optical character recognition, оптическое распознавание символов) — это технология автоматического анализа текста и превращения его в данные, которые может обрабатывать компьютер. Когда человек читает текст, он распознает символы с помощью глаз и мозга. У компьютера в роли глаз выступает камера сканера, которая создает графическое изображение текстовой страницы (например, в формате JPG). Для компьютера нет разницы между фотографией текста и фотографией дома: и то, и другое — набор пикселей.

Читайте также:  Система 4matic: как работает полный привод у Mercedes-Benz?

Именно OCR превращает изображение текста в текст. А с текстом уже можно делать что угодно.

Ключевые компоненты и принцип действия

Итак, каждая из подобных систем для распознавания (идентификации) дорожных знаков имеет примерно идентичную техническую конструкцию. Главными составляющими ее выступают: блок управления, стандартная видеокамера, а еще средство для передачи и вывода результатов. Что касается самой камеры, то ее крепят за зеркалом заднего вида на лобовом стекле. Ее задача — отслеживать пространство впереди и по бокам транспортного средства, там, где могут устанавливаться знаки в районе дорожного полотна. Снятое изображение транслируется на блок управления. Видеокамеры в настоящее время активно применяется при разработке различных современных систем безопасности. Теперь стоит рассмотреть, как работает и для чего предназначен электронный блок управления. Основные его задачи таковы:

  • распознавание по внешней форме дорожного знака;
  • идентификация его цветового исполнения;
  • считывание надписи (в данном случае, цифр, обозначающих скоростной режим);
  • контроль текущей скорости передвижения;
  • распознавание прочей информации, которую передает знак (к примеру, зона или период действия);
  • извещение при помощи звука либо цветового индикатора в случае отклонения фактической скорости от рекомендуемого значения.

Что такое TSRЧто такое TSR

Как это устроено?

Представьте, что в алфавите есть только одна буква «А». Сделает ли это задачу преобразования картинки в текст проще? Нет. Дело в том, что у каждой буквы (и любой другой графемы) есть аллографы — различные варианты начертания.

Варианты начертания буквы «а».

Человек легко поймет, что все это буква «А». Для компьютера же есть два способа решения проблемы: распознавать символы целостно (распознавание паттерна) или выделять отдельные черты, из которых состоит символ (выявление признаков).

Распознавание паттерна

В 1960-х годах был создан специальный шрифт OCR-A, который использовался в документах типа банковских чеков. Каждая буква в нем была одинаковой ширины (т.н. шрифт фиксированной ширины или моноширинный шрифт).



Образец шрифта OCR-A

Принтеры для чеков работали с этим шрифтом, и для его распознавания было разработано программное обеспечение. Поскольку шрифт был стандартизирован, его распознавание стало относительно простой задачей. Следующим шагом стало обучение программ OCR распознавать символы еще в нескольких самых распространенных шрифтах (Times, Helvetica, Courier и т.д.).

Выявление признаков

Этот способ еще называют интеллектуальным распознаванием символов (англ. intelligent character recognition, ICR). Представьте, что вы — OCR-программа, которой дали множество разных букв, написанных разными шрифтами. Как вам отобрать из этого множества все буквы «А», если каждая из них немного отличается от другой?

Можно использовать такое правило: если видишь две линии, сходящиеся наверху в центре под углом, а посередине между ними горизонтальная линия, то это буква «А». Это правило поможет распознать все буквы «А» независимо от шрифта. Вместо распознавания паттерна выделяются характерные индивидуальные черты, из которых состоит символ. Большинство современных омнишрифтовых (умеющих распознавать любой шрифт) OCR-программ работают по этому принципу. Чаще всего в них используются классификаторы на основе машинного обучения (т.к. фактически перед нами стоит задача классификации картинок по классам-буквам) в последнее время некоторые OCR-движки перешли на нейронные сети.

Как функционируют более современные системы идентификации

Такой индикатор выводится на дисплей приборной панели или информ-системы и сигнализирует до тех пор, пока водитель не убавит скорость или не закончится действие знака, ограничивающего скорость передвижения. На некоторых из современных авто система распознавания работает в тандеме с комплексом навигации, который черпает сведения из навигационных карт. Для того, чтобы система могла работать эффективно и ночью, и в плохую погоду, она может оснащаться инфракрасным прожектором. Существуют ситуации, когда видеокамера по каким-либо причинам не может идентифицировать табличку с ограничением скорости. В таких случаях информация будет взята с навигационных карт, а сигнализатор отреагирует на нее, как ему и положено. Самые прогрессивные системы, к примеру, такие, как устанавливает на свои машины Опель, распознают не только знаки по ограничению скоростного режима, но и те, которые запрещают обгон на конкретном участке дороги. Однако с развитием технологий были разработаны более хитроумные конструкции. Они могут идентифицировать следующие типы дорожных знаков:

Читайте также:  Назначение системы кругового обзора, устройство и как она работает
  • главная дорога или окончание ее действия;
  • запрещен въезд;
  • запрещен обгон;
  • начало или конец населенного пункта;
  • преимущество в движении или требование уступить движение;
  • начало или окончание автомагистрали;
  • территория «жилая зона»;
  • конец действия всех ограничений.

Функционирование системы распознаванияФункционирование системы распознавания

OCR по шагам

Предобработка

Чем лучше качество исходного текста на бумажном носителе, тем лучше будет качество распознавания. А вот старый шрифт, пятна от кофе или чернил, заломы бумаги понижают шансы. Большинство современных OCR-программ сканируют страницу, распознают текст, а затем сканируют следующую страницу. Первый этап распознавания заключается в создании копии черно-белого цвета или в оттенках серого. Если исходное отсканированное изображение идеально, то все черное — это символы, а все белое — фон.

Распознавание

Хорошие OCR-программы автоматически отмечают трудные элементы структуры страницы — колонки, таблицы и картинки. Все OCR-программы распознают текст последовательно, символ за символом, словом за словом и строчка за строчкой. Сначала OCR-программа объединяет пиксели в возможные буквы, а буквы — в возможные слова. Затем система сопоставляет варианты слов со словарем. Если слово найдено, оно отмечается как распознанное. Если слово не найдено, программа предоставляет наиболее вероятный вариант и, соответственно, качество распознавания будет не таким высоким.

Постобработка

Некоторые программы дают возможность просмотреть и исправить ошибки на каждой странице. Для этого они используют встроенную проверку орфографии и выделяют неверно написанные слова, что может указывать на неправильное распознавание. Продвинутые OCR-программы используют так называемый метод поиска соседа, чтобы найти слова, которые часто встречаются рядом. Этот метод позволяет исправить неверно распознанное словосочетание «тающая собака» на «лающая собака».

Кроме того, некоторые проекты, которые занимаются оцифровкой и распознаванием текстов, прибегают к помощи волонтеров: распознанные тексты выкладываются в открытый доступ для вычитки и проверки ошибок распознавания.

Особые случаи

Для высокой точности распознавания исторического текста с необычными графическими символами, отличающимися от современных шрифтов, необходимо извлечь соответствующие изображения из документов. Для языков с небольшим набором символов это можно сделать вручную, но для языков со сложными системами письменности (например, иероглифических) ручной сбор этих данных нецелесообразен.

Для распознавания исторических китайских текстов требуется внести в OCR-программу как минимум 3000 символов, которые имеют разную частотность. Если для распознавания исторических английских текстов достаточно ручной разметки нескольких десятков страниц, то аналогичный процесс для китайского языка потребует анализа десятков тысяч страниц. В то же время многие исторические варианты китайской письменности имеют высокую степень сходства с современным письмом, поэтому модели распознавания символов, обученные на современных данных, часто могут давать приемлемые результаты на исторических данных, хоть и со сниженной точностью. Этот факт вместе с использованием корпусов позволяет создать систему для распознавания исторических китайских текстов. Для этого исследователь Д. Стеджен (Donald Sturgeon) из Гарварда обработал два корпуса: корпус транскрибированных исторических документов и корпус отсканированных документов желаемого стиля.

После предварительной обработки изображений и этапов сегментации символов процедура извлечения обучающих данных состояла из: 1) применения модели распознавания символов, обученной исключительно на современных документах, к историческим документам для получения промежуточного результата оптического распознавания с низкой точностью; 2) использование этого промежуточного результата для соотнесения изображения с его вероятной транскрипцией; 3) извлечение изображений размеченных символов на основе этого соотнесения; 4) выбор из размеченных символов подходящих обучающих примеров. Полученные данные могут использоваться без проверки для обучения новой модели распознавания символов, позволяющей достичь более высокой точности на аналогичном материале.

Понятный алгоритм работы — повышение уровня безопасности

Однако это не означает, что каждый из этих знаков будет отображаться на информационном табло дисплея (приборной панели). Эти сведения учитываются в текущих параметрах движения автомобиля, сверяются с данными, которые берутся с навигационных карт. Однако весь комплекс по распознаванию знаков дорожного движения функционирует как единое целое и направлен на то, чтобы повысить безопасность для водителя и его пассажиров, а также других участников. Принцип работы таких систем рассчитан на то, чтобы визуально распознавать дорожные объекты, считывать с них информацию и логически обрабатывать ее. Происходит это примерно по следующему алгоритму:

  • видеокамера находится в постоянном наблюдении и считывает данные о наличии дорожных знаков;
  • как только обнаруживается объект по форме напоминающий знак, сведения о нем передаются на ЭБУ;
  • начинается процесс распознавания цвета и дополнительной информации;
  • в базе данных проводится поиск соответствия;
  • на основании проведенного анализа система информирует водителя, при необходимости.

Установка будет уведомлять водителя в том случае, если он превысил допустимый порог скорости. В остальных ситуациях на табло будет просто выводиться информация о текущей скорости транспортного средства. Системы для идентификации знаков на дороге обладают рядом достоинств, однако высокие требования предъявляются к качеству записи видеокамеры — все-таки автомобили передвигаются с высокой скоростью.

Математическое и программное обеспечение распознавания запрещающих дорожных знаков

 С каждым годом количество автомобилей в мире растет, движение становится всё более интенсивным. Автоматическая система распознавания дорожных знаков позволит водителю уверенней вести себя в плотном городском потоке и на загородных трассах, оповещая его о дорожных знаках в поле видимости. В связи с этим можно считать, что работа, связанная с распознаванием дорожных знаков, является актуальной и необходимой на данный момент времени. Также данная работа может быть применена при разработке беспилотных автомобилей.

Цель работы: повышение безопасности дорожного движения на основе разработки математического и программного обеспечения распознавания запрещающих дорожных знаков.

Читайте также:  Назначение системы кругового обзора, устройство и как она работает

Для достижения поставленной цели необходимо решить следующие задачи:

  1. Провести обзор и анализ существующих математических моделей и методов, которые применяются для решения задачи распознавания дорожных знаков.
  2. Выбрать математическую модель и метод решения поставленной задачи.
  3. Разработать алгоритм для распознавания запрещающих дорожных знаков.
  4. Разработать программное обеспечение для распознавания запрещающих дорожных знаков.
  5. Провести вычислительный эксперимент с целью проверки точности распознавания на основе разработанного ПО.

1 Анализ проблемы и постановка задачи

1.1 Анализ предметной области

Начинающим водителям, как правило, тяжело в полной мере контролировать дорожную ситуацию, поэтому они могут не заметить дорожный знак.

Также некоторые опытные автолюбители перестают обращать внимание на дорожные знаки, но по совсем другим причинам. Во-первых, привычка: знак всегда висел на своем месте — зачем лишний раз на него смотреть; во-вторых — уверенность в собственном опыте. Это опасные заблуждения, приводящие к ДТП [1].

Следующие факторы также приводят к невнимательности и невозможности сфокусироваться на дорожных знаках и той информации, которую они несут: смена дорожной ситуации, дорожного покрытия и рельефа, физическое самочувствие водителя, внешние отвлекающие факторы.

Таким образом, автоматическая система распознавания дорожных знаков будет полезна как начинающим, так и опытным водителям. А набирающие популярность беспилотные автомобили должны обладать точностью распознавания, близкой к стопроцентной, так как от этого зависит жизнь других водителей и пешеходов.

1.2 Содержательная постановка задачи

Имеется коллекция изображений запрещающих дорожных знаков. На вход программы поступает изображение — реальное изображение с камеры, которая фиксирует дорожную ситуацию. Программа должна выдать один из следующих ответов:

– на данном изображении запрещающий знак отсутствует;

– если на изображении присутствует запрещающий дорожный знак, то выводится его класс.

Необходимо разработать математическое и программное обеспечение, которое будет распознавать на изображении запрещающие дорожные знаки.

1.3 Формальная постановка задачи

Формальная постановка задачи классификации запрещающих дорожных знаков.

;

;

.

Дано:

— изображения из обучающей выборки, — количество изображений;

— известные классы запрещающих дорожных знаков, — количество известных классов;

Известна зависимость между изображениями из обучающей выборки и классами запрещающих дорожных знаков:

.

Найти:

— алгоритм, который будет классифицировать изображение .

Читайте также:  Система 4matic: как работает полный привод у Mercedes-Benz?

На рисунке 1 изображена диаграмма IDEF0 для решения задачи распознавания запрещающих дорожных знаков.

Рис. 1. Диаграмма IDEF0 для решения задачи распознавания запрещающих дорожных знаков

На вход процедуры распознавания поступает изображение с камеры. Вид дорожных знаков соответствует требованиям, которые определены в ГОСТ Р 52290–2004 и Венской конвенцией о дорожных знаках и сигналах. Процедура распознавания осуществляется при помощи следующих механизмов: методы улучшения качества изображения, метод детектирования знака, метод классификации знака. На выходе процедуры указывается результат распознавания.

1.4 Структура решения задачи

Для начала процесса классификации знака необходимо предварительно обработать входное изображение, а затем локализовать запрещающие дорожные знаки.

2 Анализ моделей и методов решения

2.1 Аналитический обзор известных математических моделей подзадач

2.1.1 Предварительная обработка изображения

Предварительная обработка изображения может положительно повлиять на качество выделения признаков и результаты анализа изображения. Предварительная обработка изображения аналогична математической нормировке набора данных, что является общим этапом во многих задачах по анализу данных [2].

Множество подходов к улучшению изображений распадается на две большие категории: методы обработки в пространственной области (пространственные методы) и методы обработки в частотной области (частотные методы). Методы обработки в частотной области основываются на модификации сигнала, формируемого путем применения к изображению преобразования Фурье [3].

В дальнейшем рассматриваются только пространственные методы повышения качества изображений, что в основном связано с необходимостью значительного объема вычислений при выполнении преобразований Фурье для растровых изображений больших размеров (800×600 пикселей и более).

Основные пространственные методы улучшения изображений [3]:

– градационные преобразования [3];

– видоизменение гистограммы изображения [3];

– улучшение на основе арифметико-логических операций [3];

– сглаживающие пространственные фильтры [3].

При решении конкретных задач для достижения приемлемых результатов может потребоваться применение нескольких дополняющих друг друга методов улучшения [3].

2.1.2 Локализация запрещающего знака

Существует несколько основных подходов к локализации дорожных знаков на изображении:

– локализация дорожного знака по цвету [4];

– локализация дорожного знака по форме [4];

– локализация дорожного знака при помощи методов машинного обучения [4];

  • использование сверточных нейронных сетей для детектирования знака [5].

Пороговую сегментацию [6] по цвету можно проводить в различных цветовых моделях:

– RGB (red, green, blue — красный, зелёный, синий) [6];

– HSV (hue, saturation, value — тон, насыщенность, значение) [7].

Методы, которые можно использовать для поиска формы знака:

– обобщенное преобразование Хафа — это метод поиска произвольных форм в изображении [4];

– методы контурного анализа [8]:

  • методы нахождения контуров: детектор границ Кэнни [8];
  • прослеживание контуров [8];
  • анализ с помощью графов [8].
  • методы сравнения контуров [9]:
      сравнение контуров с помощью вычисления моментов [3];
  • cравнение контуров методом морфинга (метод активных контуров) [9].
  • 2.1.3 Классификация знака

    Машинное обучение — систематическое обучение алгоритмов и систем, в результате которого их знания или качество работы возрастают по мере накопления опыта [10].

    Методы машинного обучения, которые используются для классификации дорожных знаков:

    – SVM — метод опорных векторов [11];

    – искусственные нейронные сети [12];

    – методы «глубинного» обучения — Deep Learning [5] [13] [14]:

    • сверточные нейронные сети [5] [14].

    2.2 Сравнительный анализ подходов, методов для решения подзадач

    Проведем сравнительный анализ методов для каждого этапа задачи распознавания дорожных знаков.

    Улучшение качества изображения, уменьшение шума.

    Общей теории улучшения изображений не существует. Когда изображение обрабатывается для визуальной интерпретации, наблюдатель является окончательным судьей того, насколько хорошо действует конкретный метод [3].

    Медианный фильтр показывает отличные возможности подавления шума при меньшем эффекте расфокусировки, чем у линейных сглаживающих фильтров [3]. Медианный фильтр прост в реализации, поэтому для решения задачи уменьшения шума используется данный фильтр.

    Читайте также:  Система 4matic: как работает полный привод у Mercedes-Benz?

    Локализация знака.

    Для локализации знака будем использовать комбинированный подход: нахождение цвета знака и нахождение формы знака.

    Для поиска цвета используется пороговая обработка в цветовом пространстве HSV. Цветовая модель HSV является наиболее удобным представлением цветных изображений для их цветовой сегментации [7].

    Для поиска формы знака будем использовать детектор границ Кэнни, а затем сравнивать полученные контуры с шаблоном с помощью вычисления моментов контуров.

    Классификация знака.

    Бинарное изображение можно представить в виде вектора признаков, где признаками являются значения (0 или 1) соответствующих пикселей. Виды запрещающих дорожных знаков стандартизированы. Для их классификации можно использовать искусственную нейронную сеть (ИНС), подавая на вход бинарное изображение в виде вектора признаков.

    3 Математическое, информационное и методическое обеспечение

    3.1 Предварительная обработка изображения

    Математическая модель подзадачи.

    Имеется цветное изображение в пространстве RGB размерами пикселей. Изображение в данной цветовой модели состоит из трёх каналов. Каждый пиксель изображения можно представить следующим образом:

    (3‑1)

    где — значение интенсивности в красном канале, — значение интенсивности в зеленом канале, — значение интенсивности в синем канале. Необходимо применить метод для улучшения изображения и получить обработанное изображение:

    (3‑2)

    Метод решения подзадачи.

    Для решения данной задачи используется медианный фильтр. Данный фильтр заменяет значение пикселя на значение медианы распределения интенсивностей всех пикселей в окрестности (включая и исходный).

    Рассмотрим действие медианного фильтра в точке исходного изображения с окрестностью .

    Применение медианного фильтра для красного канала:

    (3‑3)

    где — функция нахождения медианного значения аргументов .

    Аналогично находим новые значения интенсивности в зеленом канале и в синем канале .

    Итоговое значение цвета в точке образуется по равенству (3‑2).

    3.2 Локализация знака

    Рассмотрим задачу нахождения цвета знака.

    Математическая модель подзадачи.

    Имеется цветное изображение в пространстве RGB размерами пикселей. Каждый пиксель изображения можно представить равенством (3‑1).

    Необходимо произвести цветовую сегментацию для получения бинарного изображения:

    (3‑4)

    Метод решения подзадачи.

    Проводится цветовая сегментация в цветовом пространстве HSV. Цветовая модель HSV может быть получена из модели RGB [15].

    Для нахождения красного цвета на изображении в пространстве HSV используется пороговая обработка [15]:

    (3‑5)

    Данная обработка позволяет получить бинарное изображение , где белым цветом обозначены области красного цвета на исходном изображении .

    Рассмотрим задачу нахождения формы знака.

    Применив детектор границ Кэнни [8] к обработанному изображению, можно сравнить контуры на изображении с шаблоном. Инвариантные моменты контуров [3] позволяют сравнивать контуры независимо от масштаба.

    Таким образом, методы для поиска цвета и поиска формы позволяют локализовать на входном изображении интересующую нас фигуру — круглый знак с красным ободом.

    3.3 Классификация знака

    Подготовка краспознаванию.

    Перед процедурой распознавания изображение необходимо обработать. Во-первых, необходимо применить эквализацию гистограммы изображения [3]. Во-вторых, необходимо преобразовать полученное черно-белое изображение к бинарному при помощи метода Оцу — алгоритма вычисления порога бинаризации [16].

    Для классификации знака используется искусственная нейронная сеть [17].

    Для корректного функционирования ИНС необходимо найти оптимальные веса всех синаптических связей (синапсов). Этот этап называется обучением ИНС. Существуют различные алгоритмы обучения ИНС [17]. Для решения данной задачи был выбран алгоритм обратного распространения ошибки [17]. Используется сигмоидальная функция активации нейрона [17].

    Структура нейронной сети.

    Максимальная точность классификации при кросс-валидации [18] составила 87 %. Данный показатель был получен при следующей структуре нейронной сети: входной слой — 400 нейронов (изображение 20×20), один скрытый слой с 20 нейронами. При большем количестве нейронов в скрытом слое средняя точность классификации падает.

    4 Программное обеспечение

    4.1 Язык программирования и инструментальные средства разработки

    Язык программирования — C++.

    Для решения задачи распознавания запрещающих дорожных знаков необходимо совершать операции непосредственно с изображениями. Для этого используется библиотека для работы с изображениями OpenCV (Open Source Computer Vision) 3.1.

    5 Оценка качества решения

    Распознавание дорожных знаков является сложной задачей, так как входные данные могут быть сильно искажены. Например, знак может быть чем-то закрыт, погнут, может быть недостаточно освещен.

    В качестве метрики для оценки качества решения использовалась точность распознавания (accuracy) [18].

    Точность локализации запрещающего знака составила 69 %. Точность классификации запрещающего знака составила 87 %.

    Анализ результатов показывает, что необходимо улучшить метод детектирования запрещающего дорожного знака. Также качество локализации и классификации знака ухудшают следующие факторы: слабая освещенность, плохая погода, положение знака. Качество классификации ухудшается при накладывании на знак лишних предметов. Например, большой кусок грязи или снега.

    Тестирование времени работы программы.

    Характеристики компьютера, на котором проходило тестирование времени работы программы: процессор — Intel(R) Core(TM) i3–2120 CPU 3.30 GHz, ОЗУ — 8.00 ГБ.

    Среднее время распознавания на изображениях размером 640480 пикселей составляет 100 мс — 0.08 с.

    Среднее время распознавания на изображениях размером 19361296 пикселей составляет 400 мс — 0.2 с.

    Результаты тестирования по времени показывают, что при разрешении изображения 640480 пикселей достигается наилучшее время работы программы, а также остается запас по времени для добавления новых методов в существующий алгоритм.

    6 ЗАКЛЮЧЕНИЕ

    В результате выполнения работы был проведен обзор существующих математических моделей, которые решают задачу распознавания дорожных знаков.

    Проведен анализ методов обработки цифровых изображений. Для удаления шума и улучшения качества изображения был выбран медианный фильтр. Для детектирования знаков использовались цветовая сегментация и контурный анализ.

    Проведен анализ методов распознавания. Наилучшие результаты показала искусственная нейронная сеть с одним скрытым слоем, в котором 20 нейронов. Оптимальный размер изображения для классификации запрещающих дорожных знаков — 20×20 пикселей.

    Разработан алгоритм для распознавания запрещающих дорожных знаков. Данный алгоритм может быть модифицирован для распознавания знаков других категорий.

    Разработано программное обеспечение для распознавания запрещающих дорожных знаков на языке C++ c использованием библиотеки OpenCV 3.1.

    Проведена оценка качества решения. Анализ результатов показывает, что наибольшие трудности возникают на процессе локализации знака.

    Возможно дальнейшее развитие работы для улучшения качества распознавания в реальных условиях. Например, для локализации знака можно использовать методы машинного обучения. На этапе классификации знака возможно применение алгоритмов глубинного обучения (Deep learning).

    При получении достаточного качества локализации и классификации запрещающих дорожных знаков для реальных условий данное ПО может быть использовано как часть автоматической системы распознавания дорожных знаков.

    Литература:

    1. Дорожные знаки [Электронный ресурс] // Советы опытных водителей для начинающих, 2013. — Режим доступа: https://zarulposle30.ru/dorozhnye-znaki-zalog-bezopasnosti/, свободный. — Загл. с экрана. (4.05.2017).
    2. Scott K. Computer Vision Metrics. — New York: Apress Media, 2014. — 498 p.
    3. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс; пер. с англ. Л. Рубанов, П. Чочиа. — М.: Техносфера, 2012. — 1104 с.
    4. Brkic K. An overview of traffic sign detection methods. — Zagreb: Department of Electronics, Microelectronics, Computer and Intelligent Systems, Faculty of Electrical Engineering and Computing, 2010. — 9 p.
    5. Traffic-sign detection and classification in the wild / Z. Zhu // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. — 2020. — P. 2110–2118.
    6. Kulkarni N. Color Thresholding Method for Image Segmentation of Natural Images // International Journal of Image, Graphics and Signal Processing. — 2014. — Vol. 4, № 1. — P. 28–34.
    7. Vision-Based Traffic Sign Detection and Analysis for Intelligent Driver Assistance Systems: Perspectives and Survey / A. Møgelmose // IEEE Transactions on Intelligent Transportation Systems. — 2012. — Vol. 13, № 4. — P. 1484–1497.
    8. Сакович И. О. Обзор основных методов контурного анализа для выделения контуров движущихся объектов / И. О. Сакович, Ю. С. Белов // Инженерный журнал: наука и инновации. — 2014. — Вып. 12.
    9. Казбеков А. В. Методы сравнения контуров в задачах распознавания образов / А. В. Казбеков, Н. А. Максимов // Научный Вестник МГТУ ГА. — 2012. — Вып. 185. — С. 37–43.
    10. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных / пер. с англ. А. А. Слинкина. — М.: ДМК Пресс, 2020. — 400 с.
    11. Shi M. Support vector machines for traffic signs recognition / M. Shi, H. Wu, H. Fleyeh // IEEE international joint conference on neural networks. IEEE world congress on computational intelligence. — 2008. — P. 3820–3827.
    12. Traffic Sign Classification by Image Preprocessing and Neural Networks / R. Vicen-Bueno // International Work-Conference on Artificial Neural Networks. — 2007. — P. 741–748.
    13. Multi-Column Deep Neural Network for Traffic Sign Classification / D. Ciresan // Neural Networks. — 2012. — P. 333–338.
    14. Zeng Y. Traffic sign recognition using extreme learning classifier with deep convolutional features / Y. Zeng // The 2015 international conference on intelligence science and big data engineering. — 2020.
    15. Chen Y. Detection and Recognition of Traffic Signs Based on HSV Vision Model and Shape features / Y. Chen, Y. Xie, Y. Wang // JOURNAL OF COMPUTERS. — 2013. — Vol. 8, № 5. — P. 1366–1370.
    16. Otsu N. A Threshold Selection Method from Gray-Level Histograms // IEEE Transactions on Systems, Man, and Cybernetics. — 1979. — Vol. 9, № 1. — P. 62–66.
    17. Haykin S. Neural Networks and Learning Machines (Third Edition). — New Jersey: Pearson Education. — 2009. — 936 p.
    18. Japkowicz N. Evaluating learning algorithms. A classification perspective / N. Japkowicz, M. Shah. — New York: Cambridge University Press, 2011. — 424 с.

    Преимущества систем распознавания и рекомендации по их использованию

    К числу положительных сторон такого автоматизированного оборудования относятся:

    • контроль за соблюдением допустимого скоростного режима;
    • повышение общего уровня безопасности для участников движение, что автоматически приводит к уменьшению вероятности аварий и травматизма;
    • увеличение комфорта от пользования транспортным средством.

    Однако, если знаки размещены в «слепых» зонах, погнуты или не восстанавливались, то они могут не быть распознаны оборудованием. Поэтому этот момент стоит учитывать обязательно, не забывая самостоятельно контролировать дорожную обстановку.

    Несмотря на то, что главной задачей любого такого оборудования является подстраховка водителя от усталости или недостаточного опыта, все-таки электроника не может тягаться по своей эффективности с человеческим глазом. Все потому, что для неё необходимы практически идеальные условия работы. Правильнее будет относиться к ней не столько, как к незаменимому помощнику, сколько как к вспомогательному оборудованию, которое может подстраховать в сложной ситуации.

    Добавить комментарий

    Adblock
    detector