RSS на пути к науке о данных - Medium

Гистограмма ориентированных градиентов (HOG) в компьютерном зрении

Гистограмма ориентированных градиентов (HOG) - это алгоритм извлечения признаков, используемый для задач обнаружения и распознавания объектов. Он был впервые представлен Навнитом Далалом и Биллом Тригсом в их статье CVPR "Гистограммы ориентированных градиентов для обнаружения человека". HOG - это глобальный метод описания, который извлекает информацию о соседстве, такую как текстура и структуры краев, из изображения и сжимает ее в вектор признаков. Алгоритм включает в себя расчет градиентного изображения, гистограммы градиента и нормализации. Градиентное изображение рассчитывается с помощью оператора Собеля, который измеряет разницу в интенсивности в градациях серого. Гистограмма градиента создается путем объединения величины и ориентации каждого пикселя в гистограмму с 9 ячейками. Затем применяется нормализация для уменьшения влияния изменений освещения и контраста. Результатирующий вектор признаков, называемый дескриптором HOG, используется в качестве входных данных для алгоритмов классификации, таких как SVM. HOG особенно эффективен для обнаружения форм и контуров, таких как человеческая фигура, и широко используется в приложениях компьютерного зрения. Алгоритм можно легко реализовать с помощью OpenCV, который предоставляет встроенный дескриптор HOG и предобученную модель SVM для обнаружения людей.
favicon
towardsdatascience.com
Histogram of Oriented Gradients (HOG) in Computer Vision
Create attached notes ...