Соотношение положительных и отрицательных данных для использования при обучении каскадного классификатора (opencv)

Поэтому я использую детектор LBP OpenCV. Все формы, которые я обнаруживаю, являются приблизительно круглыми (различающимися в основном по соотношению сторон), с некоторыми широкими изменениями яркости / контраста и небольшим прикусом.

Руководство OpenCV по обучению детектора Вот

Мой главный вопрос к любому, имеющему опыт его использования: как должны быть numPos и ​​numNeg по отношению друг к другу? У меня есть примерно 1000 положительных образцов (около 900 на одну стадию)

Что мне нужно решить, так это сколько негативных образцов использовать на каждой стадии обучения. У меня есть около 20000 изображений, из которых можно извлечь негативные данные, поэтому избыточность не является проблемой.

В общем, правило, которое я слышу, — 1: 2, но это выглядит как недоиспользование, учитывая, сколько негативных данных я имею в своем распоряжении. С другой стороны, какие эффекты я должен ожидать, если я тренирую свой детектор с 1:20? Как мне определить правильное соотношение?

5

Решение

Задача ещё не решена.

Другие решения