Нужно настроить нейросеть для распознавания людей на картинках (определение, где на картинке находятся люди)
И затем перенести координаты распознанных людей на план местности, на которой они находятся (даны размеры местности, высота камеры и угол съемки, т.е. задача из области геометрии), высокая точность не нужна
Можно использовать что-то бесплатное, например Yolo
pjreddie.com/darknet/yolo...