Elk jaar gaat er in vluchtelingenkampen 1,3 miljard dollar aan humanitaire hulp verloren door een slecht supply management. Als gevolg hiervan krijgen naar schatting 1,88 miljoen kinderen, vrouwen en mannen per jaar niet de essentiële benodigdheden, om ze veilig en in goede gezondheid te houden. Om de input voor de Camp Forecast tool, het aantal verwachte vluchtelingen, automatisch te schatten, gebruiken we satellietbeelden. Door middel van machine learning analyseren we deze satellietbeelden van vluchtelingenkampen, om het tellen van tenten te automatiseren en betere schattingen van vluchtelingenpopulaties te maken voor een effectiever gebruik van resources.
Samenwerking met Elva
In samenwerking met Elva hebben wij voor IOM de Camp Forecast tool ontwikkeld om het voorspellen van benodigdheden te verbeteren en daarmee tijd te besparen, kosten te verlagen en wellicht zelfs levens te redden. IOM heeft tientallen jaren toonaangevende humanitaire ervaring en ELVA heeft ervaring met het verzamelen van gegevens in twintig door conflicten getroffen landen over de hele wereld.
Momenteel worden er maandelijks zeer lange enquêtes ingevuld door kampmanagers. We zijn gestart met het creëren van een tool die de meest voorkomende tekorten in deze onderzoeken kon aanpakken. In de tool hoeft alleen het aantal vluchtelingen in een kamp en de bestaande voorraad ingevuld te worden. Vervolgens berekent de tool de benodigde voorraden en het benodigde budget voor de huidige situatie, maar ook voor enkele maanden vooruit. Als input hebben we echter nog steeds het aantal vluchtelingen in een kamp nodig. Dit aantal kan worden ontleend aan de maandelijkse enquêtes. Deze enquêtes verschijnen echter online met een vertraging die kan oplopen tot een maand. De vraag was dus: hoe verkrijg je deze informatie sneller?
Om het aantal mensen in een vluchtelingenkamp dichter bij realtime te kunnen schatten, kunnen satellietbeelden van deze kampen nuttige informatie toevoegen. Dit heeft geleid tot twee vragen:
Object Detection voor het herkennen van tenten
Om deze vragen te beantwoorden, worden de volgende stappen uitgevoerd:
De huidige state-of-the art Object Detection modellen vinden hun basis in Neural Networks. Een belangrijk onderdeel van het trainen van Neural Networks is het voorbewerken van de input. In dit geval gebruiken we satellietbeelden van Google Earth als input. Veel winst in de performance kan worden behaald door de input data zorgvuldig te onderzoeken, op te schonen en te transformeren. Vervolgens is er onderzocht met hoeveel ‘epochs’ het model moest worden getraind. Een groter aantal betekent een grotere trainingstijd, dus er worden meer afbeeldingen aan het algoritme getoond om te leren wat een tent is. Het probleem met Neural Networks is dat ze ‘overconfident’ kunnen worden in hun keuzes. Dit wordt veroorzaakt doordat het model te lang getraind wordt; door te lang te trainen, zullen de parameters in het model ‘verzadigen’ (neuron saturation). Als gevolg hiervan zal het model alle soorten objecten classificeren als het object dat we zoeken. Door te kort te trainen, vindt het model echter geen tenten. Het afstemmen van dit soort parameters is belangrijk om goede resultaten te krijgen met dit soort modellen.
Faster R-CNN model
Met behulp van een Faster R-CNN model waren we in staat tot het herkennen van de meeste tenten. We waren dus in staat om de de grootte van een vluchtelingenkamp te extraheren uit satellietbeelden. Echter, omdat de frequentie van satellietbeelden op Google Earth niet voor elke locatie even hoog ligt, bleek ook dat alleen deze bron van satellietbeelden niet genoeg is voor het implementeren van een model dat accuraat genoeg is om in elk kamp een goede schatting te maken van het aantal vluchtelingen. Een samenwerking met een provider van satellietbeelden zou hier uitkomst kunnen bieden.