De machine learning stappen achter het voorspelmodel jeugdzorg

model jeugdzorg

Dit project heeft als doel om de totale kosten van de jeugdzorg (y) van een gemeente te voorspellen: Dit gebeurt in een meerdere stappen

  • Stap 1. Ontwikkel een model die de kosten van een individueel jeugdzorgtraject voorspelt (op basis van data uit de jeugdzorg-vakapplicatie) op het moment dat er een beschikking wordt afgegeven. Het doel van dit traject is om een volledig machine learning traject uit te voeren (en over data-science te leren), maar ook een korte termijn kosten voorspelling te doen. Ook kunnen in deze stap aanvullende vragen beantwoord worden: kan er een voorspelling gemaakt worden of er een vervolg jeugdzorg traject nodig is? Kunnen de individuele dure jeugdzorg trajecten voorspeld worden?
  • Stap 2. Ontwikkel een model die de totale kosten van de jeugdzorg (per gemeente) voorspelt voor de korte en middellange termijn, op basis van bovenstaand model en op basis van publiek beschikbare CBS data (die door gemeenten zijn aangeleverd). Dit is belangrijk voor gemeentelijke meerjaren begrotingen.
  • Stap 3. Ontwikkel een model die voorspelt of een jongere in de jeugdzorg terecht komt met behulp van data uit het GBA (gezinssituatie), sociaal domein (ouders in de bijstand, broer of zus ook in hulpverlening, etc), leerplicht (spijbelen, opleidingsniveau), schuldproblematiek, GGD-gegevens, consultatiebureau, etc
  • Stap 4. Ontwikkel een model met een langjarige voorspelling van de totale kosten van Jeugdzorg voor gemeenten op basis van bovenstaande modellen en een voorspelling van de demografische data. Welke factoren hebben een positieve of negatieve invloed op jeugdhulp gebruik?

Deze pagina beschrijft de ontwikkeling van het machine learning model waarbij de kosten van een jeugdzorg traject wordt voorspeld, op het moment dat een beschikking wordt afgegeven. Dit gebeurd op basis van productcode, tarief, verwijzer, zorgaanbieder, toegewezen facturatie kenmerken, financiële verplichting en een aantal cliënt-kenmerken (X) en de som van alle ontvangen facturen (y) van zorgaanbieders, behorende bij deze beschikking.

De financiële verplichting wordt berekend wordt met behulp van de iStandaard iJw. In de dagelijkse praktijk wordt deze standaard niet correct toegepast binnen gemeentelijke systemen, en dus is er een tussenmodel getraind, op basis van geleverde zorg (declaraties) die door zorgaanbieders worden gedaan. Dit tussenmodel berekent dus de financiële verplichting (y) op basis van de iStandaard kenmerken van reeds uitbetaalde facturen (X). Voor het tussenmodel is XGBoost gebruikt en deze bereikt een nauwkeurigheid van 98,38%. Voor dit model is dus een separate dataset uit de ruw data gehaald, die alle goedgekeurde declaraties bevat.

Voor het hoofdmodel (die een voorspelliing doet van de totale kosten van een jeugdzorg traject als een beschikking wordt afgegeven)  is Random Forest gebruikt waarbij de kosten voor de jeugdzorg met een nauwkeurigheid van 80% kunnen worden berekend. Voor dit model is een dataset gemaakt, die alle kenmerken van de client en de beschikking bevat (X) en de volledige declaratie (y)(som van alle facturen). Alleen de beschikkingen waarvoor de reden beeindiging is ingevuld worden gebruikt zodat er alleen gefit wordt op afgeronde jeugdzorgtrajecten.

In het proces om het model te trainen zijn er diverse stappen gezet om de data op te schonen. De gebruikte gemeentelijke vakapplicaties laten namelijk veel vervuiling toe bij het vullen van velden in het dagelijks gebruik, zoals incorrecte postcodes, verkeerde datums en het niet invullen van verwijzers. Het koppelen van de ruwe data met de stamtabellen van de iJw/iWmo standaard levert veel inzicht. Ook zijn er diverse nieuwe kenmerken bepaald (feature engineering) om het model beter te trainen zoals buitengebied (j/n), totale zorgkosten, totale zorgduur, volgnummer in het zorgpad. Een prangend probleem bij de training van het model is het systeem van productcodes, wat steeds verandert als gemeenten de zorg opnieuw inkopen. Dit wordt opgelost door gebruik te maken van conversietabellen.

Zoeken
Gerelateerde pagina's
Contactpersoon