ITIL in de praktijk: problem management

Na mijn blogposts over change management en de service catalogue is dit het volgende deel in de serie ITIL in de praktijk: problem management.

Problem management is vaak het ondergeschoven kindje van de ITIL-familie. Bovenstaande afbeelding geeft bijvoorbeeld heel mooi weer hoe de verhouding tussen incident management en problem management is. Waar bij incident management vooral brandjes geblust worden, vertelt problem management hoe zaken beter en slimmer kunnen. In de praktijk zie je helaas dat hier te weinig tijd voor wordt genomen, omdat men te druk is met het oplossen van incidenten.

Het nut van problem management

Problem management heeft twee doelen:

  • Reactief: Het groeperen en onderzoeken van terugkerende incidenten. Door de oorzaak van incidenten weg te nemen komen ze (als het goed is) niet meer voor.
  • Proactief: Het voorkomen van incidenten op basis van trends, zoals het monitoren van de systemen en alert management.

Het proces

Problem management kent de volgende processtappen:

ProcesstapUitleg
Identificeren en loggen van probleemOp basis van de trendanalyse of naar aanleiding van terugkerende incidenten registreren we een probleem. Hierna start het onderzoek naar de relatie tussen de incidenten en kijken we of we een gemeenschappelijke oorzaak kunnen vinden.
Rootcause-analyseTijdens deze fase kijken we naar de achterliggende oorzaak. Als we die hebben gevonden wordt het probleem omgevormd tot een known error (bekende fout). Het kan zomaar voorkomen dat er meerdere rootcauses achter ogenschijnlijk één incident zitten. Denk hierbij aan een server die zowel een oude versie van het besturingsysteem heeft, als een oude versie van een applicatie.
Oplossen en sluitenAfhankelijk van de kosten en baten zullen we besluiten of we deze known error ook daadwerkelijk gaan oplossen. Als de kosten te hoog zijn kan er ook voor gekozen worden om deze known error te laten bestaan en de incidenten die hieruit voort komen met een workaround op te lossen.

Relatie met andere ITIL-processen

Uiteraard staat problem management niet op zichzelf. Het werkt samen met een aantal andere ITIL-processen. Dit zijn de belangrijkste:

 

ProcesRelatie
Incident managementIncident management speelt terugkerende incidenten door naar problem management.
Change managementChange management zorgt ervoor dat wijzingen die nodig zijn om known errors op te lossen gecontroleerd naar productie gaan.
Release managementRelease management draagt zorgt voor het daadwerkelijk oplossen van de known error in productie.
Event managementEvent management geeft trendinformatie over de ict-infrastructuur.

Hoe doe je een goede probleemanalyse?

Het belangrijkste aspect van een goede probleemanalyse is het bij elkaar zetten van de juiste mensen en bijbehorende expertise. Om te zorgen dat er doelgericht naar een oplossing wordt gezocht, is het handig als één iemand de leiding heeft. Vaak is dit problem manager. Er zijn verschillende methodes om een goed onderzoek te doen, zoals het maken van ishikawa-diagrammen of een 5 times why.

Deze rollen en rapportages heb je nodig

Om problem management goed uit te voeren dienen de volgende rollen belegd te zijn. Let op: als je organisatie niet heel groot is kunnen rollen heel goed gecombineerd worden.

RolDoel
ProceseigenaarVerantwoordelijk voor het gehele problem management-proces.
ProcesmanagerVerantwoordelijk voor uitvoer en procesdocumentatie.
Problem engineerVerantwoordelijk voor het onderzoek de rootcauses.

Wat problem management je oplevert

Als problem management goed geïmplementeerd wordt zorgt dit voor veel rust en stabiliteit in de ict-infrastructuur. Je hebt namelijk meer tijd voor innovatie en verdere optimalisatie. En zo kan de klant weer optimaal van de ict-dienstverlening gebruikmaken.

Tegelijkertijd hoeven de beheerders geen overbodig werk uit te voeren. Want ook hier geldt: liever lui dan moe!