Allgemeine Checkliste Fehlersuche

Stand: 05.06.2023 :: Winfried Mueller :: www.reintechnisch.de

  • Beobachten: Wach hinschauen, was passiert und was ist. Sieht das alles normal aus? Gibts Auffälligkeiten? Kann ich es mit etwas Funktionierendem vergleichen? Stimmen Abläufe?
  • Fragen und Bestandsaufnahme: Sich Zeit nehmen und alle Beteiligten fragen, was sie gemacht und beobachtet haben. Dazu ermutigen, offen und ehrlich zu kommunizieren. Fehlerhaftes Verhalten bleibt gerne ungesagt. Man kann sich viel Zeit sparen, wenn man weiß, was wer wann wie gemacht hat. Möglichst viel konkretisieren. Achtung: Oft wird falsch beobachtet oder es werden falsche Schlüsse gezogen, die einen in die Irre leiten. Professionelle Distanz zu allen Vermutungen und Aussagen wahren.
  • Beschreiben: Es ist oft gut, einmal genau zu beschreiben, was das Problem oder Thema ist. Was genau für ein Problem haben wir? Ein klar definiertes Problem hilft oft weiter und bei der genauen Beschreibung fallen einem Unstimmigkeiten auf. Nicht selten fand man die Ursache, wenn man einem Kollegen genau beschrieb, was für ein Problem beobachet wurde. Eine andere Person kann auch rückmelden, ob er das Selbe erkennt und wahrnimmt oder ob es Unterschiede gibt. Ebenso kann eine zweite Person neue Ideen einbringen.
  • Konkretisieren: Was genau funktioniert nicht? Unter welchen Umständen?
  • Einkreisen: Wo genau steckt der Fehler? Was hingegen funktioniert so, wie gewünscht?
  • Fehlerstruktur verstehen: Kann ich genau die Umstände beschreiben, wodurch der Fehler auftritt? Kenne ich genau die Bedingungen, wie ich ihn reproduzieren kann? Oder hängt er an einer Zufälligkeit? Ist es doch keine Zufälligkeit und lassen sich durch genaues Beobachten Zusammenhänge verstehen?
  • Recherchieren: Haben auch andere mit dem Gerät ähnliche Probleme? Recherche im Internet. Rezensionen zu einem Produkt lesen. In Foren recherchieren. Handbuch lesen, dort gibt es oft Hinweise bei Fehlern. Vielleicht gibt es eine FAQ im Internet. Das Wichtigste beim Recherchieren: Passende Wörter, Sätze, Fehlermeldungen oder Suchmuster finden. Ohne treffsichere Suchbegriffe wird man nichts finden. Bei vielen technischen Problemen auch oder vor allem in englischer Sprache recherchieren.
  • Updates: Gibt es in irgendeiner Form Hersteller-Updates, die Software- oder Firmwarefehler bereinigen? Gibt es Changelogs oder Buglisten, die Fehler in älteren Software-Ständen dokumentieren?
  • Grundsätzliches checken: Bedienungsanleitung nochmal genau lesen. Gerät richtig angeschlossen? Stecken alle Stecker korrekt? Alles korrekt eingestellt? Neue Batterien eingesetzt? Richtige Teile verwendet? Gerät in Ruhe betrachten und Grundsätzliches checken. Sich Zeit nehmen und genaues fokussiertes wie auch weites Wahrnehmen.
  • Grund: Gab es in letzter Zeit irgendwas, was diesen Fehler ausgelöst hat? Wann funktionierte es noch? Was habe ich zuletzt gemacht, als es noch funktionierte? Was ist in der Zwischenzeit passiert?
  • Änderungen: Habe ich irgendwas am Gerät oder im Umfeld des Gerätes verändert? Haben andere etwas verändert? Wurde durch Automatismen irgendwas verändert?
  • Eigentliche Funktion: Ist klar, wie etwas richtig funktionieren muss? Oder hat man sich in eigene Vorstellungen verrannt, die nicht dem entsprechen, wie es funktionieren soll? Ist die Anleitung eindeutig oder gibt es Stellen, die unklar sind?
  • Funktionierende Komponenten: Lassen sich Teile des Gesamtsystems in ein korrekt funktionierendes System einbinden, um die Funktion dort zu testen? Kann man Teile irgendwie anders kombinieren, so dass der Fehler weiter eingekreist werden kann?
  • Standard-Checks: Welche wichtigen Systemkomponenten kann man ungeachtet des Fehlers auf Fehlerfreiheit überprüfen? Welche Standard-Checks gibt es, um ein System durchzuchecken? Welche Teilsysteme funktionieren korrekt?
  • Grundzustand: Lässt sich ein System in ein Grundzustand zurückversetzen, z.B. durch Trennung von der Energieversorgung, durch einen Reset, durch Werkseinstellungen, durch Neustart?
  • Alter Zustand: Lässt sich ein Gerät in einen älteren Zustand versetzen, z.B. durch ältere Softwarestände oder ältere Teilkomponenten?
  • Auffälligkeiten: Gab es irgendetwas auffälliges? Hat was geraucht, hat etwas gestunken, gab es komische Geräusche oder merkwürdiges Verhalten? Gab es vielleicht schon längere Zeit Merkwürdigkeiten, an die man sich schon gewöhnt hat? Achtung: Viele Auffälligkeiten fallen erst auf, wenn man genauer hinschaut. Einige dieser Auffälligkeiten brauchen überhaupt nichts mit dem Problem zu tun zu haben.
  • Holzweg: Verfolgt man vielleicht angestrengt einen Holzweg und muss nochmal völlig loslassen, weil man grundsätzlich in die falsche Richtung forscht? Sollte man erstmal einen Spaziergang machen, um seinen Kopf wieder frei zu bekommen? Nochmal alles, was man als sicher annimmt, kritisch hinterfragen.
  • Falsche Instruktionen: Stimmt die Anleitung vielleicht nicht, werden falsche Instruktionen gegeben? Was klingt unlogisch und könnte vielleicht anders sein? Sind Instruktionen vielleicht veraltet? Hab ich überhaupt die richtige Anleitung?
  • Folgefehler: Habe ich durch einen Fehlzustand im Eifer des Gefechts weitere Zustände geschaffen, die ein Funktionieren jetzt unmöglich machen? Kabel vertauscht? Dateien gelöscht? Teile vertauscht? Teile überlastet? Sonst irgendwo Chaos hinterlassen? Hat ein Fehler weitere Fehler oder Defekte nach sich gezogen?
  • Sicherungen: Sicherungen durchgebrannt? Wo gibt es überall Sicherungen? Überhitzungssicherung, die Zeit zur Abkühlung braucht?
  • Systematisches Vorgehen: Kann man systematisch vorgehen, um Stück für Stück die Funktionstüchtigkeit von Teilsystemen zu prüfen, um das eigentliche Problem einzukreisen? Gibt es Checklisten oder Handlungsanweisungen?
  • Vergleichen: Gibt es ein ähnliches funktionierendes Gerät, mit dem man vergleichen kann? Kann man korrektes Verhalten an einem funktionierenden Gerät studieren?
  • Wackelkontakt und instabile Zustände: Kann man durch wackeln, schütteln, klopfen, bewegen oder andere mechanische Einwirkungen irgendeine Veränderung bewirken? Führt Erwärmung oder Kältespray zu Veränderung?
  • Überanspruchung: Gibt es irgendwelche Hinweise auf Überanspruchung, z.B. durch Herunterfallen oder Schlag? Gibt es irgendwelche Spuren von Überlastung?
  • Fremdkörper und gelöste Teile: Klappert irgendwas oder purzelt durchs Gehäuse, wenn man das Gerät dreht oder bewegt? Hat sich irgendwas gelöst, was wieder verbunden werden muss? Haben gelöste Teile Folgeschäden verursacht?
  • Verbrauch und Wartung: Sind Verbrauchsmaterialien aufgebraucht? Batterien aufgebraucht? Wurden Wartungen nicht gemacht und müssen jetzt Teile getauscht werden?
  • Schadsoftware und Sabotage: Irgendwas von Schadsoftware befallen? Absichtlich irgendwas sabotiert? Wer könnte ein Interesse daran haben? Waren Sicherheitsmaßnahmen unzureichend, so das Angriffe naheliegend sind?
  • Testmittel: Gibt es irgendwelche Testmittel, Testsoftware oder Testgeräte, um Teile des Systems zu überprüfen?
  • Reduktion: Was kann man alles weglassen, um die Fehlerquelle zu lokalisieren? Was lässt sich vereinfachen, was lässt sich weglassen?
  • Austauschen: Kann man eine Komponente gegen definitiv funktionierende Ersatzkomponenten tauschen? So findet man heraus, ob der Fehler an dieser Komponente hängt.
  • Annahmen checken: Stimmen meine Annahmen und Vermutungen? Bin ich von etwas selbstverständlich überzeugt, was nicht der Realität entspricht? Welche Tests kann ich durchführen, um Annahmen zu überprüfen? Wie lässt sich etwas belegen oder widerlegen? Testszenarien entwickeln. Am Selbstverständlichen zweifeln, so lange es nicht überprüft wurde. Auch an seinen Überprüfungsmethoden zweifeln.
  • Verstärken: Gibt es Wege, den Fehler zu verstärken oder Bedingungen, wo er verstärkt auftritt? Das kann Hinweise über die Ursache geben. (Kältespray, Wärme, wackeln, rütteln)
  • Fehler, die keine sind: Fehlermeldungen in Logfiles, die gar nichts mit dem eigentlichen Problem zu tun haben und schon längere Zeit da waren, können einen schnell auf die falsche Fährte locken. In fast jedem System gibt es fehlerhafte Zustände, die normal sind und keine Relevanz haben. Diese fallen einem teilweise auch erst auf, wenn man sich detailierter auf Fehlersuche macht und können verwirren. Wer genauer hinschaut, findet immer irgendwas, was so nicht gehört. Aber hat das wirklich was mit dem Problem zu tun?
  • Jenseits von Gewohnheiten: Komplexe Systeme funktionieren oft dadurch sicher, weil die Nutzer feste Angewohnheiten haben, wie sie Dinge tun. Dies ist der sicher getestete Fall. Manchmal ändern Nutzer ihr Verhalten, so dass erst dadurch Fehler auffallen, die schon länger da waren. Mitunter führt auch erst der Stress durch ein Problem dazu, dass sich Nutzer plötzlich völlig anders verhalten und so scheinbar immer mehr Probleme auftauchen.
  • Verbastelte Systeme: Durch Lösungsversuche bastelt man sich zahlreiche weitere Fehler ins System, die den eigentlichen Fehler überlagern. Stress und emotionale Ausnahmezustände sorgen dafür, dass Menschen unüberlegt merkwürdige Dinge tun und sich auch nicht mehr daran erinnern.
  • Dokumentation: Alles, was man zur Problemlösung tut, achtsam tun und dokumentieren. Fehlerdokumentation hilft bei längerer Fehlersuche und man kann später immer wieder darauf zurückgreifen. Verschriftlichung hilft auch, Widersprüchliches oder falsche Annahmen zu erkennen. Notieren, was man rückgängig machen muss. Originalzustände sichern, auf die man zurückgehen kann. Fotos machen, bevor man etwas zerlegt oder verändert.
  • Selbstheilung: Manches heilt sich scheinbar von selbst. Das gilt vor allem bei Technik, die von anderen verwaltet wird: Cloudlösungen, Internetzugänge, Webserver usw. Hier wird oft ohne unser Zutun ein Fehler erkannt und bereinigt. Ein Tag abwarten kann so manches weniger dringende Problem lösen. ABER: Technik heilt sich in der Regel nicht wirklich von selbst, sondern nur, weil sich irgendwo Techniker drum kümmern. Auf Selbstheilung zu hoffen und sich nicht früh um auftretende Fehler zu kümmern, rächt sich oft.
  • Historie: Trat der Fehler schonmal so auf? Wie hab ich ihn damals gelöst? Wurde das vielleicht irgendwo dokumentiert? Kennt jemand im Team diese Art von Fehler?
  • Falsche Fehlermeldungen: Fehlermeldungen können verkehrt sein und einen auf den Holzweg führen. Nochmal Vermutungen loslassen und überlegen, ob es nicht was ganz anderes sein kann.
  • Mehrfachfehler: Mitunter hat man es mit mehreren Fehlern zu tun. Ein bereits gelöstes Problem erkennt man so nicht. Mehrere Fehler können die gleiche Symptomatik zeigen. Es gibt dann kein Feedback, ob ein Fehler bereits gelöst wurde.
  • Nachweis: Gibt es Verfahren, mit denen ich bestimmte Annahmen 100% nachweisen kann. Was kann ich als abgesichertes Wissen betrachten? Welche Ursache ist naheliegend und wie kann ich den Verdacht nachweisen?
  • Übersehe ich was Wesentliches? Habe ich irgendwas Wesentliches übersehen, was entscheidenden Einfluss hat? Was könnte sein, was ich noch nicht gesehen, noch nicht bewusst habe?
  • Standard-Einsatzszenario testen: Viele Geräte wurden nur für Standard-Einsatz-Szenarios getestet, weicht man davon ab, können Bugs zum Vorschein kommen. Deshalb erstmal alles auf einfachen Standard zurückfahren und testen.