Krananlagen: Instandhaltungsstrategie zeitbasiert, CBM, RCM, TPM
Facility Management: Krananlagen » Strategie » Asset‑Management‑Strategie » Instandhaltungsstrategie
Instandhaltungsstrategie im Krananlagen-Asset-Management: Zuverlässigkeit, Effizienz und Lebenszyklusoptimierung
Eine klar definierte Instandhaltungsstrategie ist entscheidend für die langfristige Zuverlässigkeit und Betriebssicherheit von Krananlagen. Durch strukturierte Planung, zustandsorientierte Instandhaltung und datenbasierte Überwachung kann das Facility Management Stillstandzeiten minimieren und Lebenszykluskosten optimieren. Die Integration von Predictive Analytics, standardisierten Prüfintervallen und digitaler Dokumentation gewährleistet die Einhaltung von DGUV, BetrSichV und ISO 55000 und fördert zugleich Transparenz und Leistungsfähigkeit der Anlagen.
Optimierte Instandhaltung durch CBM, RCM und TPM
- Grundbegriffe Instandhaltung
- Philosophien der Instandhaltung
- Rahmenmethoden Instandhaltung
- Intervallbasierte Wartung
- TBM-Praxisbeispiele
- Risikofaktoren
- Lastabhängige Wartungsgrenzen
- Zustandsbasierte Wartung
- Entscheidungslogik
- Überwachte Messgrößen
- Zustandsdiagnoseverfahren
- Verfügbarkeit
- Erfolgsfaktoren
- Risikobasierte Instandhaltung
- Risikobasierte Ausfallanalyse
- RCM-orientierte FMEA
- Strategische Instandhaltungsmaßnahmen
- Risikobasierte Entscheidungslogik
- Optimale Intervalle
- RCM-Organisation
- Gesamtproduktive Instandhaltung
- Grundprinzipien TPM
- Autonome Basiswartung
- Organisatorische Verankerung
- Frühzeitige Anomalieerkennung
- Reifegradkennzahlen
- Strategische Instandhaltung
- Kombinierte Instandhaltung
- Strategische Einsatzgrenzen
- Hybride Instandhaltung
- Strategische Auswahlkriterien
- Risikobasierte Wartungsmatrix
- Wartungsauslösung
- Risikobasierte Eskalationslogik
- Strukturierte Lernschleifen
- Rechtlicher Normenrahmen
- Sicherheit
- Asset-Management
- Internationale Kranstandards
- Praktische Implikationen
- Organisatorische Aspekte
- Eigen oder Fremdleistung
- Prozesslandkarte Instandhaltung
- Rechtssichere Dokumentation
- CMS Systemarchitektur
- Hauptkomponenten
- Signalaufbereitung und Datenpfad
- Leitstand SCADA Integration
- Beispielkomponenten
- Automatisierung
- Methoden
- Messung an Antrieben
- Ölzustandsanalyse
- Prüfmethoden Drahtseile
- Lastkollektiverfassung
- Strukturelle Überwachung
- Diagnostische Elektronikdaten
- Datenfusion
- Empfohlene Messpunkte
- Funktionsbäume
- Funktionsbaum Pumpe
- FMEA/FMECA-Templates
- Strukturierte Fehleranalyse
- Systematische Fehleranalyse
- Run-to-Failure-Auswahl
- Zielsetzung
- 5S-Grundlagentraining
- Tägliche Bedienerchecks
- OPL-Wartungstafeln
- Eskalationsablauf Bediener
- Verfügbarkeitssteuerung
- Regimeleistung
- Operative Tagesprüfungen
- Regelmäßige Prüfungen
- Sicherheitsprioritäten
- Prüfverfolgung
- Beispielhafter Wartungsplan
- Tagesprüf-Checkliste
- Jahresprüf-Checkliste
- Ersatzteilmanagement
- Kritikalitätsklassen
- Sensorik-Nachrüstung
- Retrofit-Abnahmetests
- Herstellerdokumentation
Grundbegriffe der Instandhaltung nach DIN 31051
Die DIN 31051 strukturiert die Instandhaltung als Gesamtheit aller technischen, administrativen und leitenden Maßnahmen über den Lebenszyklus einer Betrachtungseinheit. Ziel ist es, den funktionsfähigen Zustand zu bewahren bzw. wiederherzustellen und die geforderte Funktion sicherzustellen. Vier Grundmaßnahmen werden unterschieden:
Inspektion
Inspektion bezeichnet Maßnahmen zur Feststellung und Beurteilung des Ist-Zustands, einschließlich der Ermittlung von Abnutzungszuständen und -ursachen. Sie umfasst Sichtprüfungen, Funktionsprüfungen, Messungen und Analysen (z. B. Schwingungs-, Öl- oder Thermografieanalysen) mit dem Ziel, den Abnutzungsgrad zu quantifizieren, Abweichungen vom Soll-Zustand zu erkennen und die Instandhaltungsplanung zu unterstützen.
Wartung
Wartung umfasst Maßnahmen zur Verzögerung des Abbaus des Abnutzungsvorrats, also zur Erhaltung des Soll-Zustands. Dazu zählen Reinigen, Schmieren, Justieren, Nachfüllen, Auswuchten und das Ersetzen von Verschleißteilen nach vorgegebenen Intervallen. Wartung ist vorbeugend ausgerichtet und zielt auf die Verlängerung der Gebrauchsdauer, die Stabilisierung der Leistungsparameter und die Verringerung der Ausfallwahrscheinlichkeit.
Instandsetzung
Instandsetzung (Reparatur) sind Maßnahmen zur Wiederherstellung des Soll-Zustands nach einem Ausfall oder bei festgestellten Mängeln. Sie umfasst Fehlersuche, Demontage, Austausch oder Aufarbeitung defekter Komponenten sowie Funktionswiederanlauf inklusive Prüfungen. Ziel ist die Wiederherstellung der geforderten Funktion mit definierter Qualität und Sicherheit.
Verbesserung
Verbesserung beinhaltet Maßnahmen zur Steigerung der Funktionssicherheit, Zuverlässigkeit und Instandhaltbarkeit ohne Änderung der geforderten Grundfunktion. Beispiele sind konstruktive Modifikationen zur Schwachstelleneliminierung, Materialumstellungen, verbesserte Dichtkonzepte, Redesigns zur vereinfachten Zugänglichkeit oder Digitalisierungsschritte (Sensorik) zur besseren Zustandsdiagnose. Verbesserungen sind erfahrungs- und datengetrieben und stützen die Langzeitoptimierung.
Instandhaltungsphilosophien beschreiben die grundsätzliche Ausrichtung, nach der Maßnahmen geplant und umgesetzt werden:
Korrektiv (reaktiv): Eingriff nach Eintritt des Fehlers oder Ausfalls. Vorteilhaft bei unkritischen, kostengünstigen Komponenten mit geringer Folgeschadenswirkung. Nachteile sind ungeplante Stillstände, höhere Ausfallkosten und potenzielle Sicherheitsrisiken.
Präventiv (vorbeugend): Geplante Eingriffe vor Ausfall. Zwei Hauptausprägungen:
Zeit- bzw. nutzungsbasiert (z. B. alle 6 Monate oder nach 5.000 Betriebsstunden).
Zustandsbasiert (eingriffsabhängig vom diagnostizierten Zustand).
Ziel ist die Reduktion ungeplanter Ausfälle und die Stabilisierung der Verfügbarkeit.
Vorhersagend (prädiktiv):
Prognosegestützte Planung auf Basis kontinuierlich erfasster Zustandsdaten und analytischer Modelle (physikalische Modelle, statistische Verfahren, Machine Learning). Der Eingriff erfolgt zum erwarteten optimalen Zeitpunkt vor dem Ausfall. Diese Philosophie verbindet hohe Anlagenverfügbarkeit mit ressourcenschonendem Einsatz, erfordert jedoch Datenqualität, Sensorik und Analytics-Kompetenz.
Die praktische Umsetzung erfolgt meist hybrid, d. h. komponenten- und risikoadäquat in Mischformen (z. B. prädiktiv für kritische Antriebe, präventiv-zeitbasiert für einfaches Peripheriegerät, korrektiv für unkritische Hilfsmittel).
Time-Based Maintenance (TBM)
TBM ist eine präventive, intervallgesteuerte Strategie. Maßnahmen werden nach festen Zeit- oder Nutzungsintervallen geplant, unabhängig vom aktuellen Zustand. Sie ist einfach planbar, standardisierbar und normativ gut hinterlegt (Inspektions- und Wartungspläne). Grenzen zeigen sich bei stark streuenden Ausfallmechanismen oder „infant mortality“/Verschleiß-Schwerpunktkurven, wo TBM entweder zu früh oder zu spät eingreift.
Condition-Based Maintenance (CBM)
CBM ist zustandsorientiert und nutzt Mess- und Diagnosetechnik (z. B. Schwingungen, Akustik, Ölpartikel, Temperatur, Prozessdaten), um Degradation zu erkennen. Wartungsentscheidungen basieren auf Schwellenwerten, Trendanalysen oder Restlebensdauerabschätzung (Remaining Useful Life, RUL). CBM reduziert unnötige Maßnahmen, minimiert Folgeschäden und bildet die Grundlage für prädiktive Ansätze; erfordert jedoch Sensorik, Datenintegration und definierte Diagnosekriterien.
Reliability-Centered Maintenance (RCM)
Funktions- und Leistungsanforderungen definieren.
Funktionsausfälle und Fehlermodi analysieren (z. B. FMEA/FMECA).
Kritikalität bewerten hinsichtlich Sicherheit, Umwelt, Verfügbarkeit und Kosten.
Geeignete Aufgaben auswählen: TBM, CBM, Funktionsprüfungen, Run-to-Failure oder konstruktive Änderungen.
RCM verankert Wirtschaftlichkeit und Sicherheit in der Strategieauswahl und liefert transparente, auditierbare Entscheidungslogik.
Total Productive Maintenance (TPM)
Autonome Instandhaltung durch Produktion (tägliche Pflege, Inspektion, 5S).
Geplante Instandhaltung zur Ausfallprävention.
Frühe Anlagenmanagement-Praktiken (wartungsfreundliches Design).
Qualitätsorientierte Instandhaltung zur Fehlervermeidung an der Quelle.
Kompetenzentwicklung, Arbeitssicherheit und kontinuierliche Verbesserung (Kaizen).
TPM verschiebt Instandhaltung von einer reaktiven Servicefunktion zu einer gemeinsamen Verantwortung und macht Verluste (Stillstand, Geschwindigkeit, Qualität) systematisch sichtbar und reduzierbar.
Grundprinzip der intervallbasierten Wartung
Zeitbasierte Instandhaltung (Time-Based Maintenance, TBM) bezeichnet die präventive Durchführung von Instandhaltungsmaßnahmen in fest definierten Zeitintervallen, unabhängig vom aktuellen Zustandsbild der Anlage. Die Intervalle werden typischerweise kalendarisch (z. B. monatlich, jährlich) oder auf Basis fortlaufender Zeitmesser (Betriebsstunden, Kalenderalter) festgelegt. Die zugrunde liegende Annahme lautet, dass das Ausfallrisiko eines Objekts mit der Zeit beziehungsweise Betriebsdauer steigt oder dass der Eintritt eines relevanten Verschleißzustands zuverlässig prognostizierbar ist. Damit eignet sich TBM vor allem für Komponenten mit ausgeprägten alters- oder zeitabhängigen Schadensmechanismen, etwa Alterung von Dichtungen, Oxidation von Schmierstoffen, Korrosion oder Ermüdung nach definierter Lastkollektivdauer.
Die Intervallwahl erfolgt häufig anhand von Herstellerempfehlungen, historischer Ausfalldaten, regulatorischen Vorgaben oder konservativen Sicherheitsmargen. In der Praxis wird TBM oft als Grundpfeiler eines Instandhaltungsprogramms eingesetzt, insbesondere dort, wo hohe Planungssicherheit, standardisierte Abläufe oder Compliance-Anforderungen den Takt vorgeben. TBM steht damit im Kontrast zur zustandsorientierten Instandhaltung (Condition-Based Maintenance, CBM), bei der Messwerte und Diagnosen Maßnahmen auslösen, sowie zur risikobasierten Instandhaltung, die Eintrittswahrscheinlichkeit und Folgen systematisch gewichtet.
Typische Maßnahmen und Beispiele
Periodische Inspektionen: Sicht- und Funktionsprüfungen von Sicherheitsfunktionen, Schutzeinrichtungen, Not-Aus-Systemen.
Schmier- und Pflegearbeiten: Nachschmieren, Ölwechsel nach Kalenderzeit, Filtertausch in festen Intervallen.
Kalibrierung und Justage: Regelmäßige Kalibrierung von Mess- und Prüfmitteln, Prozesssensorik.
Austausch von Verschleißteilen: Dichtungen, Riemen, O-Ringe oder Batterien in festgelegten Zyklen.
Revisionsarbeiten: Jahres- oder Turnaround-Overhauls an kritischen Anlagen mit definierter Stillstandsplanung.
Rechtlich geforderte Prüfungen: Wiederkehrende Prüfungen von Druckbehältern, Aufzügen, Brandschutz- und Löschanlagen.
Hinweis:
Beispiele aus der Praxis umfassen den jährlichen Ölwechsel bei wenig genutzten Notstromaggregaten, die halbjährliche Funktionsprüfung von Sprinkler- und Brandmeldeanlagen, die turnusmäßige Kalibrierung von Waagen in der Pharmaindustrie oder die periodische Überholung von Luftfahrzeugkomponenten nach Kalenderzeit.
Vorteile:
Hohe Planbarkeit: Ressourcen, Ersatzteile und Stillstandszeiten lassen sich langfristig koordinieren.
Einfache Implementierung: Standardisierte Checklisten und feste Zyklen erleichtern Steuerung und Compliance.
Regulatorische Sicherheit: Erfüllung normativer und gesetzlicher Vorgaben durch nachweisbare Intervalle.
Prävention altersgetriebener Ausfälle: Wirksam bei Komponenten mit klarer Alterscharakteristik.
Nachteile:
Über- und Unterwartung: Starre Intervalle führen zu unnötigen Eingriffen oder zu späten Maßnahmen bei abweichender Beanspruchung.
Eingriffsinduzierte Ausfälle: Jeder Eingriff birgt das Risiko von Montagefehlern, Kontamination oder Frühschäden.
Kosten- und Verfügbarkeitsnachteile: Unnötige Stillstände und Materialverbrauch erhöhen TCO, ohne proportionalen Nutzen.
Geringe Sensitivität für zufällige Ausfallmodi: Bei stochastischen oder nutzungsdominierten Versagensmustern ist TBM wenig wirksam.
Grenzen bei variabler Auslastung
Bei variabler Auslastung entkoppelt sich die zeitliche Dimension von der tatsächlichen Beanspruchung. Gleich lange Kalenderintervalle können völlig unterschiedliche Schadensfortschritte abdecken: Eine Anlage im Dauerbetrieb akkumuliert deutlich mehr Lastzyklen und thermomechanische Spannungen als eine sporadisch genutzte.
Dies führt zu typischen Fehlanpassungen:
Überwartung in Niedriglastphasen: Ressourcen werden gebunden, ohne dass ein relevanter Zustandsfortschritt vorliegt.
Unterwartung in Hochlastphasen: Kritische Zustandsverschlechterungen werden zwischen den Intervallen nicht erfasst.
Verzerrte Zuverlässigkeitskennzahlen: MTBF/Weibull-Parameter werden falsch geschätzt, wenn Lastkollektive nicht berücksichtigt werden.
Ineffiziente Ersatzteilstrategie: Teile werden präventiv gewechselt, obwohl die verbleibende Restlebensdauer hoch ist, oder zu spät, wenn Lastspitzen den Verschleiß beschleunigen.
Zur Abmilderung eignen sich hybride Strategien:
Mindestkalenderintervalle werden mit nutzungsbasierten Triggern (Betriebsstunden, Zyklen, Schaltspiele) kombiniert; einfache Zustandsindikatoren (z. B. Schwingung, Temperatur, Partikel im Öl) ergänzen die Steuerung; risikobasierte Priorisierung lenkt TBM gezielt auf Komponenten mit nachweislich altersgetriebenen Ausfallmodi, während für random dominierte Komponenten CBM oder Run-to-Failure bei niedriger Kritikalität sinnvoller ist.
Begriff und Grundprinzipien
Zustandsorientierte Instandhaltung (Condition-Based Maintenance, CBM) bezeichnet ein Instandhaltungskonzept, bei dem Eingriffe nicht nach starren Zeit- oder Nutzungsintervallen erfolgen, sondern durch objektive Zustandsinformationen über Anlage und Komponenten ausgelöst werden. Ziel ist es, den verbleibenden funktionalen Zustand („Gesundheit“) eines Assets fortlaufend zu erfassen und Instandhaltungsmaßnahmen dann einzuleiten, wenn sich Abnutzungs- oder Schädigungsindikatoren in eine kritische Richtung entwickeln. CBM überführt damit die klassische Reaktiv- oder Intervallstrategie in einen daten- und wissensbasierten Regimebetrieb und ist Kernbestandteil moderner Prognostics and Health Management (PHM) Ansätze.
CBM unterscheidet sich von vorausschauender Instandhaltung (Predictive Maintenance, PdM) insofern, als bei CBM die Auslösung primär an beobachteten Zuständen (Schwellen, Trends, Anomalien) ausgerichtet ist, während PdM zusätzlich eine explizite Restlebensdauerabschätzung (Remaining Useful Life, RUL) integriert. Beide Konzepte sind komplementär; in der Praxis werden sie häufig gemeinsam realisiert
Die auslösende Logik in CBM kombiniert Messgrößen, Merkmale (Features) und Entscheidungsregeln:
Schwellenwertbasierte Auslösung: Ein Einzel- oder zusammengesetzter Gesundheitsindex überschreitet festgelegte Grenzwerte (z. B. ISO 10816/20816-Schwinggrenzwerte). Hysterese und Verzögerungslogik reduzieren Fehlarme.
Trend- und Änderungsraten: Signifikante Trendneigungen (z. B. Anstieg der Lagerhüllkurvenenergie oder Ölpartikelkonzentration pro Betriebsstunde) signalisieren degradierende Zustände, auch wenn absolute Schwellen noch nicht erreicht sind.
Statistische und probabilistische Verfahren: Zustandsklassen werden über Zustandsräume abgebildet; Alarme resultieren aus Anomaliescores, Konfidenzintervallen oder Bayes’schen Posterioren. Change-Point-Detection erkennt regimenwechselartige Zustandsübergänge.
Entscheidungsfusion: Mehrkanalige Evidenz (Sensor-Fusion) wird zu einem robusten Health-Index verdichtet, um die Sensitivität zu erhöhen und spezifische Fehlermodi zu unterscheiden.
Mechanische Antriebe und Rotationen:
Schwingungsanalyse: Breitband- und Ordnungsanalyse, Hüllkurvendetektion für Wälzlager, Cepstrum und Kurtosis zur Stoßerkennung, Orbitanalyse für Gleitlager.
Akustische Emission und Ultraschall: Früherkennung von Rissinitiierung, Reib- und Kavitationseffekten; Leckageortung in Druckluftsystemen.
Thermografie: Infrarotmessungen zur Erkennung von Reibung, Fehlausrichtung, Schmierdefiziten.
Geometrie und Ausrichtung: Online-Messung von Wellendurchbiegung, Unwucht, Fluchtung (Laser-Alignmentsensoren).
Schmierstoffe und Medien:
Ölzustands- und Verschleißpartikelanalyse: Spektrometrie, Ferrographie, Viskosität, TAN/TBN; Feuchtigkeits- und Partikelzahlmessung (ISO 4406).
Process analytics: Druck-, Durchfluss-, Temperatur- und Schallgeschwindigkeitssensoren zur Erkennung von Verblockung, Erosion, Korrosion.
Elektrische Maschinen und Energieanlagen:
Motorstromsignaturanalyse (MCSA): Diagnose von Rotorstabschäden und Exzentrizität.
Isolationsdiagnostik: Teilentladungsmessung, Polarisationsindizes, tan δ; für Transformatoren zudem Gelöste-Gase-Analyse (DGA) und Furananalyse.
Leistungselektronik: Temperatur- und On-State-Spannungsdrift, Gate-Ladung, Schaltverluste als Degradationsindikatoren.
Strukturelle Integrität:
Zerstörungsfreie Prüfungen (NDT): Ultraschallprüfung (UT), Wirbelstrom (ET), magnetische Streuflussprüfung (MFL), Röntgen/CT, Schallemissionslokalisierung.
Strukturelles Gesundheitsmonitoring (SHM): Dehnungsmessstreifen, faseroptische Sensoren (FBG), Korrosionscoupons, Schwingformanalyse.
Ergänzend gewinnt die visuelle Inspektion mittels Computer Vision (Drohnen, stationäre Kameras, IR-Kameras) an Bedeutung, etwa zur Detektion von Rissen, Leckagen oder Hotspots.
Die Zustandsdiagnose basiert auf mehrstufiger Signalverarbeitung, Modellen und datengetriebenen Methoden:
Signalverarbeitung: Filterung, FFT/Order-Tracking bei variabler Drehzahl, Envelope-, Wavelet- und Zeit-Frequenz-Methoden; Feature-Extraktion (RMS, Crest-Faktor, Spektrallinien, Entropie).
Modellbasierte Diagnose: Beobachter (Luenberger/Kalman), Paritätsgleichungen, physikalische Digital Twins; Residuenanalyse zur Fehlermode-Isolation.
Datengetriebene Verfahren: Klassifikation und Anomalieerkennung mittels Random Forests, SVM, Gradient Boosting, Autoencoder und Deep-Learning-Architekturen (z. B. CNNs für Bilder, LSTM/Transformers für Zeitreihen). Transfer Learning hilft bei domänenarmer Datenlage.
Entscheidungsunterstützung: Bayes’sche Netze, Fuzzy-Logik, Evidenztheorie zur Fusion heterogener Indikatoren; Unsicherheitsquantifizierung (Konfidenzen) zur robusten Alarmauslösung.
Restlebensdauerindikation: Extrapolation von Degradationstrends, stochastische Beanspruchungsmodelle, Partikelfilter; auch wenn strikt PdM, stiften RUL-Schätzer in CBM Mehrwert für die Einsatzplanung.
CBM erhöht die technische Verfügbarkeit durch frühzeitige Fehlersignalisierung, wodurch ungeplante Stillstände vermieden oder in geplante Eingriffe überführt werden. Konkrete Effekte sind:
Reduzierte mittlere Instandsetzungszeit (MTTR) durch vorbereitete Maßnahmen, vordisponierte Ersatzteile und zielgerichtete Eingriffe.
Verlängerung der nutzbaren Lebensdauer, da Komponenten bis nahe ihren tatsächlichen Verschleißgrenzen betrieben und Überwartung vermieden wird.
Optimiertes Ersatzteil- und Personalmanagement durch bedarfsorientierte Planung und Bündelung von Maßnahmen.
Kostensenkung über die gesamte Lebensdauer: weniger Folgeschäden, geringere Sekundärschäden durch Kaskadenausfälle, reduzierte Opportunitätskosten durch planbare Stillstände.
Qualitäts- und Energieeffekte: Zustandsnahe Regelung kann Effizienzeinbußen (z. B. durch Fehlausrichtung oder Schmierstoffabbau) früh erkennen und Gegenmaßnahmen auslösen.
Sensorik und Aktorik:
Auswahl und Platzierung: Sensoren müssen an den Lastpfaden und Schadensorten wirksam koppeln; Samplingrate und Dynamik sind applikationsspezifisch zu dimensionieren.
Robustheit: Umgebungsbedingungen (Temperatur, Feuchte, EMV, Verschmutzung) und Befestigung beeinflussen Signalqualität; Sensoralterung und Verklebungen erzeugen Drift.
Energie- und Konnektivitätsfragen: Batteriebetriebene, drahtlose Sensorik erfordert Energiemanagement; Edge-Vorverarbeitung reduziert Datenvolumen und Latenzen.
Datenmanagement und IT/OT-Integration:
Datenvolumen, -geschwindigkeit und -vielfalt (3V): Hochfrequente Schwingdaten erzeugen erhebliche Last; effiziente Kompression, Event-Triggering und Stream-Processing sind notwendig.
Datenqualität: Kalibrierung, Synchronisation und Zeitbezug; Umgang mit Ausreißern und Ausfällen; Metadaten- und Konfigurationsmanagement (Asset-Struktur, Sensorzuordnung).
Interoperabilität und Standards: Nutzung von OPC UA, MQTT, ISO 13374/17359 und OSA-CBM-Referenzarchitekturen erleichtert Skalierung und Lieferantenunabhängigkeit.
Sicherheit und Governance: Cybersecurity in OT-Netzen, rollenbasierter Zugriff, Auditierbarkeit; MLOps für Versionierung, Monitoring und Drift-Management von Modellen.
Methodische Limitationen:
Nicht alle Fehlermodi sind sensorisch erschließbar; plötzliche, katastrophale Ausfälle ohne Vorläufer bleiben ein Restrisiko.
Datenknappheit und Labelmangel erschweren die Modellbildung; synthetische Daten und physikinformierte Ansätze können helfen, ersetzen aber Feldvalidierung nicht.
Fehlalarme und verpasste Alarme verursachen Kosten; Trade-offs müssen risikobasiert kalibriert werden, inklusive Hysterese und Kontextlogik.
Erklärbarkeit: Black-Box-Modelle benötigen erklärbare Surrogate, um Akzeptanz bei Instandhalterinnen und Instandhaltern zu erreichen.
Organisation und Wirtschaftlichkeit:
Kompetenzen: Interdisziplinäre Fähigkeiten in Mechanik, Elektrotechnik, Datenanalyse und IT sind erforderlich; Schulung und Change Management sind kritisch.
Geschäftslogik: Investitionen in Sensorik und Dateninfrastruktur müssen mit Kritikalität und Nutzungsszenarien abgestimmt sein; Pilotierung mit klaren KPIs (z. B. Ausfallreduktion, MTBF-Anstieg) empfiehlt sich.
Regulatorik: In sicherheitskritischen Branchen sind Validierung, Nachweisführung und Zertifizierung für diagnostische Systeme zu beachten.
Erfolgreiche CBM-Implementierungen folgen einem strukturierten Vorgehen:
Kritikalitätsanalyse und Failure Mode and Effects Analysis (FMEA) zur Sensorauswahl, Festlegung von Zielgrößen und Schwellen; Aufbau einer skalierbaren Datenpipeline (Edge/Cloud-Hybrid) mit standardisierten Schnittstellen; schrittweise Modellreifung vom regelbasierten Monitoring zu probabilistischer Diagnose; enge Verzahnung mit EAM/CMMS-Systemen zur automatisierten Arbeitsauftragsgenerierung; kontinuierliche Wirksamkeitskontrolle und Modellpflege.
Zusammenfassend ermöglicht CBM eine deutliche Steigerung von Anlagenverfügbarkeit und Wirtschaftlichkeit, erfordert jedoch eine sorgfältige sensorische Auslegung, belastbare Datenmanagementarchitekturen und eine risikobasierte Entscheidungslogik, die technologische mit organisatorischen Aspekten verbindet.
Grundidee und Prinzipien
Zuverlässigkeitszentrierte Instandhaltung (Reliability-Centered Maintenance, RCM) ist ein strukturierter, funktions- und risikobasierter Ansatz zur Entwicklung von Instandhaltungsprogrammen. Ziel ist es, technische Systeme in ihrem aktuellen Nutzungskontext so zu erhalten, dass sie die geforderten Funktionen mit der benötigten Verfügbarkeit, Sicherheit und Wirtschaftlichkeit erbringen. RCM verschiebt den Fokus von pauschalen, kalenderbasierten Tätigkeiten hin zu maßgeschneiderten Maßnahmen, die aus der Analyse von Funktionen, Fehlermodi und Konsequenzen abgeleitet werden.
Die Kernelemente sind:
Funktionsorientierung: Identifikation der primären und sekundären Funktionen eines Systems einschließlich Leistungskennwerten und Toleranzen.
Kontextbezug: Berücksichtigung realer Betriebsbedingungen, Einsatzprofile und Belastungen.
Ausfallorientierung: Systematische Erfassung von Funktionsausfällen, Fehlermodi, Ursachen und Auswirkungen.
Risikoorientierung: Bewertung von Sicherheits-, Umwelt- und Verfügbarkeitskonsequenzen sowie wirtschaftlicher Auswirkungen.
Entscheidungslogik: Ableitung optimaler, wirksamer und wirtschaftlicher Maßnahmen (TBM, CBM, Funktionsprüfungen, Redesign, toleriertes Auslaufenlassen).
RCM beginnt mit der Definition von Systemgrenzen, einer funktionalen Zerlegung und der Spezifikation von Leistungsanforderungen. Darauf aufbauend erfolgt die Ausfallanalyse entlang folgender Fragen:
Welche Funktionen soll das System erfüllen und mit welchen Leistungsstandards?
Auf welche Weise kann das System diese Funktionen verfehlen (Funktionsausfälle)?
Welche Fehlermodi führen zu diesen Funktionsausfällen (z. B. Verschleiß, Korrosion, Ermüdung, Softwarefehler, Bedienfehler)?
Welche Ursachen (Mechanismen) liegen den Fehlermodi zugrunde und wie manifestieren sie sich?
Welche Auswirkungen haben die Fehlermodi auf Sicherheit, Umwelt, Produktion, Qualität und Kosten?
Welche vorhandenen Nachweis- oder Diagnosemöglichkeiten bestehen?
Welche Instandhaltungsaufgaben sind technisch machbar, wirksam und wirtschaftlich, um den Fehlermodus zu verhindern, zu verzögern oder frühzeitig zu erkennen?
Die Fehlermöglichkeits- und -einflussanalyse (FMEA) bildet die methodische Basis, um systematisch Fehlermodi, Ursachen und Effekte zu identifizieren. In der erweiterten Form, der FMECA (Failure Modes, Effects and Criticality Analysis), wird zusätzlic
Schweregrad (Severity)
Auftretenswahrscheinlichkeit (Occurrence)
Entdeckbarkeit (Detection)
Kritikalitätsmaß oder Risikoprioritätszahl (RPN) bzw. Risiko-Matrix
Im RCM-Rahmen dient die FMEA/FMECA:
zur Vollständigkeit der Fehlermodussammlung,
zur Priorisierung (Kritikalität) für die Maßnahmenselektion,
als Schnittstelle zu Sicherheitsanalysen (z. B. für Schutzfunktionen und „hidden failures“),
als Dokumentation der Entscheidungsgrundlagen.
Während die klassische FMEA häufig über RPN priorisiert, nutzt RCM eine konsequenzenorientierte Logik:
Sicherheits-/Umweltkonsequenzen, betriebliche Konsequenzen (Verfügbarkeit, Qualität, Kosten) und „keine/geringe Konsequenzen“. Damit wird verhindert, dass seltene, aber katastrophale Fehlermodi durch eine niedrige RPN unterschätzt werden.
Die Auswahl der Maßnahmen folgt einer pragmatischen, gleichzeitig streng wirksamkeitsorientierten Entscheidungslogik.
Zeitbasierte Instandhaltung (TBM)
Anwendbar, wenn ein ausgeprägtes alters- oder nutzungsabhängiges Ausfallverhalten vorliegt (z. B. zuverlässige Lebensdauerkorridore, Verschleißgrenzen).
Maßnahmen: periodische Austausche, Überholungen, Schmierintervalle.
Intervallfestlegung über Zuverlässigkeitsziele (z. B. mindestens R(t)≥x), Weibull-Analysen oder historische Felddaten.
Zustandsorientierte Instandhaltung (CBM)
Anwendbar, wenn ein Potenzialfehler vor dem Funktionsausfall erkennbar ist und das P-F-Intervall ausreichend groß ist.
Maßnahmen: Überwachung von Zustandsindikatoren (Schwingungen, Temperatur, Ölpartikel, Druckpulsationen, Performance-Degradation), Trendanalysen, Schwellenwertlogik.
Vorteil: maximale Restlebensdauernutzung bei kontrolliertem Risiko; reduzierte unnötige Eingriffe.
Funktionsprüfungen und Failure-Finding Tests
Erforderlich für verborgene Schutz- oder Sicherheitsfunktionen (z. B. Rückschlagventile, Sicherheitsketten), deren Ausfall ohne Anforderung unbemerkt bleibt.
Ziel: latente Ausfälle aufdecken und die Schutzwirkung gewährleisten.
Intervall orientiert an gefordertem Risiko (PFDavg), Testabdeckung und Wiederherstellzeiten.
Redesign und konstruktive/organisatorische Modifikationen
Wenn weder TBM noch CBM wirksam/ökonomisch sind oder Sicherheitsanforderungen dies verlangen.
Maßnahmen: Werkstoff-/Designanpassungen, verbesserte Dichtkonzepte, Filtration, Entkopplung, sensorische Aufrüstung, Fehlervermeidung durch Poka-Yoke, Prozessänderungen.
Oft langfristig die robusteste und insgesamt wirtschaftlichste Option.
Kritikalität wird über eine Kombination aus Konsequenzen und Wahrscheinlichkeit bewertet. RCM unterscheidet:
Sicherheits-/Umweltkritisch: Maßnahmen zwingend; CBM/Funktionstest oder Redesign, keine reine Run-to-Failure-Strategie.
Betriebs-/Verfügbarkeitskritisch: Kosten-Risiko-Abwägung; CBM bevorzugt, TBM bei Altersabhängigkeit.
Nichtkritisch: wirtschaftliche Optimierung bis hin zu Run-to-Failure.
Das P-F-Intervall ist der Zeitraum zwischen der ersten erkennbaren Verschlechterung (Potenzialfehler, P) und dem Funktionsausfall (F). Es ist zentral für CBM und Prüfintervalle:
Anforderungen an CBM: Es muss ein verlässlicher, messbarer Indikator existieren; das P-F-Intervall muss groß genug sein, um Erkennung, Diagnose, Planung und Maßnahme rechtzeitig durchzuführen.
Inspektions-/Messintervalle: typischerweise deutlich kürzer als das P-F-Intervall (Daumenregel: ≤ 1/2 bis 1/3 des P-F-Intervalls), angepasst an Messunsicherheit, Prozessvariabilität und Logistik.
Methodik: Trendanalytik, Schwellwertbestimmung, Zustandsmodelle (Weibull, Cox-Proportional-Hazards, Hidden-Markov-Modelle), Bayes-Updates mit Felddaten.
Verbindung zu Sicherheitsfunktionen: Für „hidden failures“ richtet sich das Prüfintervall an der zulässigen durchschnittlichen Ausfallwahrscheinlichkeit (z. B. PFDavg) aus; die Nachweisabdeckung der Tests ist explizit zu berücksichtigen.
Hinweis:
Beispielhaft kann bei einer rotierenden Pumpe der Schwingungsanstieg oberhalb eines bandbreitenspezifischen RMS-Schwellenwerts den Potenzialfehler anzeigen. Liegt das typische P-F-Intervall bei sechs Wochen, sollte die Messfrequenz mindestens wöchentlich, oft 2–3-tägig, gewählt werden, um Diagnose- und Planungszeiten robust zu integrieren.
Wirksame RCM-Programme benötigen:
belastbare Felddaten zu Ausfällen, Ursachen, Betriebsprofilen und Kosteneffekten,
geeignete Sensorik und Datenverfügbarkeit für CBM,
interdisziplinäre Teams (Betrieb, Instandhaltung, Qualität, Sicherheit),
klare Rollen für die Pflege der FMEA/FMECA und die Aktualisierung der Entscheidungslogik,
Rückkopplungen durch KPI (z. B. MTBF, Verfügbarkeit, false positives/negatives bei CBM, Sicherheitsindikatoren) und kontinuierliche Verbesserung.
Total Productive Maintenance (TPM)
Total Productive Maintenance (TPM) ist ein sozio-technisches Managementsystem zur Maximierung der Anlagenwirksamkeit über den gesamten Lebenszyklus. Es adressiert systematisch alle Verlustarten an Produktionsanlagen (Stillstände, Minderleistungen, Qualitätsverluste, Anfahr- und Umrüstverluste) mit dem Ziel von Null ungeplanten Ausfällen, Null Defekten und Null Unfällen. Zentral ist die aktive Einbindung aller Mitarbeitenden – insbesondere der Anlagenbedienerinnen und -bediener – in die Instandhaltungs- und Verbesserungsprozesse.
Prinzipien und Rolle der Anlagenbediener
Eigentümerschaft am Equipment: Bediener verstehen sich nicht nur als Nutzer, sondern als “Owner” des Zustands ihrer Anlage. Sie sind die erste Verteidigungslinie gegen Degradation.
Verlusterkennung am Ort der Wertschöpfung (Gemba): Abweichungen werden dort sichtbar gemacht, wo sie entstehen, und unmittelbar adressiert.
Standardisierung vor Optimierung: Erst werden Normalzustände definiert und visuell abgesichert, dann wird verbessert.
Qualifizierung und Befähigung: Wissen über Funktionsweisen, Verschleißmechanismen und sicherheitskonforme Eingriffe wird gezielt aufgebaut.
Interdisziplinäre Zusammenarbeit: Produktion, Instandhaltung, Qualität und Technik arbeiten in stabilen Routinen und Projektformaten (z. B. Kobetsu-Kaizen-Teams) zusammen.
Autonome Instandhaltung (Jishu Hozen) überführt wiederkehrende, risikoarme Tätigkeiten in die Verantwortung der Bediener. Kernelemente sind:
Reinigung–Inspektion–Schmierung–Nachziehen (CIL-T): Systematische Beseitigung von Schmutz als Fehlerquelle, Sicht- und Hörinspektionen, bedarfs- oder zeitgerechte Schmierung, Prüfung und Sicherung von Verbindungen.
Beseitigung von Kontaminations- und Leckagequellen: Nachhaltige Ursachenbehebung statt symptomatischer Reinigung (z. B. Dichtungen, Abdeckungen, Kabelschutz).
Visuelle Standards und Centerlining: Festlegung und Markierung von Soll-Positionen, Einstellfenstern und Anzugsmomenten; Checklisten und Standardarbeitsblätter unterstützen die zuverlässige Ausführung.
Tagging und Anomalie-Management: Auffälligkeiten werden mit Abweichungs-Tags gekennzeichnet, dokumentiert und innerhalb definierter Fristen abgearbeitet.
Autonome Inspektion: Bediener prüfen kritische Komponenten (z. B. Riemenspannung, Temperatur, Geräusch, Vibration) nach Standardmerkmalen und dokumentieren Messwerte.
Ordnung und Sauberkeit (5S) am Arbeitsplatz: Stabilisiert Sichtbarkeit von Abweichungen und verkürzt Such- und Rüstzeiten.
Kleinere Instandsetzungen im Kompetenzrahmen: Austausch von Verschleißteilen mit Steckverbindungen, Kalibrierung von Sensoren nach Freigabe.
Organisatorische Verankerung: Schulung und Eskalation
Qualifizierungssystematik: Skill-Matrizen definieren Kompetenzstufen (z. B. Grundwissen, sichere Anwendung, Unterweisung anderer). Methodische Formate wie TWI/Job Instruction, E-Learning und Praxis-Coaching sichern Lerntransfer.
Governance und Audits: TPM-Audits prüfen Standardtreue, Wirksamkeit und Reifegrade der autonomen Instandhaltung; Abweichungen führen zu Maßnahmenplänen.
Schicht- und Stufenkommunikation: Tiered Shopfloor Management mit kurzen, zeitgetakteten Besprechungen (Schicht, Bereich, Werk) visualisiert Kennzahlen, priorisiert Probleme und steuert Ressourcen.
Eskalationslogik: Andon-Signale oder digitale Meldungen lösen zeitgebundene Reaktionen aus (z. B. 10-30-60-Regel: Bediener – Instandhaltung – Technik/Management). Eindeutige Verantwortlichkeiten und Reaktionszeiten sind dokumentiert.
Instandhaltungsintegration: Geplante Instandhaltung synchronisiert TPM-Aktivitäten mit Wartungsplänen, Ersatzteilmanagement, Condition Monitoring und gesetzlicher Prüfpflicht.
Früheinbindung Technik/Engineering: Erkenntnisse aus TPM fließen in die konstruktive Weiterentwicklung (Design for Maintainability, zugängliche Schmierstellen, integrierte Zustandsmessung).
TPM wirkt direkt auf die Overall Equipment Effectiveness (OEE), insbesondere auf die Verfügbarkeit:
Reduktion ungeplanter Stillstände: Frühentdeckung von Anomalien verschiebt Eingriffe auf geplante Zeitfenster und senkt MTTR durch bessere Zugänglichkeit und Standardtools.
Erhöhung MTBF: Beseitigung von Schmutz-, Lockerungs- und Schmierdefiziten verhindert schleichende Degradation und Sekundärschäden.
Stabilisierung der Prozessqualität: Saubere, korrekt eingestellte Anlagen reduzieren Qualitätsverluste und Nacharbeit; frühe Signale (Vibration, Geräusch, Temperatur, Leckagen) werden im P–F-Intervall erkannt.
Wissensrückführung: Systematische Dokumentation von Abweichungen verbessert FMEA, Wartungsstrategien und Ersatzteilbevorratung.
Kennzahlen und Reifegradindikatoren
OEE und Verfügbarkeitskomponente
Mean Time Between Failure (MTBF), Mean Time To Repair (MTTR)
Breakdown Rate, geplanter Instandhaltungsanteil, autonome Instandhaltungsabdeckung
Tag-Closure-Rate und Reaktionszeiten in der Eskalation
Audit-Score der autonomen Instandhaltung, 5S-Assessment
Einordnung der Strategien
Time-Based Maintenance (TBM): Zeit- oder nutzungsbasierte präventive Maßnahmen nach festen Intervallen. Ziel ist Planbarkeit und Einhaltung von Vorgaben, unabhängig vom individuellen Zustandsverlauf.
Condition-Based Maintenance (CBM): Zustands- bzw. zustandsprognosebasierte Eingriffe ausgelöst durch Messgrößen, Schwellenwerte oder Modelle (vorausschauende Instandhaltung).
Reliability-Centered Maintenance (RCM): Systematische, funktions- und risikoorientierte Ableitung des optimalen Maßnahmenmix pro Ausfallmodus (einschließlich TBM, CBM, Funktionsprüfungen, Designänderungen, Run-to-Failure).
Total Productive Maintenance (TPM): Ganzheitliches Produktionssystem mit Fokus auf OEE, autonome Instandhaltung durch Bediener, standardisierte Pflege, kontinuierliche Verbesserung und qualifikationsgetriebene Robustheit.
TBM
Vorteile: Hohe Planbarkeit, einfache Implementierung, geringe Datenanforderungen, regulatorisch anerkannt (z. B. in sicherheitskritischen Domänen), erleichtert Ersatzteil- und Kapazitätsplanung.
Nachteile: Über- oder Unterwartung bei zufälligen Ausfallmodi, zusätzliche Stillstände, potenzielle Frühschäden nach Eingriffen (infant mortality), geringe Reaktionsfähigkeit auf reale Degradation.
CBM
Vorteile: Bedarfsgerechte Eingriffe, höhere Verfügbarkeit durch frühzeitige Detektion, bessere Nutzung der Restlebensdauer, reduzierte überflüssige Eingriffe, Lerngewinne aus Daten.
Nachteile: Sensorik-, Konnektivitäts- und Analyseaufwand; Abhängigkeit von Datenqualität; Fehl- und Nichtauslösungen; Anfangsinvestitionen; Erklärbarkeit und Governance der Modelle erforderlich.
RCM
Vorteile: Konsistente, sicherheits- und kostenorientierte Priorisierung; passfähiger Maßnahmenmix je Ausfallmodus; Vermeidung unnötiger Wartung; Transparenz über Funktionskritikalität; Integration von Prüfstrategien für latente Fehler.
Nachteile: Hoher initialer Analyse- und Moderationsaufwand; Bedarf an domänenspezifischem Wissen und gepflegten FMEA/RCM-Daten; regelmäßige Aktualisierung notwendig; mögliche Akzeptanzhürden.
TPM
Vorteile: Stärkung der Anlagenkompetenz in der Linie; schnelle Störbeseitigung; Standardisierung (5S, autonome Inspektionen); verbesserte OEE; verankerte Verbesserungsroutine; reduzierte Schnittstellenverluste.
Nachteile: Kultur- und Führungsabhängigkeit; Erhaltungsaufwand für Standards; Gefahr der Formalisierung ohne Wirksamkeit; begrenzte Wirksamkeit bei komplexen, hochkritischen Ausfallmodi ohne ergänzende Fachinstandhaltung.
Kombinationsmöglichkeiten und Synergien
RCM als Dachlogik: RCM identifiziert je Ausfallmodus den geeigneten Mechanismus (TBM für alterungsdominierte, CBM für sensorisierbare Degradation, Funktionsprüfungen für versteckte Ausfälle, Run-to-Failure bei unkritischen).
CBM als Enabler: Zustandsdaten schließen Wissenslücken in RCM-Analysen, liefern Feedback zur Wirksamkeit von Maßnahmen und unterstützen dynamische Intervallanpassungen.
TBM als Compliance- und Backup-Schicht: Für regulatorische Pflichtumfänge oder schlecht sensorisierbare Alterungsprozesse bleibt TBM sinnvoll; Dual-Trigger-Strategien kombinieren maximale Fälligkeit (Zeit/Nutzung) mit Zustandsgrenzen.
TPM als Umsetzungsmotor: Autonome Inspektionen füttern CBM mit Alltagssignalen (z. B. Geräusch, Leckage, Temperatur), reduzieren Grundstörungen und schaffen Daten- und Prozessdisziplin für RCM-Entscheidungen.
Opportunistische Instandhaltung: Kombination von CBM-Alarmen mit geplanten TBM-Fenstern minimiert Rüst- und Stillstandskosten.
Risk-Based Maintenance (RBM) als Brücke: RCM-Prioritäten werden über Risiko- und Konsequenztöpfe operationalisiert; CBM-Indikatoren modifizieren Risiko in Echtzeit.
Technische Abhängigkeiten:
Ausfallverhalten: Zeit-/nutzungsabhängige Alterung begünstigt TBM; zufallsverteilte Ausfälle erfordern CBM, Prüfstrategien oder Designänderungen.
Sensorisierbarkeit: Latente oder schnell-katastrophale Ausfallmodi begrenzen CBM; hier sind redundante Überwachung, Funktionstests oder Schutzsysteme zentral (RCM).
Diagnostikreife: Ohne verlässliche Zustandsindikatoren (Signal-zu-Rausch-Verhältnis, Messunsicherheit) drohen Fehlalarme und Vertrauensverlust.
Ökonomische und organisatorische Abhängigkeiten:
Kostenstruktur: Hohe Stillstandskosten und lange Wiederanfahrzeiten begünstigen CBM/RCM; niedrige Kritikalität und kurze Rüstzeiten sprechen für TBM oder Run-to-Failure.
Kompetenz und Kultur: TPM setzt Führungskonsistenz und Qualifizierung voraus; RCM verlangt interdisziplinäre Moderation; CBM benötigt Datenkompetenz.
IT/OT-Infrastruktur: Vernetzung, Datensicherheit und Governance sind Voraussetzung für skalierbares CBM; fehlende Infrastruktur limitiert Nutzen.
Regulatorik und Sicherheit:
Sicherheits- und Compliance-getriebene Umfelder (z. B. Luftfahrt, Pharma) verlangen nachvollziehbare, validierte Strategien; TBM und formalisierte RCM-Prozesse sind oft verpflichtend, CBM muss validiert und auditierbar sein.
Implikationen für die Praxis
Für kritische Anlagen empfiehlt sich RCM als Entscheidungsrahmen, der CBM, TBM, Funktionsprüfungen und Designmaßnahmen integriert.
In reifen TPM-Umgebungen steigen Datenqualität und Reaktionsgeschwindigkeit; CBM wird dadurch wirksamer und kostengünstiger.
Hybrid-Strategien mit Dual-Triggern, opportunistischen Bündelungen und risikoadaptiven Intervallen maximieren Verfügbarkeit bei kontrollierten Lebenszykluskosten.
Grenzen entstehen weniger durch Methodik als durch Datenreife, Kultur und Regulatorik; diese Abhängigkeiten sind frühzeitig in der Roadmap zu adressieren.
Zielbild und Grundprinzip
Die hybride Instandhaltungsstrategie kombiniert zeitbasierte Instandhaltung (Time-Based Maintenance, TBM), zustandsorientierte Instandhaltung (Condition-Based Maintenance, CBM) und kontrolliertes Auslaufen bis zum Ausfall (Run-to-Failure, R2F), um Sicherheit, Verfügbarkeit und Wirtschaftlichkeit im Lebenszyklus von Anlagen auszubalancieren. Die Entscheidungslogik ist risikoorientiert, nutzt klar definierte Auswahlkriterien und übersetzt diese in eine regelbasierte Zuordnung zu TBM, CBM oder R2F – einschließlich Eskalationspfaden und Triggern für die Wartungsauslösung.
Für die Strategieauswahl werden Kriterien bewertet und zu einem Entscheidungsindex verdichtet. Die Kerndimensionen sind:
Kritikalität (funktional/ökonomisch)
Einfluss auf Anlagenverfügbarkeit, Produktionsverluste, Wiederanlaufzeit, Ersatzteil- und Opportunitätskosten
Systemabhängigkeiten, Engpasscharakter, Redundanzgrad
Sicherheit/Compliance
Personen- und Umweltschutz, Explosions- und Druckrisiken, Anforderungen nach SIL/PL
Gesetzliche und normative Prüfpflichten (z. B. Druckgeräte, Not-Halt, Schutzsysteme)
Auslastung/Betriebsprofil
Betriebsstunden, Start-Stopp-Häufigkeit, zyklische oder variable Lastkollektive, thermische und mechanische Beanspruchung
Prozessvariabilität, Schaltspiele, Lastspitzen
Wartbarkeit/Datenfähigkeit
Sensorik, Datenqualität/-historie, Diagnosezugang, Vorhersagemodelle
Reparierbarkeit, MTTR, Ersatzteilverfügbarkeit
Bewertungsskala (beispielhaft):
1 = niedrig, 3 = mittel, 5 = hoch. Gewichtung (Richtwerte): Kritikalität 0,4; Sicherheit/Compliance 0,3; Auslastung 0,2; Wartbarkeit/Datenfähigkeit 0,1. Der gewichtete Index I dient der Strategiezuordnung und wird durch harte regulatorische Anforderungen übersteuert, wo nötig.
Die Kombination erfolgt regelbasiert über eine Mehrkriterien-Matrix:
Zwingende TBM/Inspektionen (Regulatorik)
Wenn Sicherheitsfunktion/Prüfpflicht vorhanden (z. B. SIL/PL-Prooftests, Druckbehälter), dann TBM/Inspektionsintervalle fest gemäß Norm/Behörde. CBM ist zulässig als Ergänzung (z. B. Online-Prüfungen), ersetzt aber nicht erforderliche Nachweise.
Kritikalität und Auslastung
I ≥ 3,5 oder Kritikalität/Sicherheit = 5: CBM als Primärstrategie; TBM für Compliance und Basis-Schmier-/Kalibrierzyklen; R2F ausgeschlossen. Redundanzüberwachung einbinden.
2,5 ≤ I < 3,5: CBM primär, TBM sekundär (verlängerte Intervalle durch Zustandsnachweis). R2F nur für nicht-sicherheitsrelevante, redundante Komponenten möglich.
I < 2,5 und Sicherheit/Compliance ≤ 2: R2F zulässig; minimalistische TBM (z. B. Sichtprüfungen) zur Früherkennung systemischer Probleme. CBM optional bei günstiger Sensorik.
Datenfähigkeit als Ermöglicher
Wenn Datenfähigkeit ≤ 2: CBM nur in Light-Variante (Trend-basierte einfache Indikatoren). Fehlen Diagnosedaten, greift TBM konservativer.
Bei hoher Datenfähigkeit (≥ 4): prädiktive CBM (Modelle, Anomalieerkennung) erlaubt Intervallflexibilisierung und vorausschauende Ersatzteillogistik.
Redundanz und Wiederanlauf
Hohe Redundanz/kurze MTTR: R2F kann risikoarm sein. Geringe Redundanz/lange Wiederanlaufzeit: CBM forcieren, TBM nicht kürzen.
Textueller Entscheidungsbaum (vereinfacht):
Gibt es regulatorische Prüfpflichten? Ja → TBM/Inspektion verpflichtend (fixe Basisintervalle). Zusätzlich: CBM, wenn möglich.
Ist die Sicherheits- oder Funktionskritikalität hoch? Ja → CBM primär, R2F ausgeschlossen; TBM für Pflichtanteile.
Ist die Auslastung/Lastkollektiv hoch variabel? Ja → CBM (zustands- und zyklusabhängige Trigger); TBM nur als Fallback.
Sind Daten/Sensorik unzureichend? Ja → TBM konservativ ansetzen; gezielt Datenbefähigung planen; interimistisch Inspektions-CBM.
Andernfalls → R2F erwägen, sofern Sicherheits- und Verfügbarkeitsziele erfüllt werden.
Zustandsbasierte Trigger (CBM)
Grenzwertbasiert: Überschreitung absoluter Schwellen (z. B. Schwingung RMS/Peak, Lager-Kurtosis, Ölpartikelzahl ISO 4406, Temperaturanstieg > ΔTkrit).
Trend- und Statistikregeln: gleitende Trends, CUSUM, 3σ-Verletzungen, Anstiegsrate dX/dt > Limit, Residualabweichung in Modellen.
Prädiktive Schwellen: Restlebensdauer (RUL) < Tlead; Ausfallwahrscheinlichkeit P(f|t) > Pkrit; Anomaliescore > Akrit über n Zyklen.
Kombination: Alarme erst bei Bestätigung durch mindestens zwei Indikatoren (Reduktion von Fehlalarmen).
Stufen:
Vorwarnung (Gelb): Trendauffälligkeit oder 80% Grenzwert → Wartung einplanen, Ersatzteil disponieren.
Eingriff (Rot): Grenzwert erreicht oder RUL < Tlead_min → sofortige Maßnahme, ggf. kontrollierter Stopp.
Sicherheits- und Compliance-Trigger (TBM/Inspektionen)
Kalender-/Betriebszeitbasiert: fixe Intervalle (z. B. 12 Monate/6.000 h).
Funktionsprüfungen: Not-Halt, Schutzventile, Interlocks; Trigger durch Fristablauf oder Zählereignisse (Betätigungen).
Dokumentationspflicht: Auslösung, wenn Prüfzeugnisse ablaufen oder Kalibrierzertifikate fällig sind.
Last- und Zyklusbasiert
Zyklenzählung (Rainflow) und Miner’s-Regel: kumulierter Schaden D; Gelb bei D ≥ 0,6; Rot bei D ≥ 1,0 (oder bei Überlastereignis).
Ereignisbasierte Trigger: Lastspitzen > 1,2×Nennlast, Temperatur-Schocks, Druckschläge → Sonderinspektion.
Adaptive Intervalle: TBM-Intervalle proportional zur tatsächlichen Zyklenzahl/Lastintegral.
Klasse A (hoch kritisch/sicherheitsrelevant)
Kriterien: hohe Gefährdung (SIL/PL), großer Produktionsimpact, geringe Redundanz, lange Wiederanlaufzeit.
Strategie: CBM primär; TBM/Prooftests strikt; R2F ausgeschlossen.
Trigger-Politik: zweistufige Alarme mit kurzen Tlead (z. B. RUL ≥ 14 Tage für Gelb, ≥ 3 Tage für Rot). Sofortige Eskalation zu Technikleitung/SHE.
Eskalation: bei Rot Stop/Bypass in definiertem Safe-State; verpflichtende Ursachenanalyse; Intervallverkürzung bis Nachweis der Wirksamkeit.
Klasse B (mittel kritisch)
Kriterien: moderater Sicherheits- und Verfügbarkeitsimpact, teilweise Redundanz, beherrschbare MTTR.
Strategie: CBM primär; TBM reduziert/verlängert durch Zustandsnachweis; R2F restriktiv und nur bei redundanten Komponenten.
Trigger-Politik: Gelb → Arbeitsauftrag in X Tagen; Rot → geplanter Stopp innerhalb Y Tage. Degradierter Betrieb erlaubt, wenn Risiko akzeptiert.
Eskalation: Wiederholte Gelb-Events (>3/Quartal) oder zwei Rot-Events/Jahr → Re-Klassifikation zu A oder Engineering-Maßnahmen (Design-/Sensorik-Upgrade).
Klasse C (niedrig kritisch)
Kriterien: geringe Sicherheitsrelevanz, niedriger Verfügbarkeitsimpact, hohe Redundanz, kurze MTTR.
Strategie: R2F zulässig; minimalistische TBM/Inspektionen; opportunistische Wartung bei Stillständen.
Trigger-Politik: Zustandsalarme als Planungshilfe; Eingriff meist bei Ausfall oder gebündelt mit Stillständen.
Eskalation: Anstieg der Ausfallrate (z. B. MTBF < Schwellwert) oder Serienfehler → temporäre Hochstufung zu B, Einführung einfacher CBM-Indikatoren.
Governance, Rollout und Lernschleifen
Entscheidungsinstanz: interdisziplinäres Gremium (Instandhaltung, Produktion, Sicherheit, Engineering) validiert Klassen, Gewichte und Trigger.
Daten- und Modellschaft: Pflege von Schwellen, Modellen und Diagnosebibliotheken; MOC-Prozess bei Änderungen.
KPI-gestützte Adaption: Ausfallkosten, MTBF/MTTR, Fehlalarmrate, Termintreue von Prooftests; regelmäßige Re-Kalibrierung der Matrix.
Wissensrückführung: RCA-Ergebnisse beeinflussen Klassenzuordnung, TBM-Intervalle, Sensorik-Upgrade-Backlog.
Übergeordnete Pflichten nach ArbSchG und BetrSichV
Der rechtliche Ausgangspunkt für Bau, Bereitstellung und Betrieb von Kranen in Deutschland ist zweistufig: das Arbeitsschutzgesetz (ArbSchG) als Rahmengesetz und die Betriebssicherheitsverordnung (BetrSichV) als zentrale Verordnung für Arbeitsmittel. Das ArbSchG verpflichtet Arbeitgeber, Arbeit so zu organisieren, dass Gefährdungen vermieden und verbleibende Risiken minimiert werden. Zentrale Elemente sind die Gefährdungsbeurteilung, die Ableitung von Schutzmaßnahmen, die Unterweisung der Beschäftigten sowie die kontinuierliche Wirksamkeitskontrolle (§§ 3, 4, 5, 12 ArbSchG).
Die BetrSichV konkretisiert diese Pflichten für Arbeitsmittel wie Krane. Arbeitgeber müssen vor Bereitstellung und während des gesamten Lebenszyklus eine anlass- und änderungsbezogene Gefährdungsbeurteilung durchführen, die Verwendungsszenarien (Normal-, Stör- und Instandhaltungssituationen), Umgebungsbedingungen und Schnittstellen (z. B. Lastaufnahmemittel, Anschlagmittel, Funksteuerungen) umfasst (§ 3 BetrSichV). Daraus sind Schutzmaßnahmen nach dem STOP-Prinzip abzuleiten und organisatorisch zu verankern (§ 4 BetrSichV). Krane sind vor der ersten Inbetriebnahme, nach wesentlichen Änderungen sowie in festgelegten Fristen durch „befähigte Personen“ zu prüfen; Prüfumfang, -fristen und -tiefe sind risikobasiert festzulegen und zu dokumentieren (§ 14 BetrSichV). Hinzu kommen Pflichten zur Unterweisung, zum sicheren Betrieb (Betriebsanweisungen), zur Instandhaltung mit geeigneten Verfahren und qualifiziertem Personal sowie zur Dokumentation (z. B. Prüfprotokolle, Instandhaltungsnachweise, Nachweise zu sicherheitsrelevanten Änderungen).
Für neue Krane gilt zusätzlich das europäische Produktrecht. Hersteller müssen die grundlegenden Sicherheits- und Gesundheitsschutzanforderungen der Maschinenrichtlinie 2006/42/EG (in Deutschland umgesetzt über die 9. ProdSV) erfüllen, ein Konformitätsbewertungsverfahren durchführen und die CE-Kennzeichnung anbringen. Die Anwendung harmonisierter Normen (z. B. EN 13001, EN 15011) begründet die Vermutungswirkung der Konformität.
Die Unfallversicherungsträger konkretisieren den Stand der Technik für den Betrieb durch autonome Vorschriften und Regeln:
DGUV Vorschrift 52 „Krane“ enthält verbindliche Pflichten für Betreiber, u. a. zur Auswahl und Qualifikation von Kranführern, zu Prüfungen vor der ersten Inbetriebnahme und wiederkehrend, zur Festlegung von Betriebsgrenzen (z. B. Überlast, Wind), zu Betriebsverboten bei Mängeln sowie zur Organisation des sicheren Betriebs (Sichtverhältnisse, Anschlagen von Lasten, Signale).
Die DGUV Regeln (u. a. DGUV Regel 100-500, Kapitel 2.8 „Betreiben von Kranen“) konkretisieren praxisorientiert u. a. Vorbereitungs- und Sichtkontrollen, Anforderungen an Funkfernsteuerungen, die Abstimmung zwischen Kranführer, Anschläger und Einweiser sowie Maßnahmen zur Kollisionsvermeidung bei mehreren Kranen.
DGUV Informationen unterstützen mit Auslegungshilfen, Checklisten und Beispielen (z. B. Auswahl/Prüfung von Anschlagmitteln, Lastaufnahmeeinrichtungen, sichere Arbeitsverfahren).
Die Technischen Regeln für Betriebssicherheit (TRBS) entfalten normative Bindung als anerkannter Stand der Technik im Anwendungsbereich der BetrSichV:
TRBS 1111 beschreibt Methode und Mindestinhalte der Gefährdungsbeurteilung für Arbeitsmittel, einschließlich Festlegung von Prüfart, -tiefe und -fristen.
TRBS 1201 konkretisiert Prüfungen von Arbeitsmitteln (Erst-, wiederkehrende und anlassbezogene Prüfungen), einschließlich Dokumentationsanforderungen und Kriterien zur Festlegung des Prüfumfangs.
TRBS 1203 definiert Anforderungen an „befähigte Personen“ (Fachkunde, Berufserfahrung, zeitnahe Tätigkeit), die Kranprüfungen durchführen.
TRBS 2111 adressiert mechanische Gefährdungen (Quetschen, Scheren, Absturz von Lasten) und leitet Schutzmaßnahmen ab; ergänzend sind TRBS 2121-Teile einschlägig, wenn Arbeiten in der Höhe an Kranbahnen oder Auslegern stattfinden.
Wichtig ist das kohärente Zusammenspiel:
Die Gefährdungsbeurteilung (TRBS 1111) legt Betriebsgrenzen, Prüfstrategie (TRBS 1201) und Qualifikationsanforderungen (TRBS 1203) fest; DGUV Vorschrift/Regeln konkretisieren die branchentypischen Maßnahmen für Krane.
Tragwerks- und Lastannahmen:
DIN EN 13001 „Kransicherheit – Konstruktion“: Teil 1 (Grundsätze und allgemeine Anforderungen) legt Sicherheitsphilosophie und Nachweisformate fest, Teil 2 behandelt Lastfälle und Kombinationsregeln, Teil 3-1 regelt Tragfähigkeits- und Ermüdungsnachweise für Stahltragwerke. Die Reihe unterstützt die konsistente Ableitung von Bemessungslasten aus Einsatzprofilen (Duty Classes).
ISO 8686 (Reihe) spezifiziert Lastannahmen und Kombinationen für verschiedene Krankategorien; ISO 4301 klassifiziert Mechanismen nach Beanspruchungsgruppen.
Krantypspezifische C-Normen:
EN 15011 für Brücken- und Portalkrane (z. B. Anforderungen an Endanschläge, Hubwerke, Katzfahrwerke, Kollisionsschutz, betriebliche Grenzwerte; typische Verweise auf konstruktive Auslegung in EN 13001).
EN 13000 (Mobilkrane), EN 12999 (Ladekrane) und EN 14439 (Turmdrehkrane) für andere Krantypen; Auswahl entsprechend dem Produktportfolio.
Ausrüstung und elektrische Ausrüstung:
EN 13135 „Ausrüstung“ legt Anforderungen an sicherheitsrelevante Ausrüstungen, Lastaufnahmemittel-Schnittstellen, Haken, Seiltrommeln, Endschalter und Anzeigen fest.
EN 13557 „Bedienungseinrichtungen und Steuerstände“ regelt ergonomische und sicherheitstechnische Anforderungen an Steuerstände, Bedienschnittstellen und Funksteuerungen.
EN 60204-32 „Elektrische Ausrüstung von Hebezeugen“ konkretisiert Schutz gegen elektrischen Schlag, Kurzschluss- und Überlastschutz, EMV, Not-Halt, Kennzeichnung, Prüfung und Dokumentation für Hebezeuge.
Sicherheitsbezogene Steuerungsfunktionen:
EN ISO 13849-1/-2 und alternativ IEC 62061 definieren die Auslegung und Validierung sicherheitsbezogener Teile von Steuerungen (SIL/PL). Für Funktionen wie Überlastbegrenzung, Endlagenabschaltung, Geschwindigkeitsbegrenzung, Zweihandbedienung und Not-Halt sind i. d. R. PL d/SIL 2 anzustreben, abhängig von Risikobeurteilung und Normvorgaben.
Betrieb, Inspektion und Lebensdauer:
ISO 9927 (Reihe) legt regelmäßige Inspektionsarten und -umfänge für Krane fest (tägliche Sichtkontrolle, häufige, periodische und umfassende Inspektionen).
ISO 12482 beschreibt zustandsorientierte Überwachung und Lebensdauermanagement von Kranen, u. a. Erfassung von Lastkollektiven und Ableitung der verbleibenden Restlebensdauer.
ISO 4309 regelt Auswahl, Betrieb, Prüfung, Pflege und Aussonderungskriterien von Drahtseilen (z. B. Grenzwerte für Drahtbrüche, Einzeldrahtbrüche in Seillitze, Korrosion, Quetschungen; inklusive Vorgaben zu Prüfintervallen und Dokumentation).
EN 13155 und weitere Normen zu Lastaufnahmeeinrichtungen sowie EN 818/EN 13414 für Anschlagmittel sind für den sicheren Lastfluss essenziell.
Hinweis zu Normabschnitten:
Für die Auslegung sind in EN 13001-2 die Lastfälle und Kombinationsregeln maßgeblich; Tragfähigkeits-/Ermüdungsnachweise nach EN 13001-3-1. EN 15011 enthält in den Abschnitten zu „Sicherheitsfunktionen“ und „Verifizierung/Validierung“ die Anforderungen an Überlast- und Endabschaltfunktionen; EN 60204-32 regelt Prüfungen und Dokumentation in den Kapiteln „Erstprüfung“ und „Kennzeichnung“. ISO 12482 spezifiziert Verfahren zur Datenerfassung (Betriebszyklus, Lastkollektiv) und Bewertungsschwellen; ISO 4309 die Aussonderungskriterien und Prüfmethoden.
Mit der Digitalisierung von Kranen (Funkfernsteuerungen, Fernwartung, Condition Monitoring) gewinnt Cybersicherheit an Relevanz. Die IEC 62443-Reihe stellt den maßgeblichen Stand der Technik für industrielle Automatisierungssysteme dar:
IEC 62443-2-1/-2-4 adressieren Managementprozesse und Anforderungen an Integratoren/Service.
IEC 62443-3-2/-3-3 definieren zonen- und conduitorientierte Risikoanalyse sowie technische Sicherheitsanforderungen (Security Levels) für Systemebene.
IEC 62443-4-2 legt Komponentenanforderungen fest (z. B. Authentisierung, Härtung, Ereignisprotokollierung) – relevant für Steuerungen, Funkmodule und Gateways.
Hinweis:
Auf Organisationsebene ergänzt ISO/IEC 27001 (ISMS) die Governance. Sicherheitsfunktionen dürfen durch Security-Maßnahmen nicht in ihrer Wirksamkeit beeinträchtigt werden; die Ko-Engineering-Leitlinien von EN ISO 13849/IEC 62061 in Verbindung mit IEC 62443 sind zu beachten (Safety & Security Co-Design). Datenintegrität und -schutz für Betriebs- und Lebensdauerdaten nach ISO 12482 sind sicherzustellen.
Asset-Management nach ISO 55001
ISO 55001 bietet einen Rahmen für wertorientiertes Asset-Management über den gesamten Lebenszyklus eines Krans. Im Kontext BetrSichV lassen sich Prüf- und Instandhaltungsstrategien risikobasiert planen, Zustandsdaten aus ISO 12482 integrieren und Ersatzstrategien (Lebensdauerende nach ISO 4309/Ermüdung nach EN 13001) transparent begründen. Ergänzend liefern ISO 55000/55002 Leitlinien zu Rollen, KPIs (Verfügbarkeit, Sicherheitsleistung, Lebenszykluskosten) und kontinuierlicher Verbesserung. So werden regulatorische Pflichten (Sicherheit) mit wirtschaftlichen Zielen (Zuverlässigkeit, OPEX) systematisch verknüpft.
Internationaler Vergleich
USA: OSHA 29 CFR 1910/1926 und die ASME-B30-Reihe (z. B. B30.2 für Brücken/Portalkrane, B30.17 für Unterflansch-Krane) regeln Design, Betrieb und Inspektion. Die ASME-Standards betonen periodische Inspektionen (frequent/periodic) und Zustandsbewertungen ähnlich ISO 9927; die Klassifizierung unterscheidet sich jedoch teils von EN/ISO.
Kanada: CSA B167 (Brücken- und Portalkrane) harmonisiert weitgehend mit ASME, ergänzt um kanadische elektrische Codes.
Australien/Neuseeland: AS/NZS 1418 (Reihe) und AS 2550 (Betrieb/Prüfung) definieren Design- und Betriebsanforderungen; Duty-Klassen und Lastannahmen sind vergleichbar, unterscheiden sich im Detail.
China: GB/T 3811 (Lastannahmen/Design) und GB/T 6067 (Sicherheit) bilden die Basis; Konvergenzen zu ISO/EN sind zunehmend, dennoch bestehen abweichende Bemessungsannahmen und Nachweisformate.
UK: Nach Brexit weiterhin starke Anlehnung an EN-Normen; PUWER/LOLER regeln Bereitstellung und Hebevorgänge im Betrieb (ähnlich BetrSichV/DGUV in Deutschland).
Implikationen für die Praxis
Gefährdungsbeurteilung als Leitdokument: TRBS 1111-konform, mit Verweis auf Kranspezifika nach DGUV Vorschrift 52 und EN/ISO-Normen.
Prüf- und Kompetenzmanagement: Prüfstrategie gemäß § 14 BetrSichV, TRBS 1201/1203; Orientierung an ISO 9927/ISO 4309; Dokumentation revisionssicher.
Konstruktion/Modernisierung: Harmonisierte Normen anwenden (EN 13001, EN 15011, EN 60204-32, EN ISO 13849/IEC 62061); Herstellerpflichten aus 2006/42/EG beachten.
Betrieb/Monitoring: Zustandsdaten nach ISO 12482 erfassen und in ein ISO-55001-basiertes Asset-Management überführen.
Cybersecurity-by-Design: IEC 62443-Zonen/Conduits definieren; sichere Funk- und Fernwartungslösungen implementieren; Interferenz mit Sicherheitsfunktionen vermeiden.
Internationale Einsätze: Standards-Mapping (EN/ISO ↔ ASME/OSHA/CSA/AS/NZS/GB/T) frühzeitig durchführen, um Konformität und Akzeptanz sicherzustellen.
Rollen und Verantwortlichkeiten im Facility Management
Betreiber/Organisation: Trägt die Betreiberverantwortung, stellt die Einhaltung rechtlicher und normativer Anforderungen sicher (z. B. BetrSichV, DGUV, DIN 31051, DIN EN 13306), priorisiert Ziele (Verfügbarkeit, Sicherheit, Kosten) und genehmigt Budgets.
Instandhaltungsleitung/FM-Leitung: Verantwortet die Strategie (risikobasiert, zustands- vs. intervallgesteuert), Ressourcenplanung, die Governance (SLA/KPI) sowie die Steuerung interner und externer Leistungserbringer.
Objektleitung/Technisches Property Management: Koordiniert standortbezogene Maßnahmen, bündelt Bedarfe, verantwortet die Freigabe von Arbeiten (z. B. Permit-to-Work) und die Kommunikation mit Nutzern.
Disposition/Arbeitsvorbereitung: Plant Aufträge, priorisiert nach Kritikalität, disponiert Personal und Material, sichert Prüf- und Messmittelverfügbarkeit.
Servicetechniker/Elektrofachkräfte/Meister: Führen Inspektion, Wartung und Instandsetzung durch, dokumentieren Befunde, melden Verbesserungspotenziale.
HSE/Arbeitssicherheit: Stellt Gefährdungsbeurteilungen, Unterweisungen und Fremdfirmenkoordination sicher; prüft Arbeitserlaubnisse und Notfallkonzepte.
Qualitätsmanagement: Definiert Standards, auditierte Prozesse, verwaltet Abweichungen und Korrekturmaßnahmen.
Einkauf/Vertragsmanagement: Führt Make-or-Buy-Analysen durch, gestaltet Werk-/Dienstverträge, überwacht SLA, Haftung und Compliance.
IT/CAFM/EAM: Betreibt das CMMS/CAFM-System, gewährleistet Datenqualität, Schnittstellen (z. B. IoT/Condition Monitoring) und Reporting.
Die Make-or-Buy-Entscheidung folgt einer kombinierten fachlichen, wirtschaftlichen und risikobasierten Bewertung:
Kompetenzen und Zulassungen: Tätigkeiten mit speziellen Qualifikationsanforderungen (z. B. befähigte Personen nach TRBS 1203, DGUV V3-Prüfungen, ZÜS-Prüfungen bei überwachungsbedürftigen Anlagen, DIN 14675-Fachfirma für Brandmeldeanlagen, VDI 6022/VDI/DVGW 6023 Hygiene) werden häufig extern vergeben, wenn intern keine dauerhafte Fachkunde vorgehalten werden kann.
Kritikalität und Reaktionszeiten: Für kritische Anlagen (z. B. Energieversorgung, Brandschutz, Aufzüge) sind 24/7-Bereitschaft und Ersatzteilverfügbarkeit entscheidend; Verträge müssen klare SLA, Eskalation und Pönalen abbilden.
Wirtschaftlichkeit und Auslastung: Standardisierte, volumentaugliche Leistungen (z. B. HVAC-Wartung) lassen sich extern skalieren; sporadische Spezialarbeiten sind extern oft kosteneffizienter. Kerntätigkeiten mit hoher Anlagenkenntnis und häufigen Eingriffen eignen sich eher für Eigenleistung.
Steuerbarkeit, Haftung, Datenschutz: Werkvertrag vs. Dienstvertrag, Gewährleistung, Nachweispflichten und Datensouveränität (Anlagendaten, digitale Prüfberichte) beeinflussen die Entscheidung.
Hybridmodelle: Co-Sourcing (gemischte Teams), Rahmenverträge für Spitzenlasten, herstellerautorisierte Servicepartner für Gewährleistungsphasen.
Die Prozessarchitektur orientiert sich an DIN 31051 und DIN EN 13306:
Trigger und Meldung: Zeit-/Zustands-/Ereignis-basiert, automatisiert (Condition Monitoring) oder manuell (Ticket). Kritikalitätseinstufung und Erstbewertung im CMMS.
Planung und Freigabe: Arbeitsauftragserstellung, Terminierung, Ressourcen-/Materialdisposition, Risiko- und Gefährdungsbeurteilung, Arbeitserlaubnis/Permit-to-Work.
Inspektion: Soll-/Ist-Vergleich, Messungen, Zustandsklassifizierung, Fotodokumentation; Entscheidung über Folgemaßnahmen.
Wartung: Schmieren, Justieren, Reinigen, Austausch von Verschleißteilen, Funktionsprüfungen; Kalibrier- und Prüfmittelmanagement.
Instandsetzung: Fehleranalyse (z. B. 5-Why, Ishikawa), Reparatur oder Austausch, Konfigurations- und Änderungsmanagement, Abnahmeprüfung.
Rückmeldung und Dokumentation: Zeiten, Materialien, Befunde, Messwerte; Aktualisierung der Anlagenlebenslaufakte; Lessons Learned und CAPA.
Wirksamkeitskontrolle und Reporting: KPI wie MTTR/MTBF, SLA-Erfüllung, Rückstände, Prüffristenmonitoring; kontinuierliche Verbesserung des Wartungsprogramms.
Befähigte Personen im Sinne der BetrSichV/TRBS 1203 verfügen über fachliche Ausbildung, Erfahrung und zeitnahe Tätigkeit zur Beurteilung des sicheren Zustands von Arbeitsmitteln. Ihre Einbindung erfolgt:
Rollenklärung: Abgrenzung zur Elektrofachkraft, zum Sachkundigen/Sachverständigen und zu zugelassenen Überwachungsstellen (ZÜS).
Jahresplanung: Terminsichere Einsteuerung wiederkehrender Prüfungen (z. B. elektrische Anlagen nach DGUV V3, Druckanlagen, Krane, Regale, PSA), inklusive Vertretungs- und Unabhängigkeitsregelungen.
Qualifikationsnachweise: Erfassung und Aktualisierung von Schulungen, Befähigungs- und Bestellurkunden im DMS/CMMS; Auditfähigkeit sicherstellen.
Prüfprozesse: Prüfpläne, Messmittelkalibrierung, normkonforme Prüfberichte, Mängelmanagement und Fristenkontrolle.
Dokumentationspflichten umfassen mindestens:
Gefährdungsbeurteilungen, Betriebs- und Prüf-anweisungen.
Anlagen- und Wartungsdokumentation, Prüfbücher, Mess- und Kalibrierprotokolle, Abnahme- und Funktionsnachweise.
Nachweise externer Leistungen (Leistungsnachweis, Zertifikate, Konformitätserklärungen).
Aufbewahrung entsprechend gesetzlicher Vorgaben und interner Regelungen; revisionssichere, digitale Ablage im CMMS/DMS mit Rückverfolgbarkeit.
Datenschutz und Informationssicherheit, insbesondere bei cloudbasierten Serviceportalen.
Die technische Architektur eines Condition-Monitoring-Systems (CMS) folgt typischerweise einem mehrschichtigen Aufbau:
Sensorebene: robuste, industrietaugliche Sensorik an kritischen Komponenten; lokale Vorverstärkung und A/D-Wandlung.
Edge-Ebene: Signalaufbereitung, Feature-Extraction (z. B. Hüllkurvenanalyse, Ordnungsanalyse), Datenreduktion, Pufferung; Einsatz von Edge-Computing für vorhersagende Modelle.
Kommunikations- und Integrationsschicht: standardisierte Protokolle (OPC UA, MQTT, Modbus/TCP, PROFINET/EtherCAT), Zeitsynchronisation (NTP/PTP) und Quality-of-Service.
Leitstand/SCADA/Historians: zentrale Datenerfassung in Zeitreihen-Datenbanken, Visualisierung, Alarmierung und Berichtswesen.
Remote-/Cloud-Schicht: gesicherter Zugriff über DMZ, VPN oder Zero-Trust-Architektur; optionale Nutzung von Cloud-Analytics, Flottenvergleich und Modelldiensten.
Die Auswahl der Sensorik richtet sich nach dominanten Schadensmechanismen und FMEA-Erkenntnissen:
Elektromotoren: Schwingungsaufnehmer (IEPE/ICP, breitbandig), Strom-/Spannungsaufnehmer für Motorstromsignaturanalyse (MCSA), Wicklungstemperatur (PT100/PT1000), Lager-Temperatur; optional Partielle-Entladungs-Sensorik bei Mittelspannung.
Lager und Getriebe: Beschleunigungsaufnehmer für Hüllkurven- und Körperschallanalyse, Drehgeber für Ordnungsanalyse, Ölzustandssensoren (Viskosität, Partikelzählung, Feuchte, Ferrographie), Temperatur- und Drehmomentmessung.
Pumpen und Ventilatoren: Druck- und Differenzdrucksensoren, Durchflussmessung, Kavitationserkennung via Hochfrequenz-Schwingung, Lager-/Wicklungstemperaturen.
Hydraulik und Pneumatik: Druckpulsationssensoren, Leckageerkennung, Ölqualität, Ventilstellzeit-Monitoring.
Elektrische Verteilung: Leistungsmessgeräte (THD, Oberschwingungen, Flicker), Thermografie/IR-Sensorik an Klemmen und Sammelschienen.
Strukturelle Komponenten: Dehnungsmessstreifen für Ermüdungsüberwachung, AE-Sensoren für Rissinitiierung, Neigungssensoren.
Signalaufbereitung und Datenpfad
Rohsignale werden an der Edge vorverarbeitet: Bandpass/Hüllkurve für Lagerdefektfrequenzen, Ordnungsanalyse bei variabler Drehzahl, spektrale Kennwerte (RMS, Peak, Crest-Faktor, Kurtosis), Envelope-Spectrum und Sideband-Indikatoren für Zahneingriffsfehler. Ereignisgesteuerte Erfassung (Trigger auf Drehzahl, Last, Schaltzustände) reduziert Datenvolumen. Zeitstempelung mit PTP erlaubt Sensorfusion. Kompressions- und Delta-encoding ermöglichen effiziente Übertragung an SCADA/Historians.
Die Integration erfolgt über:
OPC UA-Informationsmodelle für semantisch reiche Zustands- und Diagnoseknoten (inkl. EngineeringUnits, StatusCode/Quality).
MQTT für effiziente, entkoppelte Telemetrie (Sparkplug-B für State-Management).
Anbindung an Historian/Timeseries-DBs für Langzeittrends und KPI-Berechnung (MTBF, Health-Index).
Hinweis:
HMI/SCADA visualisiert Anlagen- und Komponenten-Health in Topologie- und Detailansichten, inklusive Trendplots, Spektren, Polar-/Bode-Diagrammen und Lastzustandsfiltern. Alarmmanagement entspricht ISA‑18.2/EEMUA 191 (Priorisierung, Shelving, Rate-Limits, Alarmflutkontrolle). Remote Monitoring wird über eine DMZ, rollenbasierte Zugriffssteuerung und TLS-Zertifikate abgesichert; Expertenzugriff erlaubt Remote-Diagnosen, während Betriebs- und Safety-Funktionen strikt getrennt bleiben.
Beispielkomponenten und Alarmfunktionen
Lagerinnenringfehler: Anstieg der Hüllkurvenamplitude bei BPFI, Begleit-Sidebands; Alarmstufen Vorwarnung/Alarm/Abschaltung basierend auf Trend, nicht nur Absolutwert.
Getriebe: Zähneingriffsfrequenz mit Sidebands (Modulation); Rate-of-Change-Alarm, wenn Spektralpegel > x dB/Tag steigt.
Pumpen: Kavitationserkennung via Hochfrequenzsignatur; kombinierte Regel für Vibration + Druckpulsation + NPSH-Bedingungen.
Elektromotor: Unwucht/Misalignment via 1×/2×-Ordnungen; MCSA-Indikatoren für Stabbruch; Temperaturlimit mit Driftkompensation.
Ölzustand: Partikelanstieg Klasse ISO 4406; Feuchte > Sättigungsgrenze; metallische Abriebspitzen → Wartungsauftrag.
Hinweis:
Alarmfunktionen umfassen adaptive Schwellen (zustands- und drehzahlabhängig), Konfidenzmetriken, Plausibilitätsprüfungen (Sensorqualitätsflag), und kombinatorische Regeln (AND/OR/Mehrheitslogik). Ereignisse erzeugen automatisch Tickets im CMMS über REST/OPC UA, inklusive Fehlerhypothese und empfohlenen Maßnahmen.
Automatisierungssysteme unterstützen die Überführung in sichere Zustände:
Sichere Stoppfunktionen (SS1/SS2), Safe Torque Off (STO), kontrolliertes Auslaufen, druck- und energiefreie Zustände.
Verriegelungen und Wartungsmodus mit reduzierter Geschwindigkeit/Last, LOTO-Workflows und digitale Freigaben.
Zustandsgeführte Wartungsfenster: das CMS prognostiziert Restlebensdauer (RUL) und synchronisiert mit Produktionsplanung.
Diagnose-sequenzen: definierte Drehzahl-/Lastfahrten zur Signalanreicherung, automatisch und sicher initiiert.
Safety- und Security-Aspekte: SIL/PL-konforme Trennung von Schutzfunktionen, IEC 62443-konforme Updates und Patch-Management, manipulationssichere Firmware.
Zustandsüberwachung (CBM) – Methoden und Messpunkte
Die zustandsorientierte Instandhaltung verknüpft messbare Indikatoren des technischen Zustands mit Diagnose- und Bewertungsregeln. Für rotierende Antriebe, Getriebe und Lager stehen Schwingungs- und Temperaturmessungen, Ausrichtungsprüfungen, Schmierstoffanalysen sowie Thermografie im Vordergrund. Für drahtseilgetragene Systeme kommen spezifische Prüfverfahren wie magnetinduktive Seilprüfung und Biegewechselzählung hinzu. Ergänzend werden Lastkollektive nach Norm erfasst und bewertet, Struktur- und Bremsen überwacht sowie Steuerungs- und Elektronikdaten in die Zustandsbewertung integriert.
Schwingungsdiagnose:
Sensorik: Piezoelektrische IEPE-Beschleunigungsaufnehmer (1 Hz–10 kHz), optional Hochfrequenzsensoren für Hüllkurvenanalyse; für einfache Anwendungen MEMS-Sensoren. Befestigung verschraubt oder geklebt, mit definierter Anpresskraft.
Messgrößen: Schwinggeschwindigkeit RMS (ISO 10816/20816) für allgemeine Maschinenzustände; Beschleunigung für Lagerdiagnose; Hüllkurven- (Envelope) und Stoßimpulskennwerte für Früherkennung von Wälzlagerschäden; Kenngrößen wie Crest-Faktor und Kurtosis zur Empfindlichkeitssteigerung.
Diagnostische Merkmale:
Lager: Spektren mit charakteristischen Schadfrequenzen (Außenring, Innenring, Wälzkörper, Käfig), Seitenbandbildung, Anstieg in der Hüllkurve.
Getriebe: Zahnmeschfrequenz und Ordnungen, Seitenbandindizes (Modulation durch Exzentrizität), Amplitudenverhältnisse; Kennwerte wie FM4.
Unwucht, Unrundheit, Lockerheiten: Ordnungsanalyse (1×, 2× Drehzahl), Phasenbezug; Fundamentresonanzen.
Abtastraten: Mindestens das 10-fache der höchsten interessierenden Frequenz (Zahnmeschfrequenz = Zähnezahl × Drehzahl), bei Hüllkurve deutlich höher und mit geeigneter Bandpassvorfilterung.
Temperaturüberwachung:
Sensorik: Pt100/RTD im Lagerdeckel oder Thermoelemente am Gehäuse; IR-Sensoren für berührungslose Messung.
Messpunkte: Lagerdeckel, Getriebegehäuse in Nähe der Zahnradpaarung, Dichtungs- und Kupplungsbereiche; Motorgehäuse nahe Wicklungskopf.
Bewertung: Trend statt absolute Grenzwerte, ΔT gegenüber Umgebung, Alarm- und Abschaltwerte hersteller- oder normbasiert; plötzliche Temperaturanstiege sind kritisch (Schmierfilmverlust, Reibkontakt).
Ausrichtungsüberwachung:
Methoden: Laserwellen- und Riemenausrichtung, Messuhrverfahren, Prüfung auf „Soft Foot“; Berücksichtigung thermischer Längenänderung (thermisches Offsetting).
Kenngrößen: Parallel- und Winkelversatz (in mm/100 mm); zulässige Toleranzen abhängig von Drehzahl, Lagerung und Kupplung.
Einfluss: Fehl- oder Schiefausrichtung führt zu erhöhter Lager- und Kupplungsbelastung, harmonischen Schwingungsanteilen und Temperaturerhöhung.
Schmierstoffanalytik:
Probenahme: Repräsentativ und trendfähig, vorzugsweise im Rücklauf hinter der Komponente; Spülung der Probeentnahmestelle vor Abzug.
Standardparameter:
Viskosität bei 40/100 °C (Verschleiß, Ölalterung).
Partikelreinheit nach ISO 4406 (Kontaminationsgrad).
Wassergehalt (Karl-Fischer), Gefahr von Mikro-Pitting und Additivausfällung.
Säure- und Basenzahl (TAN/TBN) für Oxidation/Neutralisationsreserve.
ICP-OES für Verschleißmetalle (Fe, Cu, Pb, Sn, Cr) zur Quellendiagnose (Lager, Zahnräder, Buchsen).
PQ-Index/ferromagnetische Partikel (grobe Späne).
FTIR für Oxidation, Nitration, Additivabbau; Patch-Test/Ferrographie zur Morphologie von Partikeln.
Bewertung:
Trendanalyse, Alarmmatrizen nach Anlagenkritikalität; Korrelation mit Betriebszuständen (Last, Temperatur). Grenzwerte in Herstellerdokumenten und branchenspezifischen Leitfäden.
Thermografie:
Durchführung: Kalibrierte Infrarotkameras, Berücksichtigung von Emissionsgrad und Reflexionen; konstante Messdistanz und Perspektive.
Messpunkte: Lagergehäuse, Getriebedeckel, Dichtungen, Kupplungen, Bremsen, elektrische Anschlusskästen, Umrichterkühlkörper, Klemmen.
Aussage: Lokalisierung thermischer Anomalien (Hotspots, ungleichmäßige Erwärmung); Beurteilung von Wärmewegen (z. B. Verzahnungsschäden, Bremsenschleifen).
Grenzen: Lastabhängigkeit und Umgebungsbedingungen; Kombination mit Temperatur- und Schwingungsdaten erhöht Aussagekraft.
Magnetinduktive Prüfung (MI):
Prinzip: Magnetflussleckage und Verlust metallischer Querschnittsfläche (LMA) zur Erkennung von Drahtbrüchen, Korrosion, Kerben. Sensoren (Hall/Induktion) erfassen Fehlstellen unter Abdeckung.
Anwendung: In-situ-Prüfung bei bekannten Seilgeschwindigkeiten; Kalibrierung mit Referenzseilstücken. Rückverfolgbare Aufzeichnung über die Seillänge.
Bewertung: Klassifikation lokaler Fehler (LF) und LMA-Trends; Mindestabstände zu Spleißen/Endverbindungen beachten.
Normbezug: ISO 4309 für Krane (Inspektion, Ablegereife), EN 12927 für Seilbahnen; Prüffrequenzen und Dokumentation.
Visuelle Inspektion:
Umfang: Zählung sichtbarer Drahtbrüche pro Schlaglänge, Erfassung von Korrosion, Querschnittsreduktion, Kinken, Litzenabhebung, Deformationen.
Messpunkte: Umlenkscheibenbereiche, Endverbindungen, Trommelaufwicklungen, Durchmesser- und Lagenwechselzonen; Führungsrollen und Einschnürungen.
Kriterien: Ablegereife nach Anzahl Drahtbrüche, Korrosionsgrad, Durchmesserabnahme, örtliche Schäden.
Biegewechselermüdung:
Erfassung: Zählung von Biegewechseln über Rollen/Trommel anhand Betriebsdaten (Weg, Zyklen); D/d-Verhältnis, Rillengeometrie und Flottenwinkel als Einflussgrößen.
Bewertung: Lebensdauermodelle auf Basis Biegewechselzahlen, Lasten und Kontaktpressungen; Sicherheitsfaktoren und Ablegekriterien nach ISO 4309/FEM-Empfehlungen.
Integration: Koppelung von MI-Trends, visuellen Befunden und Biegewechselzählung zur Restlebensdauerabschätzung.
Erfassung:
Sensorik: Drehmoment-/Leistungssensoren, Motorstrom- und Umrichterdaten (MCSA) zur Lastschätzung, Dehnungsmessstreifen an Strukturteilen, Weg-/Zykluszähler.
Methoden: Ereignisbasierte Zyklenzählung, Rainflow-Klassierung für Spannungs-/Dehnungskollektive, Zeit-in-Lastklassen-Histogramme.
Bewertung:
Normen/Leitfäden: ISO 17359 (allgemeines CBM), ISO 13373/10816/20816 (Schwingungen), ISO 12482 (Krane – Zustandsüberwachung und Prozessdaten), EN 13001 (Kranbemessung und Lastkollektive), ISO 281 (Wälzlagerlebensdauer), ISO 4406 (Ölreinheit).
Damage-Assessment: Miner’sche Linearakkumulation für Ermüdung, Lagerlebensdaueranpassung mit realen Lastkollektiven; Klassenzuordnung von Aggregaten (Duty Class) und dynamische Anpassung der Prüfintervalle.
Ergebnis: Zustandsindizes und Restlebensdauerprognosen (RUL) als Grundlage für Instandhaltungsentscheidungen.
Strukturüberwachung (SHM):
Messgrößen: Dehnung/Spannung (DMS), Durchbiegung (LVDT/Optik), Eigenfrequenzen/Moden (operational modal analysis), akustische Emission für Rissinitiierung und -wachstum.
Messpunkte: Kerb- und Schweißnahtnähe, Stützknoten, Lagerböcke, Schnittstellen von Fahrwerken und Auslegern; Übergänge mit hoher Steifigkeitsgradient.
Verfahren: Periodische NDT (UT, PAUT, MT/PT) und kontinuierliche Online-Überwachung kritischer Hot-Spots; Trend der Modaleigenschaften als Indikator für Steifigkeitsverlust.
Bewertung: Grenzwerte aus Bemessung und Ermüdungsnachweisen (EN 13001, FKM-Richtlinie); Rainflow-basierte Nutzungsauswertung.
Bremsenüberwachung:
Messgrößen: Bremsmoment über Verzögerungsanalyse, Bremsbelagstärke via integrierte Verschleißsensoren, Luft-/Lichtspalt bei Federdruckbremsen, Ansprech- und Lösezeiten (Spulenstrom/Zeit), Temperatur an Bremsrotor/Belag.
Messpunkte: Bremsschild, Aktorik, Reibring, Hydraulik-/Federpaket, Ansteuerungsklemmen.
Bewertung: Konstanz des Bremsmoments, Temperaturtrends (Fading), Unwucht/Seitenschlag-induzierte Schwingungen; normativ gestützte Funktionsprüfungen nach anwendungsspezifischen Standards.
Frequenzumrichter/Antriebsregler:
Signale: Drehzahl, Strom, Spannung, DC-Zwischenkreisspannung, Drehmoment-/Leistungs-Schätzer, I²t-Thermomodelle, Fehlerspeicher.
Diagnosen: MCSA für Rotorstabbrüche/Exzentrizität, Statorisolationstrends, Netz- und Oberschwingungseinflüsse; Anomalieerkennung durch Abweichungen in Wirkungsgradkennlinien.
Umsetzung, Datenfusion und Schwellen
Datenfusion: Multisensorische Bewertung verknüpft Schwingungen, Temperaturen, Ölzustand, MI-Seilbefunde, Lastkollektive, Struktur- und Bremsdaten sowie Steuerungslogs.
Algorithmen: Zustandsindizes, Regelwerke nach ISO 13379 (Diagnose) und ISO 13381 (Prognose); statistische Prozesskontrolle, Anomalieerkennung.
Schwellenmanagement: Kombination aus normativen Grenzwerten (z. B. ISO 20816 Zonen) und adaptiven, zustands- sowie lastabhängigen Schwellwerten.
Trendbasierte Alarme mit Verifikation über Zweitmessungen (z. B. Schwingung + Thermografie).
Messqualität: Rückführbarkeit, Kalibrierintervalle, definierte Messrouten und Prüfanweisungen; Wiederholgenauigkeit durch standardisierte Montagepunkte und Messzeiten (Last/Temperatur).
Empfohlene Messpunkteübersicht (ohne Anspruch auf Vollständigkeit)
Antrieb/Motor: Lager DE/NDE radial/axial (Schwingung), Motorgehäuse (Temperatur), Klemmenkasten/Umrichter (Thermografie), Kupplung (Ausrichtung).
Getriebe: Nähe der Zahnradpaarung und Lager (Schwingung/Temperatur), Ölprobe am Rücklauf/Probenahmeventil, Entlüfter/Füllstand.
Lager: Außenringpositionen an beiden Seiten (Schwingung/Hüllkurve), Schmierstellen (Temperatur/Ultraschall für Schmierregime).
Drahtseil: MI-Prüfkopf über definierte Prüfstrecken, visuelle Hotspots an Rollen, Trommel, Endverbindungen; Zyklenzählung an Steuerung.
Struktur: DMS an Schweißnähten/Trägerknoten, Wegsensoren für Durchbiegung, Referenzpunkte für modale Tests.
Bremse: Reibring/Belag (Temperatur), Aktorik (Schaltzeit), Sensoren für Belagverschleiß und Luftspalt.
Hinweis:
Mit dieser methodischen und messpunktorientierten Auslegung wird eine robuste, normkonforme Zustandsüberwachung erreicht, die frühe Schadensindikatoren erkennt, die Restlebensdauer prognostiziert und Wartungsmaßnahmen risikobasiert priorisiert. Die Verzahnung von mechanischen, elektrischen und digitalen Daten liefert dabei den größten Mehrwert.
RCM-Analyse: Funktionsbäume und FMEA/FMECA
Ziel ist die systematische Ableitung zustandsorientierter und periodischer Instandhaltungsmaßnahmen aus einer funktionsorientierten Systembetrachtung in Kombination mit FMEA/FMECA. Ausgangspunkt sind Funktionsbäume für die Hauptbaugruppen, darauf aufbauend standardisierte FMEA/FMECA-Templates, eine konsistente Strukturierung von Ausfallarten, Ursachen, Auswirkungen und Detektierbarkeit sowie die Konkretisierung von Maßnahmen, Intervallen und Run-to-Failure-(RTF)-Kandidaten. Als Referenzsystem dient exemplarisch ein prozessindustrielles Zentrifugalpumpensystem.
Beispielsysteem: Zentrifugalpumpe mit Elektromotor, Kupplung, Pumpeinheit, Dichtungssystem, Lagerung, Hilfsmedien, Sensorik/Schutz und Steuerung/Energieversorgung.
Systemfunktion (Ebene 0)
Fluid mit spezifiziertem Durchfluss und Förderhöhe sicher, effizient und verfügbar bereitstellen (Qualität, Quantität, Zeit).
Hauptfunktionen (Ebene 1)
Antriebsleistung bereitstellen (Elektromotor)
Drehmoment verlustarm übertragen (Kupplung)
Hydraulische Energie erzeugen (Pumpenhydraulik)
Dichtigkeit gegenüber Umgebung sicherstellen (mechanische Dichtung/Stopfbuchse)
Rotor lagern und führen (Lagerung)
Hilfsmedien bereitstellen (Schmier-/Kühl-/Spülkreise)
Zustände erfassen und schützen (Sensorik, Schutzgeräte)
Energie und Steuerung bereitstellen (E-Peripherie, Frequenzumrichter, Einspeisung)
Teilfunktionen (Ebene 2, Auswahl)
Elektromotor: Drehmoment erzeugen; Verlustwärme abführen; Klemme/Anschluss intakt halten.
Kupplung: Fluchtungstoleranzen kompensieren; Drehschwingungen dämpfen.
Pumpenhydraulik: Laufrad Geschwindigkeit/Impuls übertragen; Gehäuse Verluste minimieren; Rückfluss verhindern.
Dichtung: Medienleckage begrenzen; Sperr-/Spülmedium führen; thermischen Verschleiß begrenzen.
Lagerung: Radial-/Axialkräfte aufnehmen; Schmierfilm bereitstellen; Fremdpartikel fernhalten.
Hilfsmedien: Schmierstoffversorgung; Spül-/Sperrfluidversorgung; Kühlung.
Sensorik/Schutz: Druck/Temperatur/Schwingung erfassen; Überlast abschalten.
Steuerung/Energie: FU-Regelung; Netzqualität; EMV.
Standardisierte Felder für die Analyse werden als wiederverwendbares Template definiert. Für „leichte“ Dokumentation werden die Felder textuell geführt; bei Bedarf können sie in Tabellen überführt werden.
Metadaten
System/Komponente
Funktionsreferenz (aus Funktionsbaum)
Betriebs-/Umweltbedingungen (Lastkollektiv, Medium, Temperatur)
Annahmen/Begrenzungen
FMEA-Felder
Funktion/Anforderung
Funktionsausfall (Failure Mode, FM)
Ursachen (Failure Causes)
Auswirkungen
Lokal (auf Komponente)
Aufbaugruppen-/Systemebene
Sicherheit/Umwelt/Compliance
Verfügbarkeit/Qualität/Kosten
Detektionsmechanismen Evident vs. verborgen (hidden)
Zustandsindikatoren (Messgrößen, Grenzwerte)
Prüf-/Überwachungsmethoden (online/offline)
Auftretenswahrscheinlichkeit O (Skala 1–10 oder λ/MTBF)
Bedeutung/Schwere S (Skala 1–10 mit Safety/Environmental-Top-Codes)
Entdeckbarkeit D (Skala 1–10; niedriger = gut detektierbar)
RPZ/RPN = O × S × D (zur Priorisierung, nicht als einzige Entscheidungsgröße)
Präventive/korrektive Maßnahmen
Art der Maßnahme (zustands-, zeit-/nutzungsbasiert, redesign)
Prüfintervall/Inspektionsintervall
Abbruchkriterium/Alarmgrenzen
Ersatzteil-/Werkzeugbedarf
Verantwortlichkeit
FMECA-Erweiterungen
Ausfallrate λi (pro h), Missionszeit ti, bedingte Kritikalität βi (Wahrscheinlichkeit eines kritischen Effekts)
Kritikalitätszahl Ci = βi × λi × ti (oder norm-/unternehmensspezifische Varianten)
Konsequenzklasse (Sicherheit, Umwelt, Produktionsverlust, Qualitätsabweichung)
Redundanzen/Single-Point-of-Failure
Hidden-Failure-Kennzeichen (erfordert Funktionsprüfung)
Run-to-Failure-Kandidaten [RTF] kennzeichnen
Strukturierung von Failure Modes, Ursachen, Auswirkungen und Detektierbarkeit
Pro Hauptbaugruppe werden die dominanten Failure Modes (funktional, nicht rein komponentenbezogen) identifiziert; Ursachen werden physikalisch fundiert beschrieben; Auswirkungen sind mehrstufig zu bewerten; Detektierbarkeit wird messmethodisch hinterlegt.
Elektromotor
FM: Wicklungsschluss/Isolationsabbau; Lagerausfall; Übertemperatur; Klemmenlockerung.
Ursachen: Überlast, Spannungsunsymmetrie, Verschmutzung, Schmierstoffdegradation, Vibrationen.
Auswirkungen: Produktionsstillstand; potenziell Brandgefahr; Effizienzverlust.
Detektion: Motorstromanalyse (MCSA), Schwingungs-/Hüllkurvenanalyse, Thermografie, Isolationsmessung (PI/DA), Onboard-Temperatur.
Kupplung
FM: Elastomerermüdung; Ausrichtungsoffset; Bolzenlockerung.
Ursachen: Montagefehler, thermische Ausdehnung, Stoßlasten.
Auswirkungen: Schwingungsanstieg; Lagerüberlast; Ausfallfortpflanzung.
Detektion: Ausrichtmessung, Schwingungsanalyse (1×T, 2×T), Sichtprüfung.
Pumpenhydraulik
FM: Laufraderosion/Kavitation; Verstopfung; Spaltverschleiß.
Ursachen: Unterdruck, Feststoffanteile, Betriebspunkt fern BEP.
Auswirkungen: Fördermengen-/Druckverlust; Geräusch; Vibration.
Detektion: Prozesssignale (Q, H, η), Körperschall, Differenzdruck.
Dichtungssystem
FM: Dichtflächenschaden; Trockenlauf; unzureichender Sperrdruck.
Ursachen: Mediumsfehler, Ausfall Hilfsmedien, Montage.
Auswirkungen: Leckage (Umwelt!); Lagerkontamination; Stillstand.
Detektion: Leckagemessung, Sperrdruck-/Temperaturüberwachung, Partikel im Sperrmedium.
Lagerung
FM: Pitting/Spalling; Schmierstoffalterung; Einlauf.
Ursachen: Fehljustage, Partikel, Feuchte, elektrische Erosion.
Auswirkungen: Geräusch/Vibration; Ausweitung zu Motorschaden.
Detektion: Schwingung (BPFI/BPFO), Ultraschall, Öl-/Fettanalyse.
Hilfsmedien
FM: Pumpenausfall Sperrflüssigkeit; Kühler verblockt.
Ursachen: Filterblockade, Luft, Ventilfehler.
Auswirkungen: Dichtungs-/Lagerausfall; Temperaturanstieg.
Detektion: Durchfluss-/Drucksensoren, Temperatur, Differenzdruck.
Elektromotor
Zustandsüberwachung: monatliche Motorstromsignaturanalyse; vierteljährliche Schwingungsroute; halbjährliche Thermografie.
Prävention: jährliche Klemmen-Nachzug; 2–3-jährliche Isolationsdiagnostik (PI/DA) im Stillstand.
Maßnahmen: Grenzwerte für Unwucht-/Lagervibrationen nach ISO 10816/20816; Alarme bei Isolationswiderstand < definierter Schwelle.
Kupplung
Ausrichtungskontrolle: nach Eingriff und halbjährlich; Sichtprüfung bei jedem Rundgang.
[RTF] Elastomer-Spinnschutz falls ohne Folgeschaden ersetzbar und online detektierbar; ansonsten zustandsbasiert per Vibration.
Pumpenhydraulik
Prozessmonitoring: kontinuierlich Q/H/η via Differenzdruck und Leistungsaufnahme; Kavitationserkennung via Hochfrequenz.
Reinigung/Spülung: zustandsbasiert bei Effizienzabfall > x% oder Differenzdruckanstieg; jährliche Inspektion von Laufrad/Spaltmaßen bei abrasiven Medien.
Dichtungssystem
Sperrdruck-/Durchflussüberwachung: kontinuierlich mit Alarm (S ≥ 9 → keine RTF).
Funktionsprüfung Druckhalter/Ventile: monatlich; Dichtungszustand Sicht-/Leckagemessung wöchentlich.
Designmaßnahmen: Trockenlauf-Schutz interlock; Doppelgleitring bei Umweltkritikalität.
Lagerung
Schwingungs-/Ultraschall: monatlich (bei hoher Kritikalität wöchentlich online).
Schmierung: zeit-/nutzungsbasiert nach Fettlebensdauer L10 und Temperatur; Ölzustandsanalyse vierteljährlich (ISO 4406).
Grenzwerte: Hüllkurvenanstieg > 6 dB und BPFI/BPFO-Sidebands → Instandsetzung planen innerhalb P–F/2.
Hilfsmedien
Filter-/Sperrsystem: Differenzdrucküberwachung kontinuierlich; Filterwechsel zustandsbasiert; jährliche Kühlereiniger-Inspektion.
[RTF] Druckmanometer mit Redundanz bei niedriger Kritikalität.
Sensorik/Schutz
Funktionsprüfung (hidden failures): monatlich bis vierteljährlich; Kalibrierung nach Herstellvorgabe (z. B. 12 Monate).
Redundanz-/Plausibilitätscheck: kontinuierlich (Softsensoren).
RTF wird nur bei geringer Kritikalität, guter Evidenz des Ausfalls, geringen Folgekosten und schneller, kostengünstiger Reparatur gewählt. Kandidaten im Beispielsystem:
Sichtbare, nicht sicherheitsrelevante Anzeigen/Leuchten der lokalen Bedienbox [RTF].
Kupplungsabdeckung mit kosmetischem Schaden ohne Schutzverlust [RTF].
Einzelnes analoges Manometer mit parallelem elektronischem Transmitter [RTF].
Sekundäre Kühlgehäuselüfter kleiner Leistung mit Redundanz [RTF].
Nicht RTF: Gleitringdichtung bei umweltrelevanten Medien, Schutz-/Abschaltkette, Lager hoher Kritikalität, FU-Leistungsteil.
Zielsetzung und Einordnung
Autonome Instandhaltung (AI) und Operator Care sind Kernbausteine des Total Productive Maintenance (TPM). Ziel ist es, die Anlagenverfügbarkeit durch befähigte Bedienerinnen und Bediener, stabile Standards (5S) und sichtbare Abweichungen zu erhöhen. Der Fokus liegt auf frühzeitiger Fehlererkennung, der Beseitigung von Quellen für Verschleiß und Verschmutzung sowie auf klaren Rollen, Eskalationswegen und kurzen Reaktionszeiten.
Kompetenzaufbau
TWI-Methodik (Job Instruction/Job Methods) für standardisierte Unterweisung.
Skill-Matrix pro Linie/Anlage mit Stufen: Beobachten → Mitwirken → Selbstständig → Multiplizieren (Trainer).
OPL-gestützte Mikro-Schulungen (1–3 Minuten, 1 Punkt pro Karte) in täglichen Huddles.
5S als Voraussetzung
Sortieren: Entfernen nicht benötigter Hilfsmittel/Teile.
Systematisieren: Festplatzprinzip, Shadowboards, Farben-/Form-Coding.
Säubern: Erstreinigung als Inspektion (Entdecken statt Verdecken).
Standardisieren: Reinigungs-/Inspektionsstandards, visuelle Grenzmuster.
Selbstdisziplin: Auditzyklen, visuelle Statusanzeige (grün/gelb/rot).
Stufen der Autonomen Instandhaltung (kurz)
Erstreinigung und Abweichungen sichtbar machen
Quellenbehebung (Dichtigkeit, Abdeckungen, Kabelentlastung)
Temporäre Standards: Reinigungs-/Inspektionschecklisten, Schmierpläne
Nachhaltige Standards: Poka-Yoke, Grenzmuster, Wartungsfenster
Inspektion verfeinern: Condition Checks, einfache Messmittel
Prozessfähige Bedienung: Parameterdisziplin, Start-up/Shut-down-Standards
Autonomie stabilisieren: Audits, KVP-Schleifen und Lessons Learned
Sicherheit (vor Start)
[ ] Not-Halt und Schutzvorrichtungen funktional geprüft
[ ] PSA getragen; Stolper-/Quetschstellen frei
Reinigung als Inspektion (nach Start)
[ ] Sichtprüfung auf Leckagen (Öl, Wasser, Luft); Abwischtest an definierten Punkten
[ ] Sensorflächen, Lichtschranken, Kameralinsen gereinigt
[ ] Materialführungen, Riemen-/Kettenabdeckungen staubfrei
Inspektion
[ ] Ungewöhnliche Geräusche/Vibrationen (Hör-/Fühlprobe) an Antrieb X/Y
[ ] Verschleißgrenzen an Greifern/Werkzeugen per Grenzlehre geprüft
[ ] Befestigungselemente an definierten Stellen auf Festigkeit geprüft (Handanzug)
Schmierung
[ ] Schmierpunkte A/B/C nach Intervallplan (visuelle Fettpunkte, Farbcodes)
[ ] Füllstände Hydraulik/Pneumatik/Schmierstoff im Sollbereich
Parameterdisziplin
[ ] Prozessparameter mit Standardblatt abgeglichen (Drehzahl, Temperatur, Druck)
[ ] Start-up-Check (Erstteil gut, SPC-Fenster plausibel)
OPL-Boards (One-Point-Lessons)
Inhalte: 1 Thema, 1 Bild, 1 Kernbotschaft (z. B. „Kette X: korrektes Spiel prüfen in 30 Sek.“).
Einsatz: Tägliche 3-Minuten-Mikro-Lektion im Schicht-Huddle; Rotation 2–3 OPL/Woche.
Quellen: Abweichungstags, Auditbefunde, neue Standards, häufige Fragen.
Nachweis: Kurztest/Beobachtung, Skill-Matrix-Update.
Kleine Wartungsaufgaben (Operator Care)
Do: Reinigen, Sicht-/Hör-/Fühlinspektionen, einfache Schmierung, Nachziehen definierter Schrauben, Spannungs-/Spielkontrollen mit Grenzlehren, Filtereinsatz wechseln, Schläuche/Klemmen prüfen und sichern.
Don’t: Elektrische Arbeiten, sicherheitsrelevante Eingriffe, Lager-/Getriebetausch, komplexe Justagen, Arbeiten außerhalb isolierter Gefahrenbereiche.
Abgrenzung: „Operator Care Katalog“ je Anlage mit Freigabe durch Instandhaltung; benötigte Tools/Lehren festgelegt; Zeiten im Tagesfenster geplant.
Abweichungskennzeichnung
Rot/Grün-Tagging an Fundstelle; Foto im digitalen Andon/Board.
Kategorisierung: S (Safety), Q (Quality), D (Delivery), C (Cost), M (Morale).
Reaktionsstufen und Zeiten (Richtwerte)
Stufe 0 (0–5 Min.): Bediener behebt per Standard (Checkliste/OPL).
Stufe 1 (≤15 Min.): Teamleiter hinzu; Linie läuft weiter oder geplanter Kurzstopp.
Stufe 2 (≤30 Min.): Instandhaltung on-call; Andon gelb; Erstmaßnahme/Bypass erlaubt per Standard.
Stufe 3 (>30 Min. oder S/Q-Risiko): Linienstopp, Andon rot; Eilauftrag, 8D/Kaizen-Start.
Verfügbarkeit
Reduktion von Mikrostopps und unkategorisierten Ausfällen durch frühzeitige Erkennung (typisch -20–40% ungeplante Stillstände nach 6–12 Monaten).
Schnellere Erstreaktion (kürzere MTTR) durch klare Eskalation und Operator-Fix.
Leistung/Qualität
Stabilere Prozessparameter, weniger Rework/Schrott durch konsequente Inspektion.
Stabilere Prozessparameter, weniger Rework/Schrott durch konsequente Inspektion.
Saubere, geordnete Anlagen verbessern Ergonomie und Rüstzeiten.
Systemwirkung
Höhere OEE durch kombinierte Effekte auf A, P und Q.
Wissensaufbau am Ort der Wertschöpfung; verbesserte Rückmeldeschleifen für Engineering (Early Equipment Management).
Rechtlicher Rahmen und Zielsetzung
Das Prüf- und Wartungsregime orientiert sich in Deutschland und der EU an den Grundpflichten des Arbeitgebers zur sicheren Bereitstellung und Benutzung von Arbeitsmitteln. Zentrale Bezugspunkte sind u. a. die Richtlinie 2009/104/EG (Benutzungsrichtlinie), die in Deutschland über die Betriebssicherheitsverordnung (BetrSichV) und die Technischen Regeln für Betriebssicherheit (TRBS, insbesondere TRBS 1201 „Prüfungen von Arbeitsmitteln und überwachungsbedürftigen Anlagen“ und TRBS 1203 „Befähigte Personen“) konkretisiert wird. Für Hebezeuge und Lastaufnahmeeinrichtungen gelten zusätzlich einschlägige Produkt- und Anwendungsnormen (z. B. DIN EN 13155, DIN EN 818, DIN EN 1492, EN 1677, ISO 4309) sowie berufsgenossenschaftliche Regeln und Informationen (z. B. DGUV-Regel 109-017).
Ziel ist ein risikobasiertes, nachvollziehbares und wirksames System aus operativen Tagesprüfungen, wiederkehrenden Prüfungen durch befähigte Personen/Sachkundige, ergänzenden zerstörungsfreien Prüfungen (NDT), verlässlichen Kalibrierprozessen sowie einer lückenlosen Dokumentation. Prüffristen werden auf Basis der Gefährdungsbeurteilung (BetrSichV §3) festgelegt und regelmäßig auf Angemessenheit überprüft.
Operative Tagesprüfungen durch Bediener
Tagesprüfungen sind vor Aufnahme der Arbeit durchzuführende, visuelle und funktionale Kontrollen. Sie dienen dazu, offenkundige Mängel frühzeitig zu erkennen und den sicheren Betrieb sicherzustellen.
Die Bediener werden hierfür unterwiesen; der Umfang ist arbeitsmittelspezifisch, aber folgt folgenden Grundprinzipien:
Sichtprüfung auf Beschädigungen, Verformungen, Risse, Korrosion, fehlende oder unleserliche Kennzeichnungen und Tragfähigkeitsangaben.
Funktionsprüfung beweglicher Teile: Haken (Sicherungsfalle, Verriegelung), Schäkel (Bolzen/Freigängigkeit), Ketten- und Seilzüge (Leichtgängigkeit, blockierfreie Führung), Anschlagpunkte (Drehbarkeit, Festigkeit).
Prüfung der Sicherheits- und Schutzeinrichtungen: Endschalter, Überlastsicherungen, Not-Halt, Verriegelungen, Lastmomentbegrenzer, Warnanzeigen.
Kontrolle der Umgebung: ausreichende Beleuchtung, freie Fahr- und Schwenkbereiche, tragfähiger Untergrund, keine Kollisionsgefahren.
Prüfen auf Medien- und Energieverluste: Hydraulik-/Pneumatikleckagen, elektrische Beschädigungen, ungewöhnliche Geräusche/Vibrationen.
Dokumentation festgestellter Abweichungen und ggf. sofortige Stillsetzung bei offensichtlicher Gefährdung; Meldung gemäß Meldeweg.
Regelmäßige Prüfungen durch befähigte Personen (Sachkundige)
Wiederkehrende Prüfungen erfolgen in festgelegten Intervallen (häufig jährlich, bei hoher Beanspruchung kürzer) durch eine „befähigte Person“ gemäß TRBS 1203. Gegenstand ist die sicherheitstechnische Beurteilung des Arbeitsmittels in Gänze, inkl. Dokumentenprüfung.
Typische Inhalte:
Identitäts- und Dokumentenprüfung: Konformitätserklärung/CE, Bedienungsanleitung, letzte Prüfberichte, Prüfplaketten, Reparatur- und Änderungsnachweise.
Sicht- und Maßprüfung: Verschleiß an Ketten, Seilen, Rollen, Schäkel- und Bolzenbohrungen; Maßänderungen (z. B. Maulweiten von Haken), Riefen, Kerben, Kerbkorrosion.
Funktionsprüfung unter Last (ggf. mit Prüfgewicht): Bremsen, Hub-/Senkgeschwindigkeit, Haltefunktion, Endschalter, Überlastschutz, Not-Halt.
Elektrische Sicherheit (sofern zutreffend): Schutzleiterwiderstand, Isolationswiderstand, Funktionsprüfung der elektrischen Sicherheitseinrichtungen.
Hydraulik/Pneumatik: Dichtheit, Druckhaltevermögen, Zustand von Schläuchen und Kupplungen, Druckbegrenzungsventile.
Ablegereife-Bewertung gegen Normen/Herstellerkriterien (siehe Abschnitt Sicherheitsschwerpunkte).
Empfehlung zu Instandsetzung, Ersatz oder Anpassung von Prüffristen; Einstufung der Mängel (kritisch/nicht kritisch).
Protokollierung mit eindeutiger Zuordnung (Inventarnummer, Seriennummer), Messwerten, Fotos und Fristsetzung.
Ablegereife:
Kettengehänge (DIN EN 818/EN 1677): Ablegen u. a. bei Rissen, bleibender Längung, signifikanter Öffnungszunahme von Haken, erheblicher Querschnittsminderung durch Verschleiß, starken Kerben/Anrissen, Korrosionsmulden, unzulässiger Verformung oder fehlender Kennzeichnung.
Drahtseile/Seilgehänge (ISO 4309, EN 13414/13411): Ablegen bei überschrittener zulässiger Anzahl von Drahtbrüchen pro Schlaglänge, Kinken, Vogelkäfigbildung, signifikanter Durchmesserabnahme, Korrosionsschäden, Seelenbruch, Drahtbrüchen im Endbereich/Terminationszone.
Textil- und Rundschlingen (EN 1492): Ablegen bei Schnitten, Durchscheuern, Fadenbrüchen, Hitzeschäden, chemischer Beeinträchtigung, exponierten Tragfäden, beschädigten Schutzhüllen, fehlender/defekter Etikettierung.
Lastaufnahmemittel (EN 13155): Ablegen bei strukturellen Rissen, plastischer Verformung, Materialausbrüchen, Defekten an Verriegelungen, Vakuum-/Magnetleckagen, Fehlfunktion von Sicherungen.
Hinweis: Die konkreten Grenzwerte ergeben sich aus der jeweils einschlägigen Norm und den Herstellervorgaben; diese sind verbindlich anzuwenden.
Zerstörungsfreie Prüfung (NDT):
Verfahren: Magnetpulverprüfung (MT) und Farbeindringprüfung (PT) zur Detektion oberflächennaher Risse; Ultraschallprüfung (UT) für Volumenfehler; Wirbelstromprüfung (ET) für Oberflächen- und Randzonendefekte, insbesondere an Bolzen/Bohrungen; Magnetinduktive Seilprüfung (MRT) für Drahtseile; Röntgenprüfung (RT) in Sonderfällen.
Anwendungsbeispiele: Haken und Schäkelschäfte (MT/PT), hochbelastete Schweißnähte an Traversen (MT/UT), Bolzen und Achsen (UT/ET), Drahtseile (MRT/visuell gemäß ISO 4309).
Qualifikation: Prüfpersonal nach ISO 9712 qualifiziert; Prüfmittel mit aktueller Kalibrierung; Prüfpläne mit Prüfumfang und Akzeptanzkriterien.
Kalibrierungen:
Mess- und Sicherungseinrichtungen wie Lastmessbolzen, Kraftmessdosen, Lastmomentbegrenzer, Kraftanzeigen, Drucksensoren, Drehmomentschlüssel, Neigungssensoren und Prüfgewichte werden in festgelegten Intervallen (typisch 12 Monate, risikobasiert anpassbar) kalibriert.
Rückführbarkeit auf nationale Normale (DAkkS-/ISO/IEC 17025-konforme Kalibrierungen); Kalibriersiegel, Zertifikate und Messunsicherheiten dokumentieren.
Plausibilitätsprüfungen im Feld (z. B. Zweipunkt-Kontrolle, Referenzlast) ergänzen Labor-Kalibrierungen.
Dokumentation, Nachverfolgung und Wirksamkeitskontrolle
Digitale Anlagenakte mit Stücklisten, Betriebsanleitungen, Prüf- und Wartungshistorie, NDT-Berichten, Kalibrierzertifikaten und Fristenmanagement.
Eindeutige Identifikation (Inventar-/Seriennummer, QR/RFID) für die lückenlose Zuordnung.
Prüfkennzeichnung am Arbeitsmittel (Plakette/Tag) mit Datum, Prüfer, nächster Fälligkeit.
Abweichungsmanagement mit Maßnahmenverfolgung, Wirksamkeitsprüfung und Feedback in die Gefährdungsbeurteilung.
Kennzahlen (z. B. Mängelrate, Wiederholmängel, ungeplante Stillstände) zur kontinuierlichen Verbesserung.
Beispielhafter Wartungsplan (risikobasiert anpassbar)
Vor jeder Benutzung (Bediener): Visuelle und funktionale Tagesprüfung gemäß Checkliste; Reinigung kritischer Bereiche; einfache Nachschmierung nach Vorgabe.
Wöchentlich: Sichtkontrolle von Anschlag- und Lastaufnahmemitteln im Lager; Aussortieren beschädigter Teile; Kontrolle der Vollständigkeit von Etiketten/Tragfähigkeitsschildern.
Monatlich: Schmierung von bewegten Lagerstellen, Ketten/Seilen nach Herstellerangaben; Prüfung der Befestigungselemente auf festen Sitz; Funktionsprüfung von Endschaltern/Überlastschutz.
Quartalsweise: Vertiefte Sicht- und Maßprüfung stark beanspruchter Komponenten; Stichproben-NDT an kritisch belasteten Teilen; Sichtprüfung elektrischer und hydraulischer Leitungen; Aktualisierung der Fristenübersicht.
Halbjährlich: Prüfung des Zustands von Steuerungen, Antrieben und Bremsen unter Betriebsbedingungen; Plausibilitätscheck der Lastmesssysteme mit Referenzlast.
Jährlich (befähigte Person): Vollständige wiederkehrende Prüfung inkl. Funktions- und ggf. Lastprüfung; Bewertung der Ablegereife; NDT gemäß Prüfplan; Überprüfung der Kalibrierzertifikate; Anpassung der Prüffristen.
Anlassbezogen: Nach außergewöhnlichen Ereignissen (Stoß, Überlast, Umbau, Stillstand): außerordentliche Prüfung durch befähigte Person; ggf. erweitertes NDT.
Beispiel-Checkliste Tagesprüfung (Bediener)
Kennzeichnung und Tragfähigkeitsangaben vorhanden/lesbar
Haken: Sicherungsfalle funktionsfähig, keine Risse/Öffnungszunahme sichtbar
Ketten/Seile/Schlingen: keine offensichtlichen Schnitte, Drahtbrüche, Knicke, Querschnittsminderungen
Schäkel/Bolzen: Sicherungen vorhanden, kein Spiel übermäßig, keine Verformungen
Lastaufnahmemittel: Verriegelungen/Greifer/Vakuum-/Magneteinheiten funktionstüchtig
Sicherheitsfunktionen: Not-Halt, Endschalter, Warnanzeigen ok
Steuerung/Bedienelemente: frei von Defekten, eindeutige Funktionszuordnung
Umgebung: Lastweg frei, Untergrund tragfähig, ausreichende Beleuchtung
Keine Leckagen/ungewöhnliche Geräusche/Vibrationen
Abweichungen dokumentiert; bei Gefährdung: Stillsetzen und Meldung
Beispiel-Checkliste jährliche Prüfung (befähigte Person)
Vollständigkeitsprüfung der Dokumente (CE, Anleitung, Prüfberichte, Kalibrierzertifikate)
Identifikation und Zuordnung (Typenschild, Seriennummer)
Maßkontrollen: Hakenmaulweite, Kettenglieddicke, Bolzen- und Bohrungsdurchmesser, Seildurchmesser
Sichtprüfung: Risse, Korrosion, Kerben, Verformungen, Schweißnahtindikationen
Funktionsprüfung: Bremsen, Endschalter, Überlastschutz, Not-Halt, Anzeigen
Elektrische/Hydraulische Prüfungen nach Herstellervorgaben und Norm
NDT gemäß Prüfplan (z. B. MT/PT an Haken, MRT an Drahtseilen, UT an Bolzen)
Bewertung Ablegereife nach relevanter Norm/Herstellerangaben
Mängelklassifizierung, Maßnahmen, Fristen; Prüfplakette aktualisieren
Bericht mit Messwerten, Fotos, Befund, Freigabe/Restriktionen
Identifikation kritischer Komponenten
Funktionsrelevanz und Single-Point-of-Failure-Charakter.
Sicherheits- und Compliance-Impact (z. B. SIL-relevante Komponenten).
Downtime-Kosten und potenzielle Produktionsverluste.
Reparierbarkeit und MTTR, Austauschbarkeit, vorhandene Redundanzen.
Obsoleszenzrisiko, Substitutionsmöglichkeiten, Lieferantendichte.
Hinweis:
Ergänzend werden reale Felddaten (Fehlerraten, Ursachen, Austauschzyklen) und Expertenwissen aus Instandhaltung, Engineering und Supply Chain trianguliert. Ergebnis ist eine priorisierte Liste der Komponenten, für die Bestands- und Beschaffungsstrategien differenziert auszugestalten sind.
Kritikalitäts- und Risikoanalyse
Ausfallwahrscheinlichkeit: Nutzung historischer MTBF/Weibull-Parameter, Umgebungs- und Belastungsprofile; bei Datenarmut Bayes-Updates mit FMEA/FMECA-Expertenschätzungen.
Konsequenzbewertung: Monetarisierung von Sicherheits-, Umwelt- und Verfügbarkeitsfolgen (z. B. Ausfallkosten pro Stunde).
Lieferkettenrisiko: Modellierung von Lieferzeiten als Zufallsvariable (Mittelwert, Varianz, Lieferantenzuverlässigkeit, Single- vs. Dual-Sourcing, Mindestabnahmemengen, Zölle, Transportmodi).
Hinweis:
Ein integrierter Kritikalitätsindex CI kann pragmatisch definiert werden als CI = w1·Konsequenz + w2·Ausfallwahrscheinlichkeit + w3·Lieferzeitrisiko, mit normierten Dimensionen und governancefestgelegten Gewichten. Komponenten mit hohem CI und langer, variabler Lieferzeit erhalten erhöhte Servicegradziele und Sicherheitsbestände. Für intermittierende Ausfälle sind Szenariosimulationen sinnvoll (Monte-Carlo über Demand-during-Lead-Time), um risikoadäquate Bestände abzuleiten.
ABC/XYZ-Klassifizierung und Commonality
ABC: nach Wert- oder Impact-Volumen. A-Teile verursachen den Großteil der Wertbindung bzw. Verfügbarkeitswirkung; C-Teile sind niedrigwertig. Für Ersatzteile ist eine Impact-ABC (Verfügbarkeits-/Sicherheitsimpact) oft aussagekräftiger als reine Wert-ABC.
XYZ: nach Nachfragevariabilität. X = stabil prognostizierbar; Y = trend-/saisonal; Z = sporadisch/intermittierend. Für Z-Teile Croston-/SBA-Verfahren statt klassischer Glättung.
Hinweis:
Die Kombination (z. B. AX, AZ usw.) steuert Servicegrade, Dispositionsverfahren und Reviewfrequenzen. Commonality-Management identifiziert Gleichteile und modulare Baugruppen über Plattformen hinweg, um Bestände zu poolen, Skaleneffekte zu heben und Risiken zu diversifiziere.
Maßnahmen:
Harmonisierung von Spezifikationen und Freigabe von Mehrquellen-Gleichteilen.
Zentrale Poollager für rotable Teile und transshipment-Regeln.
Kit-Bildung für häufige Instandhaltungsereignisse mit gemeinsamen Teilen.
Bestandsdimensionierung und Beschaffungsstrategien
Verbrauchsteile: ROP = μDL + zα·σDL, mit μDL/σDL als Nachfrage während der Lieferzeit; zα gemäß Ziel-Servicegrad. Für Poisson-Demand (niedrige Raten) fractile-basiert dimensionieren.
Reparierbare Teile (rotables): METRIC/VARI-METRIC-Ansätze nutzen (Balance aus Ausfallrate, Turnaround-Time, Reparaturkapazität). Multi-Echelon-Optimierung (zentral vs. dezentrale Puffer) zur Minimierung echelonspezifischer Backorders.
Obsoleszenz und Haltbarkeit berücksichtigen (Last-Time-Buy, Shelf-Life).
Beschaffungsstrategien differenzieren:
A/Z mit hohem CI: Rahmenverträge, Dual Sourcing, Sicherheitszeiten, VMI/Consignment, qualifizierte Reparer und TAT-Reduktion, optional Notfallverträge für Expedited Logistics.
A/X und B/X: Kanban bzw. (s, S)-Politiken, Blanket Orders, Preisstaffeln mit Flexklauseln.
C-Teile: Katalog-/E-Procurement, Vendor Bundling, JIT mit minimalem Bestand.
Long-lead-Komponenten: frühzeitige Bedarfssicherung, Engineering Change Monitoring gegen Obsoleszenz, strategische Bevorratung.
Condition-Based Sparing (CBS)
Zustandsindikatoren (Vibration, Temperatur, Ölpartikel, EHM) liefern Restlebensdauer-Schätzungen (RUL) und aktualisieren Ausfallwahrscheinlichkeiten bayesianisch.
Dynamische Reorder-Points: Anpassung von μDL/σDL in Echtzeit basierend auf verdichteten RUL-Verteilungen der installierten Basis.
Ereignisbasierte Bevorratung: Vorpositionierung von Kits/Rotables entsprechend prognostizierten Ausfallfenstern und Wartungs-Slots.
Entscheidungskriterien: Wenn RUL – erwartete Lieferzeit < Sicherheitsreserve, Trigger zur Beschaffung/Allokation; andernfalls Aufschub zur Kapitalbindungssenkung.
Definition der Kritikalitätsklassen A/B/C
Die Kritikalität von Anlagen, Komponenten und IT/OT-Services wird entlang der Dimensionen Sicherheit/Compliance, Produkt- und Prozessqualität, Auswirkungen auf Wertstrom/OEE, Wiederanlaufaufwand, Redundanz/Single-Point-of-Failure sowie Ersatzteil- und Supportverfügbarkeit bewertet.
Daraus werden drei Klassen abgeleitet:
Klasse A (hochkritisch): Direkter Einfluss auf Arbeitssicherheit, Umwelt, regulatorische Konformität oder Produktfreigabe.
Single-Point-of-Failure ohne wirksame Redundanz; hoher Wiederanlauf- und Qualitätsrisiko.
Hohe Opportunitätskosten pro Ausfallstunde, Engpass- oder Taktgeberfunktion.
Klasse B (mittelkritisch): Indirekter Einfluss auf Sicherheit/Qualität; begrenzte Redundanzen oder Umgehungsmöglichkeiten vorhanden.
Spürbare, aber beherrschbare Auswirkungen auf Durchsatz und Terminlage.
Klasse C (unkritisch): Kein Sicherheits-/Compliance-Impact; geringe Qualitäts- und Durchsatzrelevanz.
Ausfall beeinträchtigt nur lokal oder ist durch einfache Workarounds kompensierbar.
Die Klassifizierung wird periodisch (z. B. jährlich) und anlassbezogen (Änderungen im Prozess/Regelwerk) überprüft.
Zielwerte für Verfügbarkeit und zulässige Stillstandszeiten
Die angestrebte technische Verfügbarkeit A wird je Klasse festgelegt. Zur operativen Steuerung werden daraus maximal zulässige Stillstandszeiten (geplante und ungeplante, exklusive genehmigter Wartungsfenster) abgeleitet. Referenz ist ein 30-Tage-Monat mit 43.200 Minuten und ein Kalenderjahr mit 525.600 Minuten.
Klasse A
Zielverfügbarkeit: ≥ 99,9 % monatlich.
Zulässiger Stillstand: ≤ 43 Minuten/Monat bzw. ≤ 8,8 Stunden/Jahr.
Klasse B
Zielverfügbarkeit: ≥ 99,5 % monatlich.
Zulässiger Stillstand: ≤ 216 Minuten/Monat (3,6 h) bzw. ≤ 43,8 Stunden/Jahr
Klasse C
Zielverfügbarkeit: ≥ 98,0 % monatlich.
Zulässiger Stillstand: ≤ 864 Minuten/Monat (14,4 h) bzw. ≤ 175,2 Stunden/Jahr.
Hinweis:
Geplante Stillstände werden über schlanke Wartungsfenster und Bündelung minimiert; für Berichterstattung werden geplante und ungeplante Ausfälle getrennt ausgewiesen.
Instandhaltungsintensität je Klasse
Die Instandhaltungsstrategie folgt dem Kritikalitätsgrad und operativen Risiko.
Klasse A
Strategie: zustands- und risikobasiert (CBM/RBM) mit ergänzender vorbeugender Instandhaltung; regelmäßige Redundanz- und Umschalt-Tests.
Intervalle: eng getaktete Inspektionen (täglich/wochenweise), qualifizierte Kalibrierungen; Online-Condition-Monitoring (z. B. Schwingung, Temperatur, Öl, Netzwerkhealth).
Ressourcen/SLA: 24/7-Bereitschaft; Reaktionszeit ≤ 1 h; MTTR-Minimierung durch Standard-Work, E-Kits, Remote-Support.
Ersatzteile: kritische Teile vor Ort, Lieferanten-SLAs, Obsoleszenzmanagement.
Planungsziel: ≥ 85–90 % geplante Anteile, Backlog streng priorisiert.
Klasse B
Strategie: gemischt präventiv/zustandsbasiert; Trendüberwachung stichprobenbasiert.
Intervalle: monatlich/vierteljährlich; Funktionsprüfungen und Opportunitätswartung bei Stillständen.
Ressourcen/SLA: Geschäftszeiten + Rufbereitschaft; Reaktionszeit ≤ 4–8 h.
Ersatzteile: definierte Mindestbestände, zentrale Lagerhaltung.
Planungsziel: ≥ 75–85 % geplant.
Klasse C
Strategie: korrektiv dominiert (Run-to-Failure, wo risikoangemessen); einfache visuelle Kontrollen.
Intervalle: vierteljährlich/halbjährlich.
Ressourcen/SLA: Reaktionszeit ≤ 24–48 h.
Ersatzteile: Beschaffung nach Bedarf; kosteneffiziente Disposition.
Planungsziel: ≥ 60–70 % geplant.
Kerndefinitionen:
MTBF (Mean Time Between Failures): mittlere störungsfreie Betriebszeit zwischen zwei ausfallbedingten Ereignissen. Verfügbarkeitsbezug: A ≈ MTBF / (MTBF + MTTR). Ziel ist die Erhöhung durch Ursachenanalyse (RCM/RCFA) und CBM.
MTTR (Mean Time To Repair): mittlere Zeit von Störungserkennung bis Wiederherstellung der Funktionsfähigkeit (inkl. Diagnose, Teilebereitstellung, Test). Ziel ist die Reduktion durch Standardisierung, Ersatzteilstrategie und Fähigkeitenmix.
Wartungs-Compliance: Anteil fristgerecht abgeschlossener präventiver/inspektiver Aufträge an allen fälligen Aufträgen.
Kalibrier-/Qualifizierungs-Compliance (falls relevant): Anteil fristgerechter Kalibrierungen/Qualifizierungen.
Alarmqualität (für Anlagen- und OT/SCADA-Alarme)
Relevanzquote: Anteil Alarme mit bestätigter Ursache/Maßnahme.
Falschalarmrate: Anteil Alarme ohne technische Relevanz.
Stehende Alarme: Alarme > 24 h nicht quittiert/behoben.
Time-to-Acknowledge: mediane Quittierzeit kritischer Alarme.
Klasse A
MTTR: ≤ 2 h; resultierend sollte MTBF so dimensioniert sein, dass A ≥ 99,9 % erreicht wird (Beispiel: bei MTTR 2 h ist MTBF ≈ 2.000 h ausreichend).
Wartungs-Compliance: ≥ 95 %; Kalibrier-Compliance: ≥ 98 %.
Alarmqualität: Relevanzquote ≥ 85 %, Falschalarmrate ≤ 5 %, stehende Alarme = 0, Time-to-Acknowledge ≤ 1 min.
Klasse B
MTTR: ≤ 8 h; Verfügbarkeit gemäß Ziel 99,5 % (MTBF und PM-Frequenzen entsprechend auslegen).
Wartungs-Compliance: ≥ 90 %.
Alarmqualität: Relevanzquote ≥ 75 %, Falschalarmrate ≤ 10 %, stehende Alarme ≤ 2/Asset, Time-to-Acknowledge ≤ 5 min.
Klasse C
MTTR: ≤ 24–48 h; Fokus auf Kosten-/Risikooptimierung.
Wartungs-Compliance: ≥ 80–85 %.
Alarmqualität: Relevanzquote ≥ 60 %, Falschalarmrate ≤ 15 %, stehende Alarme begrenzen und periodisch bereinigen.
Hinweise zur Anwendung:
MTBF/MTTR werden pro Klasse, Assetgruppe und Schichtregime getrennt betrachtet; Outlier-Analyse und Saison-/Kampagneneffekte sind zu berücksichtigen.
Compliance wird auf Periodenbasis (Monat/Quartal) rollierend gemessen; Ausnahmen sind zu dokumentieren.
Alarmqualität folgt den Leitlinien ISA-18.2/IEC 62682 (z. B. Alarmrate pro Operator < 1/10 min, Alarmfluten vermeiden). Integration in die Ursachenanalyse schließt den Regelkreis zur Verfügbarkeitssteigerung.
Retrofit-Optionen: Sensorik und Gateways
Die Nachrüstung bestehender Anlagen mit zustandsorientierter Sensorik und IIoT-Gateways ermöglicht Condition-based Maintenance (CBM), ohne die Grundkonstruktion zu verändern. Der Fokus liegt auf nicht-invasiver Anbringung, normgerechter Signalqualität, sicherer Datenübertragung und rückwirkungsfreier Integration in die Steuerung.
Sensorik und Gateways
Mechanische Schwingungen und Lagerzustand
IEPE- oder MEMS-Beschleunigungssensoren, bevorzugt mit magnetischer Basis oder geklebten Montagepads; vorgesehene Messpunkte (Pads) nachträglich an Lagerdeckeln/Bocklagern anbringen.
Kabelführung abgeschirmt, EMV-gerecht; IEPE-Signalaufbereitung nahe dem Sensor zur Rauschminimierung.
Ultraschall- und Körperschallsensoren für Frühdetektion von Schmierstoffproblemen.
Temperatur und Prozesszustände
Oberflächen-RTDs bzw. Clamp-on-Thermoelemente; Infrarot-Fenster in Schaltschränken für Thermografie.
Nachrüstbare Thermowells/Schweißmuffen für medienberührte Messungen, sofern prozessseitig zulässig.
Energie- und Antriebsüberwachung
Split-Core-Stromwandler, Spannungsabgriffe mit geeigneten Sicherungen; Motorstromsignaturen, Oberwellenanalyse.
Frequenzumrichter-Daten (z. B. Drehmoment, Last) via Feldbus auslesen.
Prozessmedien
Ölqualitätssensoren (Dielektrizitätszahl, Partikelzählung), Wasser-in-Öl; Probennahmeventile.
Drucksensoren über T-Stücke oder Serviceports; Durchfluss über Clamp-on-Ultraschall.
Gateways und Datenintegration
Protokollkonverter (Modbus RTU/TCP, Profibus/Profinet, EtherNet/IP, CANopen) zu OPC UA und/oder MQTT (Sparkplug B).
Edge-Compute-Funktionalität für Vorverarbeitung, Feature-Extraktion, lokale Schwellen und Puffer (Store-and-Forward).
Zeit-Synchronisation via NTP/PTP; verifizierte Zeitstempelqualität.
Netzwerkanbindung via Industrial Ethernet, optional 4G/5G für ausgedehnte Areale; Segmentierung und Firewalls nach IEC 62443.
Nach jedem Retrofit sind Validierung und Abnahme strukturiert und dokumentiert durchzuführen (Management of Change). Empfohlen wird ein gestuftes Vorgehen analog IQ/OQ/PQ:
Installation Qualification (IQ)
Abgleich mit Montageplänen, Klemmen- und I/O-Listen; Drehmomentprotokolle für Sensorbefestigungen.
Prüfprotokolle EMV/Isolation, Schutzleiter, Spannungsversorgung; Kalibrierzertifikate (ISO 17025) und Rückführbarkeit.
Operational Qualification (OQ)
Signalprüfung: Nullpunkt, Bereich, Rauschen, Drift; Stimulations- bzw. Shaker-Tests für Schwingung; Temperaturvergleich gegen Referenz.
Datenpfad-Ende-zu-Ende: Tag-Mapping, Asset-IDs, Zeitstempel-Genauigkeit, Latenz, Datenvollständigkeit, Verlustquote, Store-and-Forward.
Cybersecurity-Checks: Default-Credentials entfernt, Härtung gemäß Herstellerleitfaden, Zertifikatsmanagement, Segmentierung.
Sicherheitsfunktionen: Verifikation unveränderter Performance von E-Stops, Schutztüren, Interlocks nach ISO 13849/IEC 62061 (Funktions- und Selbsttests).
Performance Qualification (PQ)
Baseline-Erfassung unter repräsentativen Betriebszuständen; Referenzkennwerte (z. B. RMS, Kurtosis, Temperaturprofile).
Messsystemanalyse (MSA, Gage R&R) und Wiederholbarkeit; Alarm- und Schwellenvalidierung an simulierten Fehlern, sofern sicher möglich.
Verfügbarkeit der Daten (>99% je Use Case), zeitnahe Bereitstellung, Integrität über definierte Beobachtungszeiträume.
Abnahme
Dokumentierte Werks- bzw. Standortabnahme (SAT) der Retrofit-Lösung inkl. Abweichungs- und Maßnahmenliste.
Schulungsnachweis Betrieb/Instandhaltung; aktualisierte CE-Bewertung und Risikobeurteilung (ISO 12100) bei relevanten Änderungen.
Bei Neuanschaffungen sind CBM-Fähigkeiten in den Lastenheften explizit zu fordern, um spätere Nachrüstkosten zu minimieren und Datenqualität zu sichern:
Mechanische/Prozessseitige Vorbereitung
Integrierte Messpads für Schwingung an Lagerstellen; zusätzliche Thermowells, Druck-/Probennahmeports; Ölablass mit Probenahme.
Platz und Halterungen für Sensoren/Gateways; Kabelkanäle, M12/M8-Schnittstellen; ausreichende Schaltschrankreserve (U, Leistung).
Elektrische/Automationsseitige Vorbereitung
Freie, dokumentierte I/O-Kapazitäten; diagnostikfähige Antriebe; Messwandler mit Prüf- und Kommunikationsschnittstellen.
Zeitbasis via PTP; deterministische Netzwerke (TSN-fähig, sofern relevant).
Daten- und Schnittstellenstandards
Native OPC UA-Server mit Companion Specifications; MQTT Sparkplug B; semantische Kennzeichnung (ISA-95/Asset Administration Shell).
Offene, dokumentierte Datenmodelle und Tag-Namen; Export der Ereignis- und Wartungsdaten.
Cybersecurity und Lifecycle
IEC 62443-konforme Geräte: Rollen-/Rechtekonzept, Secure Boot, verschlüsselte Kommunikation, Patchbarkeit, signierte Updates, SBOM.
Remote-Update-Fähigkeit, Konfigurations-Backup/Restore, Langzeitverfügbarkeit von Komponenten und Ersatzteilen.
Herstellerdokumentation sowie FAT/SAT inkl. Sicherheitsfunktionen
Dokumentationspaket (vom Hersteller zu liefern)
Bedienungs- und Servicehandbücher, P&IDs, E-Plan, Klemmen-/Signal- und Adresslisten.
Prüf- und Kalibrierzertifikate; Stücklisten und SBOM; Hardening- und Patch-Management-Anleitung; Alarm- und Cause&Effect-Matrix.
Sicherheitsnachweise: Risikobeurteilung, PL-/SIL-Berechnungen, Proof-Test-Intervalle, Validierungsplan.
Factory Acceptance Test (FAT)
Verifikation der CBM-Fähigkeiten am Prüfstand: Sensorpfade, Datenmodelle, OPC UA/MQTT-Konnektivität, Zeit- und Synchronisationsprüfung, Fallback/Buffering.
Sicherheitsfunktionen im FAT geprüft (soweit möglich): Logiktests, sichere I/O, Profisafe/CIP Safety; Nachweis der geforderten Reaktionszeiten.
Cybersecurity-Basisprüfung: Benutzer-/Rollen, Zertifikate, Protokollierung, Abschalten unsicherer Dienste.
Site Acceptance Test (SAT)
End-to-End-Test im Anlagenumfeld: EMV, Netzwerklast, Interoperabilität mit Leitsystem/CMMS.
Funktionsnachweis aller Sicherheitsfunktionen unter realen Bedingungen; Wiederholungsprüfung nach Integration von Retrofit-Sensorik.
Abgleich As-built vs. Dokumentation; Abnahmeprotokoll mit festgelegten Restpunkten und Fristen.
