Re: [OT-Frage] Sicherer Speicher für wichtige Daten

Am 17.03.21 um 00:52 schrieb Helmut Schellong:

> >> Wenn allerdings lediglich 2 Festplatten eines Backup-Systems >> innerhalb eines Zeitraumes von 5 Jahren durch Verschleiß >> defekt werden, ist ein gleichzeitiger Defekt extrem unwahrscheinlich. >> Das ergibt sich auch durch Anwendung von Wahrscheinlichkeitsrechnung. > > Sind die Ereignisse unabhängig voneinander? Zeitabhängiger Serienfehler? >

|Unabhängige Ereignisse. |Das war war hier ja von Beginn an der Tenor, bei der |Bildung eines Backup-Systems. |Auch ich selbst nutze ein solches Backup-System.

|Bei dem Beispiel oben betrachte ich den Zeitraum |nach dem flachen Teil der Badewannenkurve. |Dort beginnen ja die Ausfälle wegen Verschleiß.

|Model Family: Western Digital RE2 Serial ATA |Device Model: WDC WD5000YS-01MPB0

|ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE | 1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0 | 3 Spin_Up_Time 0x0003 210 206 021 Pre-fail Always - 6500 | 4 Start_Stop_Count 0x0032 094 094 000 Old_age Always - 6577 | 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 | 7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0 | 9 Power_On_Hours 0x0032 051 051 000 Old_age Always - 35799 | 10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0 | 11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0 | 12 Power_Cycle_Count 0x0032 095 095 000 Old_age Always - 5356 |194 Temperature_Celsius 0x0022 253 253 000 Old_age Always - 53 |196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 |197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0 |198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline - 0 |199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 |200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail Offline - 0

|Model Family: Western Digital RE3 Serial ATA |Device Model: WDC WD1002FBYS-01A6B0

|ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE | 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0 | 3 Spin_Up_Time 0x0027 253 253 021 Pre-fail Always - 1300 | 4 Start_Stop_Count 0x0032 096 096 000 Old_age Always - 4386 | 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 | 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 | 9 Power_On_Hours 0x0032 059 059 000 Old_age Always - 30561 | 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0 | 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0 | 12 Power_Cycle_Count 0x0032 096 096 000 Old_age Always - 4352 |192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 631 |193 Load_Cycle_Count 0x0032 199 199 000 Old_age Always - 4386 |194 Temperature_Celsius 0x0022 104 096 000 Old_age Always - 46 |196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 |197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0 |198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0 |199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0 |200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0

formatting link
Nun ist auch die zweite alte Festplatte defekt gegangen. Mit etwa 13 Monaten zeitlichem Abstand.

Es ist folglich extrem unwahrscheinlich, daß zwei Festplatten gleichzeitig defekt gehen, so daß sie ab sofort keinen Datenverkehr mehr erlauben.

Reply to
Helmut Schellong
Loading thread data ...

Statistik am Einzelfall, immer wieder sehr beliebt. Und dann kommt sowas

formatting link
und man guckt in die Röhre.

Hanno

Reply to
Hanno Foest

Am 03.11.2022 um 18:04 schrieb Helmut Schellong:

Ihr könnt mich für übervorsichtig halten.

Ich habe meine Daten alle 2 Mal redundant gespiegelt auf ext. HDDs. Zur Vorsicht habe ich nochmal eine Kopie in der IONOS-Cloud für 3 € pro Monat. Die Synchronisation mache ich mit DirSync.

Wichtige dauernde Daten, fertige Projekte, Software, Internet-Seite habe ich zusätzlich auf CD, DVD, DVD-DL.

Grüße

Reply to
Leo Baumann

Wir hatten die Dinger im Einsatz und die sind gestorben wie die Fliegen. Die steckten in den Servern in einem Raid-Käfig, ich hatte durchweg RAID

1 verwendet. Manchmal mehrfach pro Woche hab ich eine defekte HDD irgendwo rausgezogen und eine neue reingeschoben. Irgendwann bekam ich dann mal PLatten eines anderen Herstellers, da war der Spuk vorbei.

Es ist tatsächich nie der Fall eingetreten, daß 2 HDDs eines RAID1 gleichzeitig kaputtgegangen sind. Nie! Hab mein Backup zum Glück nie gebraucht. Das müssen so 50+ Einzelfälle gewesen sein.

Guido

Reply to
Guido Grohmann

Dann hast du Glück gehabt. Ich hatte das und es waren nicht einmal die erwähnten IBM. Da es das Boot-RAID1 war, war danach der komplette Server offline und man musste erst einmal ein Minimal-OS installieren bevor man das Backup zurückspielen konnte. War kein schöner Tag.

Gerrit

Reply to
Gerrit Heitsch

Ich bin hier derjenige, der bereits seit Jahren mehrfach gepostet hat, daß er Backup auf einer zweiten Festplatte, und auf ein oder gar zwei Speicherkarten, und in der Cloud (1 €) vornimmt. Wegen der Cloud habe ich mehrere Verschlüsselungs-Algorithmen in C implementiert undein Verschlüsselungs-Skript entwickelt. Auch alles mehrfach gepostet; steht auch zum Teil in meiner Signatur.

Reply to
Helmut Schellong

Ich beachte _nur_ eigene konkrete Erfahrungen und _solche_ aus meinem Umfeld. Betreffend Festplatten und PC-Netzteile.

Diese sagen mir ganz klar, daß es extrem unwahrscheinlich ist, daß zwei Festplatten zum gleichen Zeitpunkt defekt gehen und sofort keinen Datenverkehr mehr zulassen.

Ich verwende seit Jahrzehnten ausnahmslos Festplatten WD Gold Enterprise 24/7. IBM produziert seit Jahrzehnten keine mehr - und ist damit irrelevant.

Reply to
Helmut Schellong

Nein, er hat den Normalfall erlebt.

Man kann die Wahrscheinlichkeit, daß eine Festplatte überhaupt defekt wird, vielleicht durch 15 Mio. dividieren, um die Wahrscheinlichkeit zu erhalten, daß zwei Festplatten innerhalb derselben Sekunde defekt werden.

Reply to
Helmut Schellong

Innerhalb derselben Sekunde? Das ist eine deutlich längere Zeit in der die zweite HD eines RAID1 nicht sterben darf. Nämlich die Zeit von der Meldung, daß eine HD defekt ist bis zu dem Zeitpunkt an dem der Resync des RAID1 erledigt ist. Das sind eher Stunden, mit Pech mehr als 1 Tag.

Noch schöner ist, daß die zweite HD schon defekt sein kann, es aber bisher noch nicht aufgefallen ist weil der defekte Bereich schon länger nicht mehr gelesen wurde. Beim Resync wird aber alles gelesen und dann fällt es auf.

Gerrit

Reply to
Gerrit Heitsch

Das ist hierzugroups zweifellos bekannt, daß dein geistiger Horizont eingeschränkt ist, und du unfähig bist, über deinen Tellerrand hinauszugucken.

Hanno

Reply to
Hanno Foest

Man weiß demnach, daß das nicht der Normalfall ist, wenn die Daten aufgrund eines RAID1-Doppelausfalls futsch sind. Toll, kann man sich sicher viel für kaufen.

Innerhalb derselben Sekunde? Erst mal muß du es merken, dann muß das Ersatzteil da sein, und schließlich der Resync durch. Platten sterben gerne gerade bei der höheren Belastung beim Resync...

Hanno

Reply to
Hanno Foest

Man stelle sich vor, 10 Millionen Festplatten werden mit sehr hoher Wahrscheinlichkeit innerhalb des kommenden halben Jahres defekt gehen. Ein halbes Jahr hat etwa 15 Millionen Sekunden. Es kann gut sein, daß dabei gar keine >1 Festplatten in derselben Sekunde defekt gehen.

Wie verhält sich das, wenn nur 2 statt 10000000 Festplatten betrachtet werden?

Es gibt hier eine Ähnlichkeit zu dem Spiel, wo Kugeln vertikal durch ein Feld aus Nägeln und abschließend in Aufbewahrungs-Röhren fallen.

Reply to
Helmut Schellong

Es ist anders herum: Ich kann mich nur auf eigene konkrete Erfahrungen _verlassen_. Betreffend eigene Hardware und Hardware in meinem Umfeld. Hinter dem Tellerrand habe ich zu oft Müll gelesen und erfahren.

Reply to
Helmut Schellong

. Alles irrelevant.

Klärende Zusammenfassung: ============================================================================================== On 11/04/2022 07:33, Guido Grohmann wrote: |>

formatting link
|Wir hatten die Dinger im Einsatz und die sind gestorben wie die Fliegen. |Die steckten in den Servern in einem Raid-Käfig, ich hatte durchweg RAID 1 verwendet. |Manchmal mehrfach pro Woche hab ich eine defekte HDD irgendwo rausgezogen und eine neue reingeschoben. |Irgendwann bekam ich dann mal PLatten eines anderen Herstellers, da war der Spuk vorbei.

|Es ist tatsächich nie der Fall eingetreten, daß 2 HDDs eines RAID1 gleichzeitig kaputtgegangen sind. |Nie! Hab mein Backup zum Glück nie gebraucht. Das müssen so 50+ Einzelfälle gewesen sein.

Ich schrieb direkt zuvor: |Man stelle sich vor, 10 Millionen Festplatten werden mit sehr hoher Wahrscheinlichkeit |innerhalb des kommenden halben Jahres defekt gehen. |Ein halbes Jahr hat etwa 15 Millionen Sekunden. |Es kann gut sein, daß dabei gar keine >1 Festplatten in derselben Sekunde defekt gehen.

|Wie verhält sich das, wenn nur 2 statt 10000000 Festplatten betrachtet werden?

|Es gibt hier eine Ähnlichkeit zu dem Spiel, wo Kugeln vertikal durch ein Feld aus Nägeln |und abschließend in Aufbewahrungs-Röhren fallen. ==============================================================================================

Es geht nicht um Ersatzteile, Resync, und ähnlich. Es geht nur um Spiegelung von Dateisystemen und Verzeichnissen, und um die Wahrscheinlichkeit von gleichzeitigem Defekt von ≥2 Festplatten. Ich mache das per Skript mit rsync. Guido Grohman machte das mit RAID1.

Ich hatte nie IBM_Deskstar_75GXP in Gebrauch - dies ist also ebenso irrelevant.

Reply to
Helmut Schellong

Wenn mir das passiert wäre, hätte ich zwei neue HDDs reingesteckt, die Kiste von CD gebootet (Linux) und das Windows von einem Imageserver wieder eingespielt. Dieses Image enthielt das System und die erforderliche Datenbank-Software (Oracle). Die Datenbank selber befand sich auf einem oder zwei weiteren RAID-Volumes. Ein paar Befehle später fuhr die Bank wieder hoch, machte noch ein Instance-Recovery und war wieder verfügbar. Je nach Alter des Betriebssystem-Images waren vor dem Starten der DB noch ein paar bis ein paar mehr Windows-Updates nachzuziehen.

Ein Recovery einer defekten Datenbank nach Ausfall beider Platten eines Datenbank-RAIDs hätte etwas länger gedauert.

Guido

Reply to
Guido Grohmann

Oder Du ha(tte)st ein Athlon-Motherboard mit einem Chipsatz der bei DMA-Übertragung größerer Dateien die Daten klammheimlich korrumpiert. Der altbekannte Pentium FDIV Bug ist nur die Spitze des Eisbergs, seitdem wurden dutzende Male irgendwelche Bugs im Microcode ausgebügelt. Auch gab es schon einige Firmwareupdates für SSDs, die nicht nur mangelnde Performance sondern mögliche Integritätsprobleme behoben. Hast Du mehrere von den Dingern mit identischem Patchlevel am Start, geht es geht es plötzlich nicht mehr um zwei stochastisch unabhängige Ereignisse und auf die versprochene MTBF ist vollkommen geschissen.

Und last not least schlägt natürlich genau dann ein Überspannungshoppala vom DSL-Hausanschluß auf die Netzwerkleitung durch, während das ach-so-tolle RAID-5-System die gerade eben wegen defektem Spindelmotor ausgetauschte Festplatte aufsynchronisiert.

Und über Layer-8-Einflüsse à la "erst löschen, dann kopieren" oder robocopy /mir bzw. rsync --delete mit versehentlich vertauschtem Quell- und Zielverzeichnis oder ein SSD-Secure-Erase auf dem falschen Gerät haben wir noch gar nicht gesprochen.

Wenn Du dann nicht einen richtig guten Plan zur Datenwiederherstellung hast, ist Deine digitale Existenz in Sekundenbruchteilen vernichtet.

Volker

Reply to
Volker Bartheld

formatting link
Das war echt haarscharf. Mutmaßliche Ursache: Externe Backupplatte ausgeworfen, bevor der rsync-Job fertig war. Kein SSH Zugang eingerichtet.

Volker

Reply to
Volker Bartheld

Nicht bei unserem allwissenden, allmächtigen Oberauskenner. Der Chuck Norris der IT-Branche, wie er allein durch Stirnrunzeln den festgefressenen Spindelmotor wieder gangbar macht.

Volker

Reply to
Volker Bartheld

Das ist korrekt. Das was vorstehend geschrieben wurde, ist nämlich komplett irrelevant. Wurde auch von Dir ignoriert. Ebenso ignoriert Dein Posting von 19:25 einfach alles - irrelevant. Es geht nur um das zeitliche Defektwerden von Festplatten.

Ich setze mehrere spezielle Bisse auf der Festplatte, um sie zu reparieren.

Reply to
Helmut Schellong

Hallo Helmut,

Du schriebst am Fri, 4 Nov 2022 15:32:18 +0100:

Das verhält sich halt so, daß Statistik recht zufällig individuelle Ergebnisse liefert.

Reply to
Sieghard Schicktanz

ElectronDepot website is not affiliated with any of the manufacturers or service providers discussed here. All logos and trade names are the property of their respective owners.