ADMIN

2023

11

2023-10-30T12:00:00

Backup und Recovery

SCHWERPUNKT

090

Datensicherheit

Backup

Archivierung

Bandlaufwerke

Das große Comeback von Tape

Am laufenden Band

von Ariane Rüdiger

Veröffentlicht in Ausgabe 11/2023 - SCHWERPUNKT

Tape wurde schon oft totgesagt und -geschrieben. Doch es bleibt. Denn das Speichermedium hat im Archivbereich bislang unschlagbare Vorteile. Und mit LTO gibt es eine Technologie, die noch längere Zeit verfügbar und in der Leistung ausbaufähig ist. Wir geben einen Überblick zu Geschichte und aktuellen Standards und zeigen auf, mit welchen Tape-Entwicklungen in nächster Zeit zu rechnen ist.

Die SSD- und Flash-Community verkündet unaufhörlich den Siegeszug ihres Mediums. Unbestritten ist, dass die HDD-Industrie mit abnehmender Bedeutung zu kämpfen hat. Im vierten Quartal 2022 brach der Verkauf von magnetischen Festplatten laut dem Marktforschungsunternehmen Trendfocus um mehr als 40 Prozent ein. Andererseits: Laut Daten aus dem Jahr 2021 von Seagate und IDC lagerten zumindest zu diesem Zeitpunkt noch 62 Prozent der Daten auf Festplatten und nur neun Prozent auf SSDs.
Und die Tape-Branche? Die kommt laut derselben Quelle auf 15 Prozent Anteil. Band kennt derzeit also keine Schrumpfungssorgen. Erst im Mai konnte die LTO-Organisation verkünden: Der Absatz von Bändern hat 2022 zugelegt. Zwar nur um ein halbes Prozent gegenüber 2021, aber immerhin. Ein großer Sprung erfolgte bereits 2009, als das Volumen des Markts auf rund 111 EByte und damit um 400 Prozent wuchs. 2022 lag die Gesamtkapazität ausgelieferter Speicherbänder im komprimierten Datenformat bei knapp 150 EByte.
Geringerer ökologischer Fußabdruck
Dominant im Tape-Bereich ist heute das LTO-Format (Linear Tape Open). Gründe dafür gibt es viele. Die gegenwärtige Epoche und ihre Herausforderungen spielen Tape im Allgemeinen und damit auch LTO Ultrium, so die Bezeichnung der aktuellen Laufwerksformate des Standards, in die Hände. Im Zeitalter des Klimawandels gewinnt das Argument des geringen Energie-, Material- und Platzverbrauchs, verbunden mit einem geringeren Kohlendioxidausstoß, jeden Tag an Bedeutung. Denn wenn das Tape nicht abgefragt wird, ruht es. Tape-Kassetten lassen sich selbst ohne Library irgendwo lagern und nur dann hervorzaubern, wenn sie benötigt werden. Zudem sind sie unkompliziert transportierbar. Und ihre Lebensdauer ist mit 30 Jahren länger als bei HDDs oder SSDs, die nach fünf Jahren perdu sind.
Die SSD- und Flash-Community verkündet unaufhörlich den Siegeszug ihres Mediums. Unbestritten ist, dass die HDD-Industrie mit abnehmender Bedeutung zu kämpfen hat. Im vierten Quartal 2022 brach der Verkauf von magnetischen Festplatten laut dem Marktforschungsunternehmen Trendfocus um mehr als 40 Prozent ein. Andererseits: Laut Daten aus dem Jahr 2021 von Seagate und IDC lagerten zumindest zu diesem Zeitpunkt noch 62 Prozent der Daten auf Festplatten und nur neun Prozent auf SSDs.
Und die Tape-Branche? Die kommt laut derselben Quelle auf 15 Prozent Anteil. Band kennt derzeit also keine Schrumpfungssorgen. Erst im Mai konnte die LTO-Organisation verkünden: Der Absatz von Bändern hat 2022 zugelegt. Zwar nur um ein halbes Prozent gegenüber 2021, aber immerhin. Ein großer Sprung erfolgte bereits 2009, als das Volumen des Markts auf rund 111 EByte und damit um 400 Prozent wuchs. 2022 lag die Gesamtkapazität ausgelieferter Speicherbänder im komprimierten Datenformat bei knapp 150 EByte.
Geringerer ökologischer Fußabdruck
Dominant im Tape-Bereich ist heute das LTO-Format (Linear Tape Open). Gründe dafür gibt es viele. Die gegenwärtige Epoche und ihre Herausforderungen spielen Tape im Allgemeinen und damit auch LTO Ultrium, so die Bezeichnung der aktuellen Laufwerksformate des Standards, in die Hände. Im Zeitalter des Klimawandels gewinnt das Argument des geringen Energie-, Material- und Platzverbrauchs, verbunden mit einem geringeren Kohlendioxidausstoß, jeden Tag an Bedeutung. Denn wenn das Tape nicht abgefragt wird, ruht es. Tape-Kassetten lassen sich selbst ohne Library irgendwo lagern und nur dann hervorzaubern, wenn sie benötigt werden. Zudem sind sie unkompliziert transportierbar. Und ihre Lebensdauer ist mit 30 Jahren länger als bei HDDs oder SSDs, die nach fünf Jahren perdu sind.
Das alles summiert sich zu massiven ökologischen Vorteilen. Laut einem Artikel in IEEE Spectrum [1] aus diesem August erzeugen Festplatten 2,55 Kilogramm Kohlendioxid-Äquivalente pro TByte und Jahr – Referenz war hier die Seagate-Harddisk Exos X18. Schon allein wegen der längeren Lebensdauer bringt es das Tape hier nur auf 0,07 Kilo Kohlendioxid pro TByte, was drei Prozent des Werts für Festplatten entspricht. Die Menge an Elektronikschrott sinkt durch Verlagerung der kalten Daten auf ein Sechzehntel, basierend auf einer Speicherdauer von zehn Jahren und einer Datenmenge von 1 PByte.
Das hat auch finanzielle Vorteile: So ergäben sich bei den oben genannten Randbedingungen (zehn Jahre, 1 PByte) bei HDDs Kosten von 17,7 Millionen US-Dollar, bei Tape wären es nur 9,4 Millionen. Tape spart also rund 40 Prozent der Archivierungskosten ein.
Ransomware als Verkaufsargument
Ein weiteres Argument für Tape ist die aktuelle Ransomware-Lawine, die sich über die Unternehmen ergießt und längst auch Backups bedroht. Zwar nimmt die Zahlungsbereitschaft mit der Zahl der verfügbaren Gegentechnologien ab, doch der Ärger ist für die, die es erwischt, nach wie vor groß. Denn Ransomware gefährdet nicht nur Unternehmen, sondern inzwischen auch die Verwaltung massiv. So verweist das BSI in einer Statistik für 2022 auf einen Ransomware-Angriff auf Behörden, der dazu führte, dass wesentliche öffentliche Dienstleistungen des Bundes über 207 Tage ernsthaft behindert wurden, unter anderem Arbeitslosengeld, Elterngeld und KFZ-Zulassung.
Da trifft es sich gut, dass Tape, insbesondere solches, das nicht in einer aktivierten Library steckt, den nötigen Medienbruch bietet, um wenigstens irgendeine saubere Kopie verfügbar zu haben, wenn Cyberkriminelle zuschlagen. Schutz vor Ransomware etwa bietet Quantums Active-Vault-Technologie. Hierbei fließen die Daten zunächst mittels Backupsoftware auf Tape. Anschließend werden die besonders zu schützenden Bänder nach Regeln in einen sicheren Bereich der Library exportiert. Dort liegen sie ohne Netzwerkanbindung in den Regalen. Nur auf Admin-Befehl sind Tapes aus diesem Bereich wieder aktivierbar.
Nicht zuletzt tragen steigende Compliance-Anforderungen bei gleichzeitiger Zunahme der Datenfluten zum Erfolg von Band bei. Denn es gilt, immer mehr Daten sicher und langfristig aufzubewahren. Und dafür ist Tape nach wie vor die billigste Methode – schon allein wegen der bereits erwähnten längeren Haltbarkeit. Nur DVD, DVD-R und Blue-Ray oder Mikrofilm übertreffen sie, sind aber teurer. Und neue, hochdichte Speichermedien für die Langzeitspeicherung werden zwar immer wieder versprochen, etwa holografische Speicher. Die sollen bis zu 1 TByte pro Medium fassen. Doch auf dem Markt sind sie noch nicht zu finden, und wann sich das ändert, steht in den Sternen.
Vom Audio- zum Datenband
Tape hat eine lange Geschichte. Die ersten magnetischen Speicherbänder wurden schon in den späten Zwanzigern des vergangenen Jahrhunderts für Tonaufnahmen verwendet. Die Geschichte von Storage-Tape für Daten reicht bis ins Jahr 1951 zurück. Damals entwickelte die Eckert-Mauchly-Computer Corporation (EMCC) das erste Bandlaufwerk. Uniservo 1 ersetzte Lochkarten am Univac 1, einem der ersten Computer. Das Medium war ein 0,5 Zoll breites, mit einer Phosphor-Bronze-Legierung überzogenes Band mit einer Dichte von 128 Bit pro Zoll und einer Transferrate von 7200 Zeichen pro Sekunde.
Auch IBM Poughkeepsie experimentierte mit Tape als Medium, und 3M entwickelte die entsprechende Technologie. In einer Vakuumröhre bewegte sich ein U-förmiges Band mit 100 bis 200 Inch pro Sekunde. 1952 brachte IBM das Model 726 auf den Markt, das erste Tape-Speichersystem. Es sicherte zwei Millionen Digits auf Tape-Spulen mit acht Zoll Durchmesser auf sieben Spuren. Das Format eines Datenblocks waren sechs Bytes plus ein Datenblock. 1964 wechselte IBM zu neun Spuren und acht Bits plus Paritätsbit pro Block. 1970 wurden mit dem System 3400 die ersten selbstladenden Tape-Bibliotheken eingeführt.
1972 erfand 3M die Viertelzoll-Speicherkassette mit zwei Spulen (QIC-11), die 20 MByte fasste. Bei IBM ging die Entwicklung 1984 mit der Einführung eines magnetoresistiven Dünnfilm-Lesekopfs weiter. Damals erreichte die Speicherdichte 200 MByte pro Band, die sich 1986 durch die Einführung von Hardwarekompression verdoppelte.
DEC brachte 1984 mit der TK 50 ein eigenes Tape-Format (DLT, Digital Linear Tape) heraus. Quantum übernahm diese Technologie im Jahr 1994 und entwickelte sie nach der Akquise des Herstellers Benchmark Storage Innovation in Super DLT (SDLT) weiter, das bis zu 110 GByte pro Band speichern konnte. 2002 wurde DLT zugunsten von LTO eingestellt. Medien und Laufwerke dafür sind noch erhältlich, allerdings meist gebraucht. So ging es auch anderen Formaten mit wenigen Ausnahmen (siehe Kasten).
Weitere Tape-Formate
- ADR, Advanced Digital Recording: Entwickelt von Philips. Die Kassetten fassen ein 8-mm-Magnetband. Die Technologie wird heute von Onstream vermarktet.- AIT, Advanced Intelligent Tape: Nachfolger von Digital Audio Tape (DAT) von Sony. Verwendet metallbeschichtete Bänder. 2010 eingestellt.- DDS, Digital Data Storage: Von HP und Sony 1989 entwickelt. Die Standards hießen ECMA-139 bis ECMA-288. 1999 eingestellt.- Mammoth: Weiterentwicklung von Helical Scan von Exabyte. Nutzt 8-mm-Bänder, speichert bis 60 GByte nativ und 150 GByte komprimiert. Noch erhältlich.- QIC, Quarter Inch Cartridge: Wurde später auf 8 mm umgestellt (Travan). Tandberg entwickelte das Format zu SLR (Scalable Linear Recording) weiter. SLR/QIC-Auto­loader und -Medien sind noch von Tandberg erhältlich.- VXA: Schrägspur-Bandaufzeichnungsverfahren, ursprünglich von Ecrix entwickelt, das von Exabyte und dann 2006 von Tandberg aufgekauft wurde. Erstes Format mit paketförmiger Datenaufzeichnung. Noch erhältlich.
LTO als verbreiteter Standard
Die erste LTO-Spezifikation kam im Jahr 2000 heraus. Diese Generation der LTO-Medien speicherte 100 GByte pro Band. Es folgten LTO-2 (2003, 200 GByte) und LTO-3 (2005, 400 GByte). Das Halbzoll-Bandformat LTO, entwickelt von Hewlett Packard, IBM und Seagate (später von Quantum aufgekauft), entpuppte sich als erstaunlich zäh und lebendig. Jüngst wurde Generation 14 definiert. LTO-14-Bandkassetten sollen einmal bis zu 576 TByte nativ respektive knapp 1,5 TByte komprimiert fassen. Jede Generation leistet damit mehr als die vorige, wenn auch nicht, wie anfangs vorgesehen, das Doppelte.
Zudem kommen immer wieder neue Funktionen hinzu, beispielsweise seit Generation 3 die Möglichkeit, unveränderlich auf Band zu schreiben (WORM). Seit einigen Jahren ist herstellerunabhängige Verschlüsselung mit AES-256 IEEE-konform möglich, die Leistung sinkt dadurch nur um ein Prozent. Seit Generation 5 werden Bänder mittels Linear Tape File System (LTFS) in zwei Partitionen eingeteilt: Eine enthält Metadaten im XML-Format, die andere die Daten. Alle LTO-Ultrium-Bandkassetten haben dieselben Maße und einen RAM im Gehäuse, der die hundert letzten abgefragten Tapemounts und einige weitere Daten zum Band speichert.
LTO-9 macht Migration erforderlich
Derzeit verbreitet ist insbesondere die Tape-Generation LTO-9. Eine solche Kassette fasst 18 TByte (komprimiert bis zu 45 TByte). Bei LTO-8 waren es noch 12 TByte. Das Band ist 1035 Meter lang und enthält 8960 Spuren. Weitere Eigenschaften von LTO-9 sind mehrere Sicherheitsebenen, Hardwareverschlüsselung, unveränderliche WORM-Speicherung, schneller Datenzugriff durch LTFS, Kompatibilität mit LTO-8, bis zu 1 TByte Transfergeschwindigkeit und 87 Prozent weniger Kohlendioxidausstoß als die Vorgeneration.
LTO-9-Produkte ließen recht lange auf sich warten. Laufwerke und Libraries für LTO Ultrium 9 stellen heute unter anderem Quantum, Tandberg, HPE, Dell und IBM her. Libraries fürs Rechenzentrum kosten meist um die 4000 Euro, einzelne Bandlaufwerke gibt es ungefähr ab 3000 Euro, die Medien sind für unter 100 Euro pro Stück zu haben. Einige Produkte wurden erst 2023 auf LTO-9 vorbereitet, zum Beispiel die NEOxl-Libraries von Tandberg.
Bislang lag die Rückwärtskompatibilität von LTO-Tapes bei zwei Generationen. Das ist vorläufig passé: Anwender, die heute noch mit LTO-7 arbeiten, aber wegen der erheblich höheren Dichte auf LTO-9 setzen möchten, sind gezwungen, ihre Tape-Architektur zumindest teilweise zu migrieren. Grund dafür sind neue Leseköpfe und dichtere Partikelstrukturen. Das kann entweder mithilfe einer neu eingerichteten LTO-9-Partition der alten Library oder aber mit einer neuen LTO-9-Library geschehen.
Das Unternehmen Spectra Logic, das viele Forschungseinrichtungen mit Tape versorgt, rät dazu, hier bei den aktiven Bändern zu beginnen. Was in Archiven oder Sicherungsdateien liegt, die nur selten adressiert werden, kann dagegen auf älteren Generationen bleiben. Auch für Compliance-Prozesse notwendige Daten müssen unter Umständen auf neue Medien umziehen.
Das funktioniert beispielsweise so, alte Daten stapelweise über die Backupsoftware auf eine neue LTO-9-Partition der Library zu verschieben und neue direkt auf LTO-9 zu schreiben. Dazu muss aber die Sicherungssoftware solche Prozesse unterstützen. Aktive Archivdaten wandern zunächst auf Primär-Storage und von dort auf die neuen LTO-9-Medien (Bild 1).
Bild 1: Der Umstieg von LTO-7 auf LTO-9 bedeutet für Unternehmen einen harten Migrationsprozess.
Magnetbeschichtung immer feiner
IBM und Quantum haben 2021 vereinbart, dass sie die Technologien für LTO-10 gemeinsam entwickeln wollen. Auf den Markt soll der neue Standard spätestens 2025 kommen. Was das für die passenden Produkte bedeutet, steht noch in den Sternen.
Die vorgesehene Erhöhung der Bandkapazitäten hat mit den verwendeten Beschichtungsmaterialien und immer dünneren Bändern zu tun. Fujitsu und IBM verwenden bis LTO-9 als Beschichtung Bariumferrit, dessen Metallpartikel 40 bis 100 nm groß sind, sich nun aber dank verbesserter Zerstäubungstechnologie auf 20 nm verkleinern ließen. Inzwischen wird am Beschichtungsmaterial Strontiumferrit gearbeitet. Hier sollen unkomprimierte Speicherleistungen von bis zu 580 TByte pro Tape möglich werden, was der Speicherleistung des soeben angekündigten LTO-14 entspricht.
Die Verteilung der Magnetpartikel erfolgt bei Fujifilm mit der sogenannten Nanocubic-Technologie, die das magnetische Material sehr dünn und gleichmäßig auf dem Band verteilt. Klumpenbildung lässt sich so wirksam verhindern. Laut Fujifilm entspricht die Dicke der Schicht derjenigen, die entstehen würde, würde ein Liter Farbe auf vier Fußballfelder verteilt. Gegenüber der Vorläufertechnologie ATOMM hat sich die Dicke der Speicherschicht auf ein Zehntel verringert. Neben kleineren Partikeln ist die nichtmagnetische Trageschicht dünner und ein spezieller Polymerbinder sorgt für eine besonders gleichmäßige Struktur der aufgebrachten Partikel.
Kürzlich ging es bei den Produkten ein Stück voran: IBM und Fujifilm kündigten im August mit "3592 JF" ein neues 50-TByte-Tape-System (native Kapazität) an. Es soll in IBMs neuestem Tape-Drive TS1170 zum Einsatz kommen und dabei auf neue Technologien zurückgreifen. So verwenden die Bänder eine Kombination aus Strontium- und Bariumferrit. Das Tape ist 15 Prozent länger als bisher, das Tape-Basismaterial dicker.
Tape meets Objektspeicher
Auch die Objektspeicher-Technologie, inspiriert durch Massen unstrukturierter Daten, führt zu Neuerungen bei Tape. So hat Fujifilm Recording Media im September 2020 Software-defined Tape und das dazu passende Format OTF Version 1 vorgestellt und vermarktet das Ganze als Fujifilm Object Archive. Der Hersteller vereint hier Technologien aus der Objektspeicherung und aus der Cloud.
OTF soll vor allem das Auffinden von Daten beschleunigen. Dabei werden mehrere Bänder zu Archivierungszwecken sequenziell mit Datenobjekten beschrieben. Die relevantesten Daten erhalten die kleinsten Speicheradressen. Objektdaten finden sich nicht nur in der übergreifenden Metadatenschicht, sondern auch als Komponente der Objekte. Die Objektdaten speichert OTF binär, Metadaten im JSON-Format. Die Datenobjekte erhalten einen einmaligen Identifikator und einen Zeitstempel. Zudem wird der Datenerzeuger gespeichert.
Dem schnelleren Zugriff dient eine neue Aufteilung, deren Idee aus der Objektspeicher-Technologie stammt: Die Datenobjekte mit ihren Metadaten (Ebene 0) bilden Speicherobjekte (Level 1). Diese wiederum lassen sich zu Serien zusammenfassen (Level 2) und auf einer Tape-Partition hinterlegen (Level 3).
Außerdem gibt es sogenannte Commit-Marker. Sie werden für Serien, Partitionen und das gesamte, vollständig beschriebene Band vergeben. Das Objekt-Directory liegt auf der Ebene 2, sodass bei einer Suche kein Vordringen bis auf Objektebene erforderlich ist. Wenn sinnvoll, wird für mehrere Bänder nur eine ID vergeben, etwa, wenn sie zusammenhängende Inhalte speichern. Die ID wird auf dem Band gespeichert.
Jedes Band hat wie bisher eine Referenz- und eine Datenpartition. Die Referenz­partition enthält hier aber eine Liste der Commits (Partial Reference). Sie findet sich auch auf der Datenpartition. Dadurch lässt sich erkennen, welche Daten auf jedem Band stehen. Datenobjekte finden sich aus Redundanzgründen ein-, zwei- oder dreimal auf unterschiedlichen Tapes, wobei die jeweilige Strategie regionenspezifisch definiert ist. Objekte lassen sich in Region B zweimal und in Region C dreimal speichern.
Ein Cache mit SCSI-Schnittstelle speichert Informationen, um Commit-Marker schneller zu finden. Das Tape funktioniert aber auch ohne dieses Element. OTF passt zu vielen Bandbibliotheken. Die Server schreiben direkt darauf und suchen die Daten. Entscheidend ist, dass bei der Objektspeicherung beim Suchen nicht auf die Daten direkt, sondern auf die separat gespeicherten Metadaten zugegriffen wird. Letztere lassen sich in ein vorgelagertes Speichersystem packen, um den Zugriff zu beschleunigen. Außerdem skaliert die Technologie sehr gut. Die S3-Schnittstelle erleichtert den Zugriff und die Kombination mit S3-Storage vor Ort oder in der Cloud. So kann ein entsprechender Server Daten direkt aus S3 auf ein ODT-Medium überspielen.
Bild 2: Nach Metadaten und eigentlichen Sicherungsinformationen getrennt lagern Daten auf Bändern im Fujifilm Object Archive.
Fazit
Tape steht angesichts verschärfter ökologischer und Compliance-Anforderungen möglicherweise eine Renaissance bevor. Denn bei weiter ungebremst wachsenden Datenmassen bedarf es dringend hochdichter, preisgünstiger, strom- und kohlendioxidsparsamer sowie dauertauglicher Datenspeicher. Deshalb ist Tape nach wie vor ein unschlagbarer Kandidat fürs Langzeitarchiv und den Ransomware-Schutz – zumindest bis Technologien wie holografische Speicher oder Storage in der DNA sich tatsächlich in Form von Produkten materialisieren. Und das kann durchaus noch lange dauern.
(ln)
Link-Codes
[1] CO2-Ausstoß von Tape im Vergleich zu HDD: https://spectrum.ieee.org/tape-storage-sustainable-option/