DXPRS0027: 43. IT Press Tour (Tel Aviv)
Key Values, Storage Engines & Data Management
11.04.2022 51 min
Zusammenfassung & Show Notes
Chefredakteur Kerstin war wieder unterwegs für euch. Diesmal war das Ziel Tel Aviv in Israel. Das Thema der 43. IT Press Tour lautete IT Infrastruktur Data und Storage Management. Wir waren zu Gast bei ctera, HYCU, Infinidat, komodor, Model9, PLiOPS, speedb und (via Zoom) Data Dynamics. Jeder einzelne der Anbieter hat einen ganz besonderen USP.
Datenbank Management on Steroids
Bei PLiOPS und speedb geht es im Wesentlichen um Datenbank Management bzw. Storage Engines und Key Value Stores. Beide sorgen dafür, dass deine Anwendung (oder der Anwender) seine Daten in der Datenbank wiederfindet und – möglichst schnell – damit arbeiten kann. Bei einigen Datenbanken werden die Key Values im DRAM vorgehalten, andere werden direkt auf der Platte (SSD, HDD) gespeichert. Key Value Stores bilden eine der Grundlagen für die Arbeit einer Storage oder Database Engine. Diese Engines sorgen im Database Management System (DBMS) dafür, dass die Daten in einer Datenbank erstellt, gelesen, aktualisiert oder gelöscht werden können (CRUD – Create Read Update Delete). Zu den Aufgaben einer Storage Engine gehören u. a. Garbage Collection, Indexing und Clustering. Zu den bekanntesten Vertretern von Storage Engines gehören InnoDB und RocksDB. Diese beiden Vertreter beschreiben eine der Herausforderungen der Storage Engines. Die eine ist eine generische Engine, die ein möglichst großes Spektrum an Anforderungen abdeckt (MySQL ist neben Microsoft SQL die am weitesten verbreitete relationale Datenbank), die andere wurde für genau einen Einsatzzweck designed (facebook). Der wohl bekannteste Key Value Store ist Redis.
Die Herausforderung ist wir immer: schnell. Entweder ist die Compute Power dem Datenwachstum nicht gewachsen bzw. geht in die Knie, weil die Platte zu voll ist. Wer also viele Daten verwalten muß, deren Anzahl schnell wächst und mit denen auch gearbeitet wird, profitiert von Data Engines der nächsten Generation. Eine davon ist speedb. Die Grundlage von speedb ist RocksDB – nach der Behandlung mit Steroiden und anderer Magie. Wir haben ein paar Benchmarks für euch im Artikel auf data://disrupted®. speedb ist ein einfacher Rip ‘n Replace für RocksDB.
Einen anderen Ansatz geht PLiOPS mit seiner XPU – einem eigens entwickelten Extreme Data Processor. Auch hier gibt's die Benchmarks im Artikel auf data://disrupted®. Die XDP von PLiOPS sequentiert außerdem die zu schreibenden Daten. Das verlängert die Lebensdauer von SSDs signifikant, die es gar nicht mögen, andauernd kleine Informationsschnipsel schreiben, bearbeiten oder löschen zu müssen. PLiOPS verwendet derzeit derzeit noch PCIe Gen3. Die nächste Version wird bereits auf PCIe Gen5 basieren. Gen4 werden sie skippen.
Le Mainframe est mort. Vive le Mainframe!
Mainframes erfreuen sich nach wie vor großer Beliebtheit. Davon profitieren nicht nur etablierte Ambieter wie BMC oder Gridgain, die wir letzten Monat in San Francisco getroffen haben. Auch Startups erkennen das Potential und helfen, die Dinosaurier in die Zukunft zu bringen. Model9 ist eines dieser Startups. Nun ist die Idee, Daten vom Mainframe in die Cloud zu bringen ja nicht so neu. Gründer und CEO Gil Peleg fand allerdings einen wesentlich effizienteren Weg, die Daten nutzbar zu machen.
Eine große Herausforderung bei den Mainframes ist das Abrechnungsmodell. IBM lizensiert seine Monolithen immer noch nach CPU-Cycles. Das kann schnell teuer werden und schreckt viele Unternehmen von der Cloudialisierung ihres Geschäftsmodells ab. Dazu müssen die Daten nämlich transformiert werden – was (ihr werdet es schon erraten haben) CPU-Power kostet. Oft steht der Mainframe dann auch seinen eigentlichen Aufgaben nicht zur Verfügung. Model9 transformiert die Daten erst in der Cloud. Komprimierung und Verschlüsselung der Daten für den Transport können Co-Prozessoren erledigen, deren Rechenleistung außer Zeit nichts kostet.
Globaler (aka unternehmensweiter) Zugriff auf Daten eliminiert Silos. Mainframe-Daten können in der Cloud für AI/ML und Analysen genutzt, für eine globales Datenverwaltung bereitgestellt oder zusätzlich vor den Folgen von Cyber-Angriffen geschützt werden und als Cloud-native Backup oder Archiv dienen. Eine Schnittstelle in die Cloud ist im Disaster Recovery mittlerweile durchaus als Airgap akzeptiert. Und selbst, wenn auch in der Cloud die Daten auf Tapes gespeichert werden: Für Anwender entfällt der Betrieb eigener Tape-Libraries und das lästige Umkopieren aller 5 bis 7 Jahre. Case Studies gibt es auf der Model9-Website zum Nachlesen.
Wolkig mit viel Sicherheit
ctera und HYCU haben sich den Themen Backup bzw. besser Disaster Recovery verschrieben. ctera versteht sich selbst als primary Storage und ist ein verteiltes Cloud-Storagesystem mit Schwerpunkt auf Compliance und Disaster Recovery. Ein Ziel der Replikation kann eine Cloud-Storage-Instanz sein. Dazu werden Daten verschlüsselt nach dem Zero-Trust-Prinzip repliziert. Aus den Backup-Daten können gezielt Kopien einzelner Datensätze für spezielle Cloud-Workloads (Test, Analyse) extrahiert werden. Weitere Use Cases sind Migration und unternehmensweites Datenmanagement. ctera ist als Appliance, VM oder Container erhältlich. Der Immutable Data Pool basiert im Wesentlichen auf File- und Object-Locks.
ctera und HYCU haben sich den Themen Backup bzw. besser Disaster Recovery verschrieben. ctera versteht sich selbst als primary Storage und ist ein verteiltes Cloud-Storagesystem mit Schwerpunkt auf Compliance und Disaster Recovery. Ein Ziel der Replikation kann eine Cloud-Storage-Instanz sein. Dazu werden Daten verschlüsselt nach dem Zero-Trust-Prinzip repliziert. Aus den Backup-Daten können gezielt Kopien einzelner Datensätze für spezielle Cloud-Workloads (Test, Analyse) extrahiert werden. Weitere Use Cases sind Migration und unternehmensweites Datenmanagement. ctera ist als Appliance, VM oder Container erhältlich. Der Immutable Data Pool basiert im Wesentlichen auf File- und Object-Locks.
Einen etwas anderen Ansatz geht HYCU, die sich auf Backup und Disaster Recovery spezialisiert haben. HYCU hat dazu den R-Score entwickelt, mit dem Unternehmen die Widerstandsfähigkeit und die Fähigkeit zur Wiederherstellung ihrer Daten im Katastrophenfall messen können. Eine Spezialität des Anbieters ist sein Fokus auf legacy Storage-Systeme wie Isilon von Dell EMC. Einige kennen HYCU eventuell noch als ComTrade Group, die ihre Wurzeln in der serbischen Hauptstadt Belgrad hat. Mittlerweile ist das Headquarter in Boston, Massachusetts (USA).
Classify me!
Ein großes Thema im Datenmanagement ist die Klassifizierung von Daten. Das ist in der IT-Security seit langem eine große Herausforderung. AI erlaubt erstmals die Automatisierung dieses wichtigen Themas. Zum ersten Mal ist uns das in San Francisco bei Alation begegnet. Einer, der einen Schritt weiter geht, ist Data Dynamics, die das Potential von NLP (Natural Language Processing) nutzen. Die Herausforderung bei NLP sind die unterschiedlichen Sprachen. Die meisten Modelle werden mit Englisch trainiert. Data Dynamics überrascht mit der Unterstützung aller nord- und osteuropäischen Sprachen. Gründer und CEO Piyush Mehta bedauert, “Hindu und Mandarin unterstützen wir nicht.”
Ein großes Thema im Datenmanagement ist die Klassifizierung von Daten. Das ist in der IT-Security seit langem eine große Herausforderung. AI erlaubt erstmals die Automatisierung dieses wichtigen Themas. Zum ersten Mal ist uns das in San Francisco bei Alation begegnet. Einer, der einen Schritt weiter geht, ist Data Dynamics, die das Potential von NLP (Natural Language Processing) nutzen. Die Herausforderung bei NLP sind die unterschiedlichen Sprachen. Die meisten Modelle werden mit Englisch trainiert. Data Dynamics überrascht mit der Unterstützung aller nord- und osteuropäischen Sprachen. Gründer und CEO Piyush Mehta bedauert, “Hindu und Mandarin unterstützen wir nicht.”
________________________________________________________________
- Lest Artikel in unserem Online-Magazin
- Abonniert uns via Bluesky, Facebook, Mastodon, LinkedIn, RSS-Feeds oder YouTube.
- Hört mehr Podcast mit data://explore und Release.Patch.Repeat
- Folgt Stiefkind und FrauStief auf Bluesky.
- Unterstützt uns mit einem Kaffee ☕️ (oder Tee 🫖)