Grafana-Dashboard mit Zeitreihendaten

AMAZON TIMESTREAM: DAS NEUE ZEITREIHEN-DATENBANKSYSTEM VON AWS

Dennis Kögel, Cloud Architect, 21.10.2020

Amazons Anspruch? Die größte Auswahl an speziell entwickelten Datenbanken für sämtliche Anforderungen zur Verfügung zu stellen. Mit der Veröffentlichung von Amazon Timestream ergänzt AWS seine Produktpalette um ein Datenbanksystem für Zeitreihen. Typischer Anwendungsfall ist das Speichern und Auswerten von IoT-Daten. Ein AWS-Tool im Cloud Mates-Test.

HINTERGRUND: SO FUNKTIONIEREN ZEITREIHEN

Amazon Timestream ist eine Anwendung von Amazon Web Services (AWS), die speziell auf Daten in Zeitreihen (englisch: time-series data) ausgerichtet ist. Bei solchen Daten geht es darum, eine Veränderung festzuhalten, die über eine gewisse Zeit hinweg passiert– beispielsweise der Verlauf von Temperaturen, Aktienkursen oder die verbleibende Kraftstoffmenge in einer Flotte von LKWs. Diese Daten bilden wiederum die Grundlage für viele Visualisierungen, insbesondere Verlaufsgraphen.

Charakteristisch für diese Zeitreihen sind triviale Daten – oftmals nur Zeitpunkt, Gerätenummer und Messwert. Jedoch wird dabei über eine längere Zeit eine extrem hohe Anzahl an Werten generiert. In manchen Anwendungsfällen sind das sogar viele Werte pro Gerät und Sekunde. Das trifft besonders auf IoT-Szenarien zu, in denen mehrere tausende Geräte oder Sensoren nicht unüblich sind. Das Ergebnis: eine schwindelerregende Menge von Datenpunkten. 

Aus diesem Grunde kommen generische Datenbanksysteme bei Zeitreihen schnell an ihre Grenzen. Insbesondere wenn sehr häufige Auswertungen nötig sind, wie beispielsweise für Echtzeit-Visualisierungen, führt das schnell zu Engpässen. Anders ist das bei AWS Timestream.

DIE STÄRKEN VON AMAZON TIMESTREAM

Amazon Timestream positioniert sich als AWS-native Alternative zu spezialisierten time-series Database-Produkten wie TimescaleDB oder InfluxDB. Es beweist schon jetzt im Vergleich zu diesen Services einige Stärken:

 Datenabfrage per SQL: Der SQL-Dialekt von Timestream ist für den Umgang mit Zeitwerten und deren Auswertung optimiert.

 stufenlose Abfrage: Im Gegensatz zu Konkurrenzprodukten ist es bei Abfragen nicht nötig, zwischen Live-Daten und archivierten Daten zu unterscheiden.

 serverless: Bei AWS Timestream ist keinerlei Provisionierung, Dimensionierung oder Wartung erforderlich. Stattdessen können in quasi unbegrenzter Menge und Frequenz Daten gespeichert und abgefragt werden. Berechnet wird ausschließlich die tatsächliche Nutzung (Pay as you go).

 hochverfügbar: Timestream ist über mehrere Rechenzentren (Availability Zones) hinweg redundant.

DIE SCHWÄCHEN VON AMAZON TIMESTREAM

Amazon Timestream ist ein sehr junges Produkt. Es ist also nicht überraschend, dass noch einige Ecken und Kanten vorhanden sind:

 keine historischen Daten: Übermittelte Daten müssen sich derzeit immer auf den aktuellen Zeitpunkt beziehen (mit etwas Spielraum). Eine Migration historischer Daten aus einem bestehenden System in AWS ist also (noch) nicht möglich.

 keine SSD-Speicher: Für die Daten stehen bisher nur magnetische Speicher zur Verfügung. Eine optionale Speicherung auf SSDs ist bereits angekündigt.

 Zugriff nur via API: Das Abfragen und Schreiben von Datensätzen ist nur via AWS SDK oder CLI möglich. Eine direkte Abfrage via klassischer SQL-Protokolle ist aktuell nicht möglich. Immerhin ein JDBC-Treiber ist verfügbar.

INTEGRATION

Obwohl Amazon Timestream noch sehr jung ist, sind schon jetzt unzählige Möglichkeiten zur Integration mit anderen AWS-Produkten verfügbar oder angekündigt. Dazu gehören zum Beispiel:

 

DAS CLOUD MATES-FAZIT ZU AMAZON TIMESTREAM

Mit Amazon Timestream ergänzt Amazon Web Services sein Angebot in der AWS Public Cloud um eine zunehmend wichtige Variante der zweckoptimierten Datenbanken. Bereits in seiner jetzigen Form ist Amazon Timestream vielversprechend und wird in Zukunft auch bei Cloud Mates-Projekten sicherlich das Rückgrat vieler neuer Anwendungen werden.