Technologien

Anspruchsvollen Herausforderungen kann man nur mit anspruchsvollen Technologien begegnen. Daher haben wir tiefgreifendes Spezialwissen in folgenden Bereichen aufgebaut, auf denen unsere Lösungen basieren:

BIG DATA

Big Data umschreibt die wirtschaftlich sinnvolle Gewinnung und Nutzung entscheidungsrelevanter Erkenntnisse aus vielfältigen und unterschiedlich strukturierten Informationensquellen, die sich durch hohe Veränderungsdynamik sowie einem bisher ungekannten Ausmaß auszeichnen. Big Data stellt Methoden, Technologien und Tools bereit, die die explosionsartig steigenden Volumina vielfältiger Informationen in fundierte und zeitnahe Management-Entschei­dungen übersetzen und so einen zentralen Beitrag zur Verbesserung der Wettbewerbsfähigkeit leisten.

SQL

SQL (Structured Query Language) ist eine Datenbanksprache zur Definition von Datenstrukturen in relationalen Datenbanken sowie zum Bearbeiten (Einfügen, Verändern, Löschen) und Abfragen von darauf basierenden Datenbeständen. Durch den Einsatz von SQL strebt man die Unabhängigkeit der Anwendungen vom eingesetzten Datenbankmanagementsystem an. SQL gilt als Klassiker im Business Intelligence, mit dem sich auch sehr komplexe Datenanalysen programmieren lassen.

NOSQL

NoSQL (not only SQL) bezeichnet eine heterogene Menge von Daten­verwaltungs­systemen mit unterschiedlichen Funktionen. Diese wurden für Anwendungsfälle erstellt, in denen die verfügbaren SQL-basierten Datenbanken an ihre Leistungsgrenzen kamen und daher kaum einsetzbar waren. NoSQL bezweckt somit, sich nicht ausschließlich auf SQL-Datenbanken zu beschränken und ist damit eine Ergänzung zu SQL.

HADOOP, SPARK & CO.

Großvolumige unstrukturierte Daten verarbeiten wir auf Linux-Systemen mit dem Apache Hadoop Framework, Machine Learning setzen wir mit Apache Spark um. Dabei verwenden wir Hive als Data Warehouse sowie Pig und Spark für die Analyseentwicklung. Wir nutzen diese Open-Source-Technologie, um aus trägen Big Data Analysis schnelle und präzise Small Data Analysis zu machen.

IN-MEMORY

In-Memory-Datenbanken arbeiten hauptspeicherresident, so dass Datenanalysen direkt auf im Arbeitsspeicher (RAM) gehaltenen Daten angewendet werden. Der Arbeitsspeicher bietet deutlich höhere Zugriffsgeschwindigkeiten und einfachere Algorithmen für den Zugriff. Aus diesem Grund sind In-Memory-Datenbanken wesentlich schneller und ihre Zugriffszeiten sind besser vorhersagbar als die von auf Festplatten zugreifenden Datenbankmanagementsystemen.

VISUALISIERUNG

Die Visualisierung von Datenanalysen sollte professionell aufbereitet und leicht verständliche sein. Neben den Open-Source-Programmiersprachen R und Python, die über vielfältige Visualisierungsmöglichkeiten verfügen, verwenden wir auch interaktive Visualisierungstool von QlikTech und MicroStrategy.

GPU-PARALLEL-PROCESSING

Hochkomplexe Analysen können auch professionelle PCs und selbst moderne Server-Systeme schnell an ihre Grenzen stoßen. Wir können Datenverarbeitung von der CPU auf viele Grafikkarten bzw. deren GPUs (Graphic Processing Unit) verlagern und somit sehr rechenintensive Algorithmen auf großvolumige Datenmengen parallel anwenden.