Testdaten generieren – ein Überblick


Damit Softwaretests gelingen und Fehler frühzeitig erkannt werden, braucht es vor allem eines: valide Testdaten. Sie ermöglichen es, die Software in einer Testumgebung auf Schwachstellen zu prüfen. Was zeichnet hochwertige Testdaten aus? Und wie lassen sich diese bereitstellen? Wir geben einen Überblick.

 

Echtdaten vs. synthetische Daten

Für Softwaretest können verschiedene Arten von Testdaten herangezogen werden. Echtdaten – auch Live-Daten oder Originaldaten genannt – stammen aus der Interaktion mit realen Personen, zum Beispiel Kundinnen und Kunden, Mitarbeiterinnen und Mitarbeiter. Der Datenschutz verbietet es jedoch, diese Daten für Softwaretests zu verwenden. Sie müssen zuvor verfremdet werden.


Die Alternative sind sogenannte „synthetische Daten“. Es handelt sich dabei um künstliche Daten, die entweder manuell oder automatisch generiert werden. Sie können zum Beispiel in folgender Form vorliegen: „Vorname1, Nachname1, Strasse1“.


Synthetische Daten werden auf verschiedene Arten generiert. Die einfachste Methode ist eine manuelle Erstellung. Regelbasierte Methoden bedienen sich hingegen an bereits bestehenden Datenbanken. Am wertvollsten sind Testdaten jedoch dann, wenn sie tatsächlich neu erstellt werden. 

 

Synthetische Testdaten erstellen: Die Vorteile

  • Datenschutz: Künstliche Daten verfügen über keinerlei Verbindung zu den Live-Daten. Es lassen sich daher keine Rückschlüsse auf Personen und ihre Angaben ziehen. Synthetische Daten können daher problemlos für Softwaretests verwendet werden.
  • Große Anzahl an Daten: Häufig scheitern Tests daran, dass zu wenig Testdaten vorliegen. Ist die Generierung erst einmal aufgesetzt, ist es relativ einfach, in kurzer Zeit große Mengen an Testdaten bereitzustellen. So können Teams auch kurzfristig auf neue Anforderungen reagieren.
  • Varianz der Daten: Ist ein Modell zu sehr an einen Testdatensatz angepasst, spricht man von „Overfitting“. Die Testergebnisse sind dadurch verzerrt. Synthetische Datengenerierung ermöglicht hingegen eine höhere Varianz. Dies stellt sicher, dass sich die Testergebnisse auch auf eine Grundgesamtheit übertragen lassen.


Testdaten erstellen und verwalten – mit Hilfe praktischer Tools

Daten zu generieren, erfordert Zeit und Aufwand. Erleichtert wird dieser Prozess durch den Einsatz diverser Softwaretools. Vorab sei gesagt: Ein Tool, das fertige Daten liefert, gibt es nicht. Die Tools verfügen jedoch über eine Reihe hilfreicher Funktionen. Beispielsweise können Sie dabei unterstützen, Echtdaten zu anonymisieren, Testdaten zu verwalten und den Überblick über die einzelnen Prozessschritte zu behalten.

 

Auswahl eines Softwaretools

Wer Tools für den Umgang mit Testdaten nutzen möchte, sollte frühzeitig eine Auswahl treffen. Auf diese Weise lassen sich die Programme von Beginn an in das Gesamtkonzept integrieren.

 

Folgende Faktoren spielen für die Auswahl der Tools eine wichtige Rolle:

  • Bedienbarkeit:

Das Programm sollte einfach zu bedienen sein und Daten beispielsweise automatisch laden. Das bedeutet: Das Tool extrahiert die Daten, konvertiert sie bei Bedarf in ein anderes Format (zum Beispiel CSV) und überträgt sie in die Datenbank. Für solche Vorgänge dürfen keine Programmiersprachenkenntnisse nötig sein.

  • Flexibilität:

Das Tool sollten den Usern eine Vielzahl an Funktionen bieten. Wichtige Funktionen sind zum Beispiel die Multiplizierung und Skalierung von Testdaten, eine Nummerierung, vielfältige Berechnungsmöglichkeiten sowie die Datierung von Buchungen. Projektteams sollten die Chance haben, die Daten jederzeit ohne großen Aufwand anzupassen oder neue Daten zu ergänzen.

  • Kompatibilität:

Zudem sollte das Programm die Testdaten vor dem Laden validieren. Eine technische Prüfung beispielsweise kann verhindern, dass invalide Daten in der Datenbank landen.


Planungsphase: Mit gutem Konzept punkten

Damit Softwaretests gelingen, müssen die Testdaten in ausreichender Menge vorliegen und genau zu den Anforderungen des jeweiligen Projektes passen. Je früher diese Anforderungen bekannt sind, desto einfacher ist es, die nötigen Daten zu generieren.


Um Hindernisse zu vermeiden, sollten folgende Fragen bereits in der Planungsphase geklärt werden:

  • Welche Kriterien müssen die Testdaten erfüllen?
  • Echtdaten oder synthetische Daten – was passt besser zum jeweiligen Projekt?
  • Wer sich für Echtdaten entscheidet: Wie kann der Datenschutz sichergestellt werden?
  • Fällt die Wahl auf synthetische Daten: Welche Methode ist die richtige, um die Daten zu generieren?
  • Sind Softwaretools sinnvoll? Wenn ja: Welche passen zum Projekt?
  • Wie werden die erstellten Daten gespeichert und verwaltet?
  • Welche gesetzlichen Vorschriften sind zu beachten?


Die Konzeptionierung kann einige Zeit in Anspruch nehmen. Doch der Aufwand lohnt sich. In der Testphase können die Teams dadurch wertvolle Ressourcen sparen, Verzögerungen vermeiden und die Qualität der Ergebnisse sicherstellen.


Fazit

Valide Daten sind die Basis für erfolgreiche Softwaretests. Schließlich möchten die IT-Teams sichergehen, dass die Kundinnen und Kunden später mit dem Produkt zufrieden sind. Wer Fehlerquellen vermeiden und hochwertige, passgenaue Testdaten generieren möchte, sollte sich daher professionelle Beratung und Unterstützung holen.

Share by: