06.22
Ein wichtiger Grundsatz eines guten Datenbankdesigns ist, dass in einer Datenbank oder einer Datenbank-Tabelle keine Redundanzen vorhanden seien sollen. Man spricht dann von einer redundanzfreien Datenbank. Erreicht wird dies durch die Datenbank-Normalisierung.
In manchen Fällen ist allerdings die Performance einer Datenbank besser, wenn sie nicht (zwingend vollständig) normalisiert wird. In so einem Fall werden in der Praxis oft Redundanzen ganz bewusst in Kauf genommen, um zeit- und performanceaufwändige und komplexe Joins (Abfragen über mehrere Datenbank-Tabellen) zu verkürzen und so die Geschwindigkeit der Abfragen zu verbessern. Man spricht dabei auch von einer Denormalisierung einer Datenbank. Wann (und ob überhaupt) eine solche Denormalisierung sinnvoll ist, ist umstritten und hängt von den individuellen Umständen (evtl. schon vorhanden Daten, Migrationen usw.) ab.
Ein Merkmal der Redundanz ist, dass einzelne Werte innerhalb einer Tabelle oder Datenbank ohne Informationsverlust weggelassen werden können. Redundanzen verursachen nicht nur unnötigen Speicherplatz, sondern können auch die Ursache für Anomalien (z. B. Update-, Insert-, Delete-Anomalien) sein. Diese werden auch “Mutationsanomalien” genannt.
Definition: der Redundanz
Der Begriff der Redundanz in der Informationstheorie gibt an, wie viel Information im Mittel pro Zeichen in einer Informationsquelle mehrfach vorhanden ist. Eine Informationseinheit ist dann redundant, wenn sie ohne Informationsverlust weggelassen werden kann. Das Identifizieren und Entfernen solcher Redundanzen heißt Deduplizierung.
(Quelle: Wikipedia)
No Comment.
Add Your Comment