Sie öffnen eine Excel-Datei mit 2.300 Zeilen Kundendaten, und wissen sofort: hier ist nichts so, wie es sein sollte. Schreibweisen wirken zufällig, Datumsangaben sind mal so, mal anders, manche Zeilen kommen doppelt vor, in anderen fehlen Pflichtfelder. Bevor man irgendetwas auswerten kann, muss aufgeräumt werden.

Datenbereinigung ist nicht spannend, aber sie ist die Voraussetzung dafür, dass spätere Auswertungen verlässlich sind. Dieser Artikel zeigt die typischen Stolperfallen und einen pragmatischen Schritt-für-Schritt-Weg, mit dem auch große Listen sauber werden, ohne komplizierte Tools.

Was „bereinigt" überhaupt heißt

Eine bereinigte Tabelle erfüllt fünf Eigenschaften:

  1. Jede Spalte hat genau einen Datentyp. Eine Spalte „Datum" enthält nur Datumswerte, nicht mal Datum, mal Freitext, mal eine leere Zelle.
  2. Schreibweisen sind einheitlich. „Wörth am Rhein" und „Woerth a. Rhein" und „Wörth/Rhein" sollen dieselbe Stadt sein, also dieselbe Schreibweise.
  3. Pflichtfelder sind gefüllt. Wo eine E-Mail Pflicht ist, darf keine Zeile ohne E-Mail vorkommen.
  4. Keine Duplikate. Jeder Eintrag kommt nur einmal vor (außer das Datenmodell sieht das vor).
  5. Eine Tabelle hat eine Bedeutung. „Kunden" ist eine Tabelle, „Aufträge" ist eine andere, nicht alles in einer einzigen „Daten"-Tabelle.

Schritt 1: Backup der Originaldaten

Bevor irgendetwas geändert wird: eine Kopie der Originaldatei speichern. Am besten mit Datum im Dateinamen (kunden-2026-05-20-original.xlsx). So lässt sich jederzeit nachvollziehen, woher ein Wert ursprünglich kam.

Schritt 2: Datentypen prüfen und vereinheitlichen

Markieren Sie eine Spalte und schauen Sie sich an, was darin steht. Häufige Stolperfallen:

  • Datumsformate. 01.05.2026, 1.5.26, 2026-05-01, "Mai 2026", alles soll dasselbe sein, ist aber für Excel komplett unterschiedlich. Spalte einheitlich auf Datum formatieren, dann Inhalte fixen.
  • Zahlen mit Punkt oder Komma. 1.234,56 vs 1,234.56 vs 1234.56, das deutsche und das US-Format sind nicht kompatibel. Spalte vereinheitlichen, am besten als Zahl ohne Tausenderpunkt speichern.
  • Telefonnummern. +49 176 12345, 0049 176 12345, 0176/12345, 017612345, alles dieselbe Nummer. Mindestens auf ein gemeinsames Format bringen (Empfehlung: +49 mit Leerzeichen).
  • E-Mail-Adressen. Klein- und Großschreibung egal, aber führende/folgende Leerzeichen sind häufig vorhanden, per TRIM entfernen.

Schritt 3: Duplikate finden und entfernen

Excel bringt eine eingebaute Funktion mit: Daten → Duplikate entfernen. Wichtig: erst überlegen, welche Spalten zusammen einen Eintrag eindeutig machen. Bei Kunden ist das oft die Kombination aus E-Mail und Telefonnummer. Bei Aufträgen ist es eine Auftragsnummer.

Tipp: Vor dem Löschen erst nach den potenziellen Duplikaten sortieren und durchscrollen. Manchmal sind die scheinbaren Duplikate eigentlich zwei verschiedene Personen mit gleichem Namen.

Schritt 4: Schreibweisen vereinheitlichen

Das ist die zeitaufwendigste Aufgabe. Pragmatischer Weg: für jede freitextliche Spalte (Stadt, Branche, Anrede etc.) einmal alle vorkommenden Werte auflisten. In Excel: Spalte markieren → Daten → Filter → das Drop-down zeigt alle Varianten.

Dann eine Mapping-Tabelle anlegen: links die Original-Schreibweisen, rechts die Soll-Schreibweise. Mit SVERWEIS oder XVERWEIS wird daraus eine neue, bereinigte Spalte.

Achtung Falle

Niemals die Originalspalte überschreiben. Immer eine neue Spalte für die bereinigte Version anlegen. So bleibt nachvollziehbar, wie aus „Woerth a.R." am Ende „Wörth am Rhein" wurde, und im Zweifel kann zurückgespult werden.

Schritt 5: Leere Pflichtfelder behandeln

Drei Optionen, abhängig vom Datenkontext:

  • Eintrag löschen, wenn das Pflichtfeld zwingend ist und der Eintrag ohne dieses Feld nutzlos ist (z. B. Kunde ohne E-Mail-Adresse)
  • Sinnvoll auffüllen, wenn der fehlende Wert mit hoher Wahrscheinlichkeit ableitbar ist (z. B. fehlende Postleitzahl bei bekanntem Ort)
  • Markieren statt löschen, z. B. mit Status „Daten unvollständig", wertvoll, wenn der Eintrag später vervollständigt werden kann

Schritt 6: Auswertbar machen

Erst nach Bereinigung kommt die Auswertung. Typische Werkzeuge in Excel:

  • Pivot-Tabellen für Aggregationen (Summe pro Monat, Anzahl pro Region)
  • Bedingte Formatierung für visuelle Auffälligkeiten (Werte über/unter Schwelle)
  • Power Query (in Excel integriert) für wiederkehrende Aufbereitungen, die monatlich gleich laufen sollen

Wann reicht Excel nicht mehr?

Es gibt eine pragmatische Grenze: ab etwa 50.000 Zeilen wird Excel langsam. Ab ~100.000 Zeilen wird es unangenehm. Wenn Sie regelmäßig in diesem Bereich arbeiten, lohnt sich der Schritt zu einer kleinen Datenbank (SQLite, MariaDB) oder zu einem Auswertungs-Tool wie Metabase. Davor reicht Excel meistens völlig.

Fazit in einem Satz

Datenbereinigung ist kein Hexenwerk, aber sie braucht Disziplin: erst Backup, dann Datentypen, dann Duplikate, dann Schreibweisen, dann fehlende Werte, immer mit neuer Spalte statt Überschreiben, damit jederzeit rückwärts gegangen werden kann.

Daten-Chaos in der eigenen Tabelle?

Senden Sie mir eine (auf Wunsch anonymisierte) Beispieldatei. Ich schaue mir die Struktur an und gebe Ihnen ehrlich Rückmeldung, ob und wie sich daraus etwas Nutzbares machen lässt, kostenfrei.