Über CSV

CSV ist ein Textdateiformat und steht für Comma-Separated Values. Es ist eine sehr einfache Art, Daten zu speichern, wobei jeder Datensatz in einer Zeile ist und alle Werte hintereinander aufgelistet werden, jeweils mit Kommata getrennt.

In unseren Produkten unterstützen wir sehr schnelles CSV-Einlesen und -Schreiben! Es werden keine Treiber benötigt, da wir unsere eigene hochoptimierte CSV-Datei-Technologie entwickelt haben.

Wenn ein Wert selbst Kommata enthält, wie es bei einem Text der Fall ist, muss der Wert in Anführungszeichen stehen. Da es sich um so ein simples Format handelt, schreiben viele Anwendungen unvermeidlich in einer leicht abgewandelten Form in diesem Format. Einige setzen alle Werte in Anführungszeichen, andere nur die Werte, die Kommata enthalten, und wiederum andere verwenden zwei Anführungszeichen hintereinander. Es gibt verschiedene kodierte Anführungszeichen - einige Anwendungen stellen verschachtelten Anführungszeichen ein Backslash-Zeichen voran, andere verwenden zwei Anführungszeichen hintereinander. Die Werte der CSV-Datei können neben dem Komma auch mit anderen Zeichen abgegrenzt werden - es wird oft das Tabulator-Zeichen verwendet (ASCII Wert 9). Je nachdem, ob ein Windows- oder Linux-/Unix-/Mac-System die Datei schreibt, können die Zeilen mit zwei Zeichen (ASCII 13, dann 10) oder mit einem einzigen Zeichen (ASCII 10) geschrieben werden. Sie sollten in den CSV-Dateien keine mehrzeilige Textdaten speichern, weil Sie vorzeitig zum Ende des Datensatzes gelangen werden.

Das Parsing von CSV ist sehr einfach. Und es ist ganz und gar nicht unbedeutend, alle möglichen bestehenden Varianten zu zerteilen.

Wir haben unseren eigenen CSV-Parser entwickelt und setzen eine umfassende Testsuite ein, um sicherzustellen, dass er die geläufigen Unterschiede in den CSV-Dateien unserer Nutzer bewältigen kann. Auch wenn das CSV-Format keine Metadaten mit Feldtypen enthält, analysieren wir die Daten und bestimmen den optimalen Datentyp für jedes Feld.

CSV ist in der Praxis ein Standard des Datenaustauschs und viele Anwendungen ermöglichen den Datenexport in einem CSV-Format. Solche Dateien können immer größer werden. Unsere Anwendungen können im Streaming-Modus CSV sowohl lesen als auch schreiben, sodass wir niemals komplette große Dateien auf unseren Speicher laden müssen. Dementsprechend können wir auch ganz leicht mit riesigen CSV-Dateien arbeiten, Dateien, die viele Gigabytes groß sind. Wir begrenzen auch nicht die Dateigröße. Es dauert zwar länger, größere Dateien zu verarbeiten, aber generell können wir jede Dateigröße bearbeiten.