Su CSV

CSV è un formato file basato su file di testo, abbreviazione che sta per Comma-Separated Values. E’ un modo molto semplice per archiviare dati, perché ogni record delle tavole è rappresentato da una linea e i valori sono elencati uno dopo l’altro separati dalla virgola.

I nostri prodotti supportano CSV in lettura e in scrittura molto velocemente! Non sono necessari driver in quanto abbiamo sviluppato la nostra tecnologia di file CSV altamente ottimizzata.

Quando un valore contiene esso stesso delle virgole, come nel caso di un testo, il valore deve essere messo tra virgolette. Essendo un formato così semplice, inevitabilmente molte applicazioni lo scrivono in un modo leggermente diverso. Alcuni mettono tra virgolette ogni valore, altri solo i valori contenenti virgolette, alcuni mettono tra virgolette tutti i valori di testo ecc. Esistono segni di citazioni di codifica differenti – alcune applicazioni usano segni di citazione nidificati con backslash, altre due segni di citazione uno dopo l’altro. I valori dei file CSV possono infatti essere delimitati con un carattere diverso dalla virgola – spesso viene usato il carattere TAB (ASCII valore 9). A seconda che sia il sistema Windows o Linux/Unix/Mac a scrivere il file, le linee possono essere scritte da due caratteri (ASCII 13, poi 10) o un singolo carattere (ASCII 10). Non dovresti archiviare dati di testo multilinea in file CSV, perché verrà riconosciuta prematuramente la fine del record.

L’analisi di CSV è molto semplice. L’analisi di tutte le possibili varianti non è per niente facile.

Abbiamo sviluppato un nostro parser CSV e abbiamo fatto una serie di prove per accertarci che sia in grado di gestire differenze comuni nei file CSV dei nostri utenti. Sebbene il formato CSV non contenga metadata con tipi di campo, noi analizziamo i dati e determiniamo il tipo di dato ottimale di ogni campo.

CSV è de-facto uno standard nello scambio di dati e molte applicazioni permettono di esportare dati in formato CSV. Questi file possono crescere molto di dimensione. Le nostre applicazioni possono sia leggere che scrivere CSV in modalità streaming, quindi non è mai necessario caricare l’intero file grande nella memoria – ciò significa che possiamo facilmente gestire enormi file CSV di molti gigabyte. Addirittura non imponiamo alcun limite nella dimensione del file. File più grandi impiegheranno più tempo per essere processati, ma generalmente possiamo gestire ogni dimensione di file.