Sobre o CSV

O CSV é um formato de ficheiro de texto, é uma abreviatura para "Comma-Separated Values" (Valores Separados por Vírgulas). É uma forma bem simples de armazenar dados, onde cada entrada da tabela está numa só linha e os valores estão listados um a seguir ao outro com uma vírgula entre cada um.

Os nossos produtos têm uma capacidade de leitura e escrita muito rápida! Não são precisos drivers uma vez que desenvolvemos a nossa própria tecnologia otimizada para CSV.

Quando o próprio valor contém vírgulas, por exemplo no caso de um texto, esse valor deve estar dentro de aspas. Sendo um formato tão simples muitos aplicativos escrevem de formas diferentes. Algumas colocam cada valor dentro de aspas, outras colocam aspas apenas em valores que tenham vírgulas, outras colocam aspas em todos os valores textuais, etc. Existem várias formas de codificação - alguns aplicativos precedem as frases com uma barra invertida, algumas usam duas aspas seguidas. Os valores dos ficheiros CSV podem de fato ser delimitados por um caractere diferente da vírgula - frequentemente é usado o caractere TAB (ASCII valor 9). Dependendo se o ficheiro é escrito em Windows ou Linux/Unix/Mac, as linhas podem ser escritas por dois caracteres (ASCII 13, e depois 10) ou apenas um caractere (ASCII 10). Você não deve armazenar texto com várias linhas em ficheiros CSV, pois irá detectar prematuramente o fim do registro.

Analisar CSV é muito fácil. Analisar todas as variáveis possíveis não é uma coisa trivial.

Desenvolvemos o nosso próprio analisador de CSV e usamos uma suíte de testes para garantir que suporta as diferenças comuns entre os ficheiros CSV usados. Apesar de o formato CSV não conter campos de metadados, analisamos os dados e determinamos o tipo de dados ótimo para cada campo.

O CSV tornou-se padrão na troca de dados e muitos aplicativos permitem exportar os dados em formato CSV. Esses ficheiros podem possuir um tamanho muito grande. Os nossos aplicativos permitem ler e escrever em modo streaming, assim nunca temos de carregar todo o ficheiro na memória - o que significa que conseguimos trabalhar com ficheiros CSV enormes, muitas vezes com vários gigabytes. Não temos sequer um limite para o tamanho do ficheiro. Ficheiros maiores demoram mais tempo para processar, mas ainda assim conseguimos suportar qualquer tamanho de ficheiro.