Comma-separated values




Il comma-separated values (abbreviato in CSV) è un formato di file basato su file di testo utilizzato per l'importazione ed esportazione (ad esempio da fogli elettronici o database) di una tabella di dati.


Non esiste uno standard formale che lo definisca, ma solo alcune prassi più o meno consolidate.[1]




Indice






  • 1 Descrizione del formato


    • 1.1 Carattere che separa i campi




  • 2 Esempi


  • 3 Note


  • 4 Collegamenti esterni





Descrizione del formato |


In questo formato, ogni riga della tabella (o record della base dati) è normalmente rappresentata da una linea di testo, che a sua volta è divisa in campi (le singole colonne) separati da un apposito carattere separatore, ciascuno dei quali rappresenta un valore.


Il formato CSV non specifica una codifica di caratteri, né la convenzione per indicare il fine linea (nei sistemi operativi Unix e Unix-like viene usato il carattere ASCII line-feed, nei sistemi operativi Microsoft Windows si usa la sequenza di caratteri ASCII carriage return+line-feed, mentre in altri può essere usato il solo carattere carriage return), né il carattere da usare come separatore tra campi e nemmeno convenzioni per rappresentare date o numeri (tutti i valori sono considerati come semplici stringhe di testo) e se la prima riga è solo di intestazione o meno. Questi dettagli possono dover essere specificati dall'utente tutte le volte che si importano o esportano dati in formato CSV in un programma come ad esempio un foglio elettronico.


Nel caso più semplice non sono ammessi valori che contengano caratteri di fine linea o il carattere che separa i campi: in questo caso, ad ogni riga della tabella corrisponde esattamente una linea di testo.


Per ovviare a questo limite si ricorre alla codifica che segue: se il valore contiene caratteri di fine linea, il carattere separatore o i doppi apici ("), esso viene racchiuso tra doppi apici e quelli eventualmente presenti nel valore sono raddoppiati. Ad esempio il valore


foo, "bar" 
baz

viene trasformato in


"foo, ""bar""
baz"

Con questa codifica, una riga (o record) può essere rappresentata con più linee di testo, ed in fase di importazione dei dati occorre tener conto della trasformazione effettuata per suddividerli nelle righe e colonne originarie.



Carattere che separa i campi |


Nei sistemi operativi Microsoft Windows alcuni programmi (tra cui Microsoft Excel) utilizzano come carattere separatore tra i campi il separatore di elenco specificato nelle opzioni di internazionalizzazione (nel pannello di controllo). Il valore predefinito è la virgola nei paesi anglosassoni, ed il punto e virgola nei paesi come Spagna, Italia e Francia (ove la virgola viene usata come separatore delle cifre decimali).



Esempi |




























OPERA
AUTORE
CASA EDITRICE
I Robot e l'Impero Isaac Asimov Mondadori
Il lungo meriggio della Terra Brian W. Aldiss Minotauro
Absolute OpenBSD "2d Edition" Michael W. Lucas
No Starch Press
I mercanti dello spazio Frederik Pohl; C. M. Kornbluth
Mondadori

L'esempio qui sopra si potrebbe rappresentare in CSV come:


OPERA;AUTORE;CASA EDITRICEn
I Robot e l'Impero;Isaac Asimov;Mondadorin
Il lungo meriggio della Terra;Brian W. Aldiss;Minotauron
"Absolute OpenBSD ""2d Edition""";Michael W. Lucas;No Starch Pressn
I mercanti dello spazio;"Frederik Pohl; C. M. Kornbluth";Mondadorin

Si noti che:



  1. i campi sono separati da punto e virgola e vengono racchiusi tra doppi apici se contengono virgole o punto e virgole;

  2. le linee sono separate da un carattere 'a capo' ad esempio n;

  3. è preferibile non lasciare spazi prima e dopo i campi (se intenzionali, tali spazi vanno racchiusi tra doppi apici);

  4. per rappresentare un carattere di doppio apice in un campo occorre raddoppiarlo e racchiudere il campo tra doppi apici: " diventa "";

  5. per rappresentare un'interruzione di riga in un campo, occorre racchiudere il campo tra doppi apici.



Note |




  1. ^ (EN) RFC 4180 - Common Format and MIME Type for Comma-Separated Values (CSV) Files, su tools.ietf.org. URL consultato il 14 marzo 2009.



Collegamenti esterni |


  • (EN) How To: The Comma Separated Value (CSV) File Format, su creativyst.com.

.mw-parser-output .navbox{border:1px solid #aaa;clear:both;margin:auto;padding:2px;width:100%}.mw-parser-output .navbox th{padding-left:1em;padding-right:1em;text-align:center}.mw-parser-output .navbox>tbody>tr:first-child>th{background:#ccf;font-size:90%;width:100%}.mw-parser-output .navbox_navbar{float:left;margin:0;padding:0 10px 0 0;text-align:left;width:6em}.mw-parser-output .navbox_title{font-size:110%}.mw-parser-output .navbox_abovebelow{background:#ddf;font-size:90%;font-weight:normal}.mw-parser-output .navbox_group{background:#ddf;font-size:90%;padding:0 10px;white-space:nowrap}.mw-parser-output .navbox_list{font-size:90%;width:100%}.mw-parser-output .navbox_odd{background:#fdfdfd}.mw-parser-output .navbox_even{background:#f7f7f7}.mw-parser-output .navbox_center{text-align:center}.mw-parser-output .navbox .navbox_image{padding-left:7px;vertical-align:middle;width:0}.mw-parser-output .navbox+.navbox{margin-top:-1px}.mw-parser-output .navbox .mw-collapsible-toggle{font-weight:normal;text-align:right;width:7em}.mw-parser-output .subnavbox{margin:-3px;width:100%}.mw-parser-output .subnavbox_group{background:#ddf;padding:0 10px}





















InformaticaPortale Informatica: accedi alle voci di Wikipedia che trattano di informatica



Popular posts from this blog

Список кардиналов, возведённых папой римским Каликстом III

Deduzione

Mysql.sock missing - “Can't connect to local MySQL server through socket”