RekenaarsLêertipes

Die formaat van CSV, of waar die komma te sit?

Onder die programme, in die gesig gestaar indien nie 'n programmeerder, dit is reeds 'n gevorderde gebruiker, data invoer van 'n program na 'n ander nie baie selde voorkom. En dikwels is dit nodig om 'n tabel data, wat, in werklikheid, is geskep deur CSV formaat invoer. Wat ontwikkel verskeie alternatiewe oplossings (XML leier onder hulle). Maar die skepping van die CSV, in sommige gevalle, is die mees geskikte oplossing, en 'n paar - die mees problematiese.

Dit staan vir die naam van die formaat soos 'n commaseparatedvalues - deur kommas geskei waardes. In Notepad lêer as volg:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (aan die einde van 'n teken te sit nie vereis)

En in 'n Excel spreadsheet of 'n soortgelyke aansoek reeds so:

00 01 02 03
01 15 34 11
16 27 33 06

Maar nou bespreek ons die eenvoudigste geval. Probleme begin net as gevolg van die feit dat as gevolg van baie saamgeperste data verslagdoening, CSV formaat word gebruik om die oordrag van groot hoeveelhede inligting. Die meeste dikwels in die databasisse van diverse waardes: numeriese, alfa, alfanumeriese, met ruimtes, ens Dikwels in groot skikkings is foute, en as, byvoorbeeld, iewers sal 'n ekstra komma in die inhoud van een van die velde wees, kan al die selle word verplaas deur een.

Oor die algemeen, probleme ontstaan wanneer data ingevoer word via die lêer formaat CSV, kan verdeel word in drie kategorieë:

1 - Verkeerde vul velde.

2 - Verkeerde data omskakeling wanneer die redding van 'n lêer te CSV.

3 - Verkeerde erkenning invoerder program formaat.

Die eerste geval het ons gedeeltelik ondersoek. Om die probleem te bekamp, moet jy 'n manier om die monitering van die korrektheid van die ingevoerde data te voorsien. Byvoorbeeld, as jy nodig het om 'n databasis van adresse vir die poslys in te samel, is daar spesiale skrifte wat kontroleer of 'n persoon die e-pos in die korrekte formaat aangegaan het. Waar daar gapings, kommas, en enige ander data wat verkeerd gelees kan word, moet die inhoud van die veld word in aanhalingstekens (sogenaamde rekenaar "").

Die tweede geval is in verband met die keuse van enkodering. Nodig het om uit te vind is dikwels ervaar wat enkodering verkies invoer program. In Windows algemeen gebruik in 1251, so as die oorspronklike lêer van die teks sal voldoen aan Unicode, volg dit sal vertoon in die bestemming aansoek as 'n ketting van vrae. In Excel, kan jy bespaar in CSV formaat met ander enkodering en delimiter (behalwe die punt nog in gebruik blad, en kommapunt), maar dit is die beste om 'n lêer in Notepad ++ of OpenOfficeCalc skep.

Die derde geval - 'n gevolg van die tweede. Histories, die CSV formaat het geen eenvormige standaard. Baie programme word gesien as 'n CSV-lêer formate as TSV (-blad geskei) en SCSV (geskei deur kommapunte), in die besonder omdat die lêer uitbreiding nie die volgende in te lig oor hierdie. In hierdie geval, is data verkeerd gelees en is nie onder die selle in die korrekte volgorde toegeken. Die beste ding wat ons kan raad gee - 'n CSV-lêer persoonlik te skep. Soos reeds genoem, is dit nodig om voordeel te trek uit 'n gerieflike redakteur.

Truuks hoe om die formaat CSV, bekend programmeerders in toom te hou. Eenvoudige gebruiker moet voldoen aan ons aanbevelings vir die skep van 'n lêer. Minste van al die probleme ontstaan wanneer die lêer spesifiek geskep vir die invoer van 'n spesifieke toepassing (en soms in 'n ander manier). Dis makliker om in ag neem al die moontlike probleme in die data.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 af.atomiyme.com. Theme powered by WordPress.