Pandas-sarja CSV:ksi

Pandas Sarja Csv Ksi



Pandasin 'Series.to_csv()' -menetelmä tulostaa määritetyn sarjaobjektin pilkuilla erotettujen arvojen (csv) merkinnällä. Tämä toiminto yksinkertaisesti ottaa arvot sarjasta ja muuttaa niiden muotoa lisäämällä pilkkuja indeksi- ja sarakearvojen erottamiseksi.

Käyttääksemme tätä funktiota meidän on käytettävä seuraavaa syntaksia:









Tämä artikkeli tarjoaa sinulle kaksi erilaista tekniikkaa, joiden avulla voit oppia tapoja käyttää tätä menetelmää python-ohjelmassa.



Esimerkki 1: Series.to_csv()-menetelmän käyttäminen DatetimeIndex-sarjan muuntamiseen pilkuilla erotetuiksi arvoiksi

Muokkaaksemme sarjan CSV-muotoon käytämme 'Series.to_csv()' -toimintoa. Tämä kuva luo sarjan, jossa on DatetimeIndex, ja muuntaa sen sitten pilkuilla eroteltujen arvojen muotoon.





Tämän menetelmän käyttöönottamiseksi meillä on oltava työkalu, joka tukee python-ohjelmointia. 'Spyder' -työkalu on valittu koodien kokoamiseen. Skriptin kirjoittamiseksi käynnistimme ensin asennetun työkalun järjestelmäämme. Python-ohjelma tarvitsee kirjaston käyttääkseen menetelmiään vaaditun tuloksen saavuttamiseksi. Tänne lataamamme kirjasto on 'Pandas'. Samalla koodirivillä tämän kirjaston alias on tunnistettu 'pd'. Joten missä tahansa ohjelmassa meidän on kirjoitettava 'pandas' päästäksemme funktioon. Sen sijaan kirjoittaisimme 'pd'.

Ensimmäinen askel koodilla aloitettaessa on luoda Pandas-sarja. Meidän on kirjoitettava 'pd' käyttääksemme sarjanluontimenetelmää pandoilta. Funktiota 'pd.Series()' kutsutaan muodostamaan sarja määritetyillä arvoilla. Sarjalle tarjoamamme arvot ovat 'Istanbul', 'Izmir', 'Ankara', 'Ankara', 'Antalya', 'Konya' ja 'Bursa'. Jos haluat antaa tälle arvojoukolle nimen, voit tehdä sen käyttämällä 'name'-parametria. Tässä olemme nimenneet tämän arvojoukon 'kaupungeiksi', koska se sisältää kuuden kaupungin nimet. Tämän sarjan tallentamista varten on luotu sarjaobjekti 'Turkki'.



DatetimeIndexin luomiseksi olemme käyttäneet menetelmää 'pd.date_range()'. Tämän funktion sulkeiden väliin olemme syöttäneet 4 argumenttia, jotka ovat: 'aloitus', 'taajuus', 'jaksot' ja 'tz'.

'Alku'-argumentti ottaa päivämäärän ja kellonajan aloittaakseen ajanjakson luomisen siitä. Tässä olemme määrittäneet aloituspäivämääräksi ja kellonajan '2022-03-02 02:30'. 'freq'-parametri luokittelee ajanjakson tiheyden. Joten annoimme sille arvon 'D'. Nyt se luo ajanjakson päivittäiselle taajuudelle. 'Kakso'-argumentti on asetettu arvoon '6', mikä tarkoittaa, että se luo ajanjakson 6 päiväksi. Viimeinen parametri on 'tz', joka määrittää aikavyöhykkeen määritetylle alueelle. Olemme määrittäneet aikavyöhykkeen 'Aasia/Istanbul'.

Tämän ajanjakson tallentamiseksi olemme luoneet muuttujan Datetime-muuttujan. DatetimeIndexin asettamiseen olemme käyttäneet 'Series.index' -ominaisuutta. Sarjan nimi 'Turkki' toimitetaan '.index'-ominaisuuden kanssa ja sille on määritetty 'Datetime'-muuttujaan tallennettu päivämäärä-aika-alue. Siten 'indeksi'-ominaisuus ottaa arvot 'Datetime'-muuttujasta ja tekee niistä 'Turkki'-sarjan indeksiluettelon. Lopuksi tulossarjojen tarkastelemiseksi olemme käyttäneet 'print()'-menetelmää ja siirtäneet 'Turkki'-sarjan syötteeksi sen sisällön näyttämiseksi.

Painoimme vain 'Suorita tiedosto' -vaihtoehtoa komentosarjan suorittamiseksi. Näin ollen voimme nähdä sarjan DatetimeIndexillä, joka alkaa '2022-03-02 02:30:00+03:00' ja päättyy '2022-03-07 02:30:00+03:00' luo jakson. 6 päivästä. Sarjan alapuolella mainitaan myös 'Freq :D', taulukkoluettelon nimi 'Cities' ja dtype 'object'.

Nyt opimme muuttamaan tämän sarjan, jonka juuri näimme yllä olevassa tilannekuvassa, CSV-muotoon. Sarjan muokkaamiseksi pilkuilla erotetuiksi arvoiksi pandas-moduuli tarjoaa menetelmän, joka on 'Series.to_csv()'. Tämä menetelmä ottaa tarjotun sarjan arvot ja lisää pilkut sarakkeen arvojen väliin.

'Series.to_csv()'-funktiota kutsutaan. Sen sarjan nimi, jonka haluamme muuntaa, mainitaan menetelmällä 'Turkey.to_csv()'. Pilkuilla erotettujen arvojen säilyttämiseksi olemme luoneet muuttujan 'Comma_Separated' ja lisänneet sen sisällön tulosikkunaan käynnistämällä 'print()'-funktion.

Tässä on sarjamme csv-muodossa. Näemme tilannekuvassa, että indeksi- ja sarja-arvot on erotettu toisistaan ​​pilkuilla.

Esimerkki 2: Series.to_csv()-menetelmän käyttäminen NaN-arvoja sisältävän sarjan muuntamiseksi pilkuilla erotetuiksi arvoiksi

Toinen tekniikka 'Series.to_csv()' -menetelmän käyttämiseen on käyttää tätä menetelmää muuntaaksesi sarja, jossa on joitakin nollamerkintöjä, CSV-muotoon.

Olemme aluksi tuoneet tarvittavat paketit maahan. 'pd' on tehty aliakseksi pandoille ja 'np' aliakselle numpylle. Numpy työkalupakki ladataan tähän, koska teemme joitain nollamerkintöjä sarjaamme käyttämällä 'np.NaN' samalla kun luomme sen käyttämällä pandas 'pd.Series()' -menetelmää.

Funktiota 'pd.Series()' kutsutaan pandasarjan rakentamiseen seuraavilla arvoilla: 'Nile', 'Amazon', np.NaN, 'Ganges', 'Mississippi', 'np.NaN', 'Yangtze', 'Donaube', 'Mekong', 'np.NaN' ja 'Volga'. Sarjalle on määritetty yhteensä 21 arvoa, joista 3 merkinnällä on 'np.NaN'-arvot, mikä tarkoittaa, että 3 arvoa puuttuu sarjasta. Ominaisuus 'nimi' määrittää nimen tälle arvojoukolle, jonka annoimme 'Titles'. 'Index'-ominaisuutta käytetään asettamaan käyttäjän määrittelemä hakemistoluettelo oletusluettelon sijaan.

Täällä haluamme indeksiluettelon arvoilla '10', '11', '12', '13', '14', '16', '17', '18', '19', '20', ja 21'. Nyt sarjassamme on indeksiluettelo, joka alkaa numerosta 10 numeron 0 sijaan. Tallenna nyt tämä sarja, jotta voimme käyttää sitä myöhemmin ohjelmassa. Olemme alustaneet sarjaobjektin 'Rivers' ja jakaneet sille lähtösarjan, joka on luotu kutsumalla 'pd.Series()'-metodia. Sarja voidaan nähdä asettamalla se näyttöön pythonin 'print()'-funktiolla.

Päätteen renderöity tulos tulostaa sarjan, jonka indeksilista alkaa numerosta 10 ja päättyy numeroon 21, mikä tarkoittaa, että sarjassa on 21 arvoa.

Sarja muunnetaan CSV-muotoon 'Series.to_csv()' -menetelmällä.

Olemme käyttäneet 'Series.to_csv()' -menetelmää sarjassamme 'Turkki'. Siksi tämä menetelmä ottaa arvot 'Turkki'-sarjasta ja muuntaa ne pilkuilla eroteltujen arvojen muotoon. Tulos tallennetaan Converted_csv-muuttujaan. Ja lopuksi muunnettu sarja tulostetaan 'print()'-funktion avulla.

Alla olevassa tuloksen tilannekuvassa näet, että sarjan arvoja on nyt muutettu siten, että ne erotetaan indeksiluettelosta pilkulla. Lisäksi, jos arvot puuttuvat, vain indeksinumero painetaan pilkulla.

Johtopäätös

Pandas-sarjan muuntaminen CSV-muotoon on käytännöllinen lähestymistapa. Tämä voidaan saavuttaa käyttämällä panda-toimintoa 'Series.to_csv()'. Tämä opas toi käytännössä kaksi tekniikkaa tämän menetelmän käyttämiseksi. Ensimmäisessä kuvassa olemme käyttäneet tätä menetelmää DatetimeIndex-sarjan muuntamiseksi pilkuilla eroteltujen arvojen muotoon. 2. esiintymä käytti 'Series.to_csv()'  -funktiota muuttaakseen sarjan, jossa oli joitakin puuttuvia merkintöjä, CSV-muotoon. Molemmat tekniikat on käytännössä toteutettu 'Spyder'-työkalulla Windows-käyttöjärjestelmässä.