XLSX:stä CSV:hen Pythonissa

Xlsx Sta Csv Hen Pythonissa



Python on viime vuosina noussut yhdeksi hallitsevista ohjelmointikielistä. Python-yhteisö on laajentunut merkittävästi Pythonin suosion ja hyödyllisyyden ansiosta. Tässä artikkelissa käsitellään yksityiskohtaisesti Pythonin käyttämistä XLSX:n muuntamiseen CSV:ksi. Tiedämme, että Excel-tiedostoja käytetään usein talousanalyysien suorittamiseen, tietojen järjestämiseen, tietojen syöttämiseen, kirjanpitoon, tiedonhallintaan, kaavioiden ja kaavioiden luomiseen jne. Käytämme kuitenkin mieluummin CSV-tiedostoja tietojen tuontiin ja vientiin. Yksi tapa on siirtää strukturoidut tiedot pelkällä tekstitiedostolla.

Mikä on Xslx-tiedosto?

Tehdessään laskentataulukoita Excelin uusimmissa versioissa Microsoft käyttää XLSX-tiedostoa oletustiedostotyyppinä. Kuten Wordin DOCX-tiedostotyyppi, voimme avata XLSX-tiedostoja käyttämällä erilaisia ​​​​sovelluksia / ohjelmia.

Mikä on CSV-tiedosto?

CSV-tiedostomuotoa voimme käyttää taulukkomuotoisten tietoarvojen tallentamiseen laskentataulukoihin ja tietokantoihin. Taulukkotiedot, teksti tai teksti, tallennetaan pelkkänä tekstinä CSV-tiedostoon. CSV-tiedoston tietue on tiedoston jokaiselle riville tallennettu tietoarvo. Jokaisessa tietueessa voi olla useampi kuin yksi pilkuilla erotettu kenttä.







Tärkeimmät erot XLSX- ja CSV-tiedostojen välillä

Käyttäjät käyttävät usein CSV:tä ja XLSX:ää vaihtokelpoisesti, eivätkä he yleensä tiedä niiden välisiä eroja, niiden perusominaisuuksia ja niiden toimintaa. Se toimii vain tiedon lähteenä käyttäjälle. Lähes jokainen yritys ja yritys käyttää molempia auttamaan käyttäjiä tietojen hallinnassa, päivittämisessä ja tallentamisessa. Seuraavassa on joitain keskeisiä eroja XLSX- ja CSV-tiedostojen välillä, jotka sinun pitäisi tietää:



  • CSV-muoto tallentaa taulukkomuotoiset tiedot erotintekstitiedostoon, jonka tunniste on .csv. Kun taas excel- tai XLSX-tiedosto on laskentataulukko, joka tallentaa tiedostot sen omassa muodossa, eli. xls tai XLSX.
  • Excel-tiedostot ovat binääritiedostoja, jotka sisältävät jokaisen työkirjan laskentataulukon tiedot. CSV on yksinkertainen ja yksinkertainen tekstimuoto, jossa on pilkuilla erotettu tietoarvosarja.
  • Datatoimintoja ei voi suorittaa CSV-tiedostoille. Ne voidaan kuitenkin suorittaa Excel-tiedostoilla.
  • CSV-tiedostot ovat nopeampia ja käyttävät vähemmän muistia kuin XLSX-tiedostot. Excel käyttää kuitenkin enemmän muistia tuodessaan tietoja.
  • Jos vertaamme CSV:tä Exceliin, voimme avata CSV-tiedostot missä tahansa Windowsin tekstieditorissa, kun taas Excel-tiedostot eivät.

Kuinka XLSX-tiedosto voidaan muuntaa CSV-muotoon Pythonilla?

XLSX-tiedosto voidaan muuntaa CSV-tiedostoksi Pythonissa useilla eri tavoilla. Python sisältää useita moduuleja ja toimintoja, jotka voivat auttaa meitä tämän tehtävän suorittamisessa. Tässä käymme läpi pari menetelmää, joita voidaan käyttää XLSX-tiedostojen muuntamiseen CSV-tiedostoiksi Pythonissa.



Edellytykset Excel-CSV-muunnoksen suorittamiseen

Vaatimusten asentaminen on ensimmäinen askel. Käytämme tässä opetusohjelmassa moduuleja, kuten yhdistää Pandas, CSV ja Openpyxl jne. Pythonin Pandas-paketti mahdollistaa tietojen manipuloinnin ja analysoinnin. Pandas on Python-ohjelmoijien keskuudessa tunnettu kirjasto. Excel-tiedostoja voidaan lukea ja kirjoittaa Python-paketilla, joka tunnetaan nimellä Openpyxl. Emme ole tekemisissä tämän kirjaston kanssa suoraan. Pandat käyttävät sen sijaan Openpyxliä sisäisesti.





PyPI-varaston avulla voimme asentaa molemmat paketit:

Tapa 1: XLSX:n muuntaminen CSV:ksi Pandas-moduulin avulla

Esimerkki 1: Yhden XLSX-tiedoston muuntaminen CSV-muotoon



Pandas on avoimen lähdekoodin moduuli, joka on luotu Python-ohjelmointikielelle tietojen käsittelyä ja analysointia varten. Pandat tarjoavat erilaisia ​​toimintoja ja ominaisuuksia työskennelläkseen aikasarjojen ja numeeristen taulukoiden kanssa. Pandoilla voidaan lukea, suodattaa ja järjestää uudelleen sekä pieniä että suuria tietojoukkoja. Ja tulokset voidaan tuottaa useissa muodoissa, kuten Excel, JSON ja CSV. Käytämme Pandasin read_excel()-menetelmää excel-tiedoston lukemiseen ja to_csv()-menetelmää DataFramen muuntamiseen CSV-tiedostoksi.

Tulostamme .csv-tiedostomme DataFrame-kehyksenä, kuten tulosteesta näkyy. Edellinen komentosarja muuntaa XLSX-tiedostomme CSV-muotoon ja luo 'salary.csv'-tiedoston nykyiseen hakemistoon.

Esimerkki 2: XLSX-tiedoston (jossa on useita taulukoita) muuntaminen CSV-muotoon

Seuraavassa esimerkissä luemme ensin Excel-tiedoston arkkien nimet. Yksittäisten taulukkojen nimet silmukataan ja tallennetaan erillisinä CSV-tiedostoina. Skripti tallentaa CSV-tiedostot samaan paikkaan.

Käytämme XLSX-mallitiedostoa, jossa on kaksi tai useampia laskentataulukoita tai laskentataulukoita.

Kuten voidaan nähdä, XLSX-tiedostomme koostuu kahdesta arkista (arkki1 ja arkki2). Nyt kirjoitamme koodin tämän XLSX-tiedoston muuntamiseksi CSV-muotoon.

Lähtö:

Komentosarja muunsi onnistuneesti kahden arkin XLSX-tiedoston yhdeksi CSV-tiedostoksi, jossa on yksi arkki.

Esimerkki 3: Useiden XLSX-tiedostojen muuntaminen erillisiksi CSV-tiedostoiksi

Harkitse tilannetta, jossa sinun on muutettava useita työhakemistossasi olevia Excel-tiedostoja CSV-muotoon. Voit käyttää tätä menetelmää. Aloitamme olettamalla, että jokainen tiedosto sisältää vain yhden arkin. Sitten laajennamme menetelmäämme käsittelemään useita tiedostoja ja useita arkkeja. Seuraava Python-koodi käyttää glob-standardimoduulia. Yhdistämme tiedostopolut käyttämällä kuvioita Globin kanssa. Se vastaa kaikkia tiedostoja, joiden tiedostotunniste on .xlsx työhakemistossa. Sen jälkeen kehitämme toiminnon, joka lukee Excel-tiedostot ja tallentaa ne CSV-tiedostoina. Kutsumme tätä funktiota jokaisessa löydetyssä tiedostopolussa.

Tämä edellinen komentosarja muuntaa kaikki nykyisen hakemiston xlsx-tiedostot CSV-tiedostoiksi.

Nyt muunnamme useita laskentataulukoita sisältävät XLSX-tiedostot CSV-muotoon. Tämä on todennäköisesti se vaikein osa. Työhakemistossamme on kolme Excel-tiedostoa. Jotkut niistä koostuvat myös useammasta kuin yhdestä arkista. Pyrimme:

  1. Luo hakemisto jokaiselle laskentataulukkotiedostolle,
  2. Muunna Excel-tiedostot CSV-muotoon ja ne tulee säilyttää äskettäin luodussa hakemistossa.

Komentosarja muuntaa yhden ja usean arkin XLSX:n erillisiksi CSV-tiedostoiksi ja tallentaa ne uusiin samannimiin hakemistoihin.

Kaikkien nykyisessä hakemistossa olevien Excel-tiedostojen noutamiseen käytetään glob-funktiota. Tämän jälkeen jokaiselle XLSX-tiedostolle luodaan kansiot os.mkdir-funktiolla. CSV-tiedosto luodaan sitten kullekin uuden hakemiston arkille kiertämällä arkin nimen yli.

Tapa 2: XLSX:n muuntaminen CSV:ksi Openpyxl- ja CSV-moduuleilla

Tässä menetelmässä käytämme openpyxl- ja CSV-moduuleja XLSX-tiedostojen muuntamiseen CSV-muotoon. 2010 xlsx-, xlsm-, xltx- ja xltm-tiedostojen lukemiseen ja kirjoittamiseen voidaan käyttää Python-moduulia openpyxl. CSV-moduuli sisältää luokat, jotka mahdollistavat CSV-muotoisten taulukkotietojen lukemisen ja kirjoittamisen.

xlsx-tiedoston lukemiseen tai lataamiseen käytämme openpyxl-moduulin load_workbook()-funktiota. Voit käyttää tätä toimintoa, jos sinun on kirjoitettava tai luettava olemassa oleva XLSX/Excel-tiedosto Pythonissa. Excelin aktivoinnin jälkeen käytämme csv.writer()-funktiota CSV-tiedoston luomiseen. Sitten for-silmukkaa käytetään tietojen tallentamiseen CSV-tiedoston tietosoluihin. Muunnamme esimerkki.xlsx-tiedostomme tiedostoksi myfile.csv, kuten seuraavasta kuvasta näkyy:

Johtopäätös

Tässä opetusohjelmassa annoimme sinulle lyhyen johdannon XLSX- ja CSV-tiedostoihin. Selitimme tärkeimmät erot molempien tiedostomuotojen välillä. Keskustelimme kahdesta menetelmästä useilla esimerkeillä opettaaksemme, kuinka yhden tai useamman arkin XLSX-tiedostot voidaan muuntaa CSV-tiedostoiksi. Otimme käyttöön esimerkin useiden XLSX-tiedostojen muuntamisesta CSV-tiedostoiksi samanaikaisesti. Tietojen muuntaminen Excelistä CSV-muotoon voi olla yksinkertaista tai vaikeaa. Jos sinulla on vain yksi tiedosto, jossa on pieni määrä arkkeja, se on helppoa. Mutta jos ei, se voi olla vaikeaa.