Excelin (xlsx) tiedoston lukeminen pythonissa

How Read Excel File Python



The .xlsx on Excel -asiakirjan laajennus, joka voi tallentaa suuren määrän tietoja taulukkomuodossa, ja monenlaiset aritmeettiset ja loogiset laskelmat voidaan tehdä helposti Excel -laskentataulukossa. Joskus Excel -asiakirjan tiedot on luettava käyttämällä Python -komentosarjaa ohjelmointitarkoituksiin. Pythonissa on monia moduuleja Excel -asiakirjan lukemiseen. Jotkut hyödyllisistä moduuleista ovat xlrd , openpyxl ja pandat . Tässä opetusohjelmassa on esitetty tapoja käyttää näitä moduuleja Excel -tiedoston lukemiseen Pythonissa.

Edellytys:

Tämän opetusohjelman esimerkkien tarkistamiseen tarvitaan nukke Excel -tiedosto, jonka laajennus on .xlsx. Voit käyttää mitä tahansa Excel -tiedostoa tai luoda uuden. Tässä uusi Excel -tiedosto nimeltä myynti.xlsx tiedosto on luotu seuraavilla tiedoilla. Tätä tiedostoa on käytetty lukemiseen käyttämällä erilaisia ​​python -moduuleja tämän opetusohjelman seuraavassa osassa.







myynti.xlsx



Myyntipäivä Myyjä Määrä
05/12/18 Sila Ahmed 60000
12.6.19 Minä Hossain 50000
08/09/20 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Esimerkki 1: Lue Excel-tiedosto xlrd: llä

Xlrd -moduulia ei ole oletusarvoisesti asennettu Pythoniin. Joten sinun on asennettava moduuli ennen sen käyttöä. Tämän moduulin uusin versio ei tue Excel -tiedostoa, jonka laajennus on .xlsx. Joten sinun on asennettava tämän moduulin 1.2.0 -versio, jotta voit lukea xlsx -tiedoston. Asenna tarvittava versio suorittamalla seuraava komento päätelaitteesta xlrd .



$pipAsentaa xlrd== 1.2.0

Kun olet suorittanut asennusprosessin, luo python -tiedosto, jossa on seuraava komentosarja, jotta voit lukea myynti.xlsx tiedostoa käyttämällä xlrd moduuli. open_workbook () -toimintoa käytetään skriptissä, avaa xlsx -tiedosto lukemista varten. Tämä Excel -tiedosto sisältää vain yhden taulukon. Joten workbook.sheet_by_index () -toimintoa on käytetty skriptissä argumentin arvolla 0. Seuraavaksi sisäkkäin 'Puolesta' silmukka on lukenut laskentataulukon soluarvot käyttämällä rivi- ja sarakearvoja. Skriptissä on käytetty kahta alue () -funktiota rivin ja sarakkeen koon määrittämiseen taulukon tietojen perusteella. The cell_value () toiminto on lukenut taulukon tietyn solun arvon jokaisessa silmukan iteraatiossa. Tuloksen jokainen kenttä erotetaan yhdellä välilehdellä.





# Tuo xlrd -moduuli
tuoda xlrd

# Avaa työkirja
työkirja = xlrd.open_työkirja('sales.xlsx')

# Avaa laskentataulukko
laskentataulukko = työkirja.sheet_by_index(0)

# Toista rivejä ja sarakkeita
vartenisisäänvalikoima(0,5):
vartenjsisäänvalikoima(0,3):
# Tulosta solujen arvot välilehdellä
Tulosta(laskentataulukko.solun_arvo(minä, j),loppuun=' t')
Tulosta('')

Lähtö:

Seuraava tulos tulee näkyviin yllä olevan komentosarjan suorittamisen jälkeen.



Esimerkki 2: Lue Excel-tiedosto openpyxl: llä

The openpyxl on toinen python -moduuli xlsx -tiedoston lukemiseen, eikä sitä myöskään ole asennettu Pythonin kanssa oletuksena. Asenna tämä moduuli suorittamalla seuraava komento päätelaitteesta ennen sen käyttöä.

$pipAsentaaopenpyxl

Kun olet suorittanut asennusprosessin, luo python -tiedosto, jossa on seuraava komentosarja, jotta voit lukea myynti.xlsx tiedosto. Kuten xlrd -moduuli, openpyxl moduulissa on load_workbook () -toiminto avaa xlsx -tiedoston lukemista varten. The myynti.xlsx tiedostoa käytetään tämän funktion argumentti -arvona. Kohteen wookbook.aktiivinen on luotu komentosarjassa lukemaan max_row ja max_sarake ominaisuudet. Näitä ominaisuuksia on käytetty sisäkkäisissä silmukoissa sisällön lukemiseen myynti.xlsx tiedosto. Toimintoa alue () on käytetty taulukon rivien lukemiseen ja iter_cols () -funktiota on käytetty taulukon sarakkeiden lukemiseen. Tuloksen jokainen kenttä erotetaan kahdella välilehdellä.

# Tuo openyxl -moduuli
tuo openpyxl

# Määritä muuttuja ladattavaksi wookbook
wookbook = openpyxl.load_työkirja('sales.xlsx')

# Määritä muuttuja aktiivisen taulukon lukemiseksi:
laskentataulukko = wookbook.aktiivinen

# Toista silmukka solun arvojen lukemiseksi
vartenisisäänvalikoima(0, laskentataulukko.max_row):
varten kanssa sisäänlaskentataulukko.iter_cols(1, laskentataulukko.max_column):
Tulosta(kanssa[i].arvo,loppuun='' t t'')
Tulosta('')

Lähtö:

Seuraava tulos tulee näkyviin yllä olevan komentosarjan suorittamisen jälkeen.

Esimerkki 3: Lue Excel-tiedosto pandoilla

Pandamoduulia ei ole asennettu python-kaltaisen edellisen moduulin kanssa. Joten jos et ole asentanut sitä aiemmin, sinun on asennettava se. Suorita seuraava komento asentaaksesi pandat terminaalista.

$pipAsentaapandat

Kun olet suorittanut asennusprosessin, luo python -tiedosto, jossa on seuraava komentosarja, jotta voit lukea myynti.xlsx tiedosto. The read_excel () Panda -toimintoa käytetään xlsx -tiedoston lukemiseen. Tätä toimintoa on käytetty komentosarjassa lukemaan myynti.xlsx tiedosto. The Datakehys() -toiminto on lukenut xlsx -tiedoston sisällön tietokehyksestä ja tallentanut arvot nimettyyn muuttujaan tiedot . Tietojen arvo on tulostettu myöhemmin.

# Tuo pandoja
tuoda pandojakutenpd

# Lataa xlsx -tiedosto
excel_data = pd.read_excel('sales.xlsx')
# Lue tiedoston arvot datakehyksestä
data = pd.DataFrame(excel_data,sarakkeet=['Myyntipäivä','Myyjä','Määrä'])
# Tulosta sisältö
Tulosta('Tiedoston sisältö on: n'', tiedot)

Lähtö:

Seuraava tulos tulee näkyviin yllä olevan komentosarjan suorittamisen jälkeen. Tämän komentosarjan tulos eroaa kahdesta edellisestä esimerkistä. Rivinumerot tulostetaan ensimmäiseen sarakkeeseen, jossa rivin arvo on laskettu nollasta. Päivämäärän arvot kohdistetaan keskelle. Myyjien nimet on kohdistettu oikein. Määrä tasataan vasemmalle.

Johtopäätös:

Python -käyttäjien on työskenneltävä xlsx -tiedostojen kanssa eri ohjelmointitarkoituksiin. Tässä opetusohjelmassa on esitetty kolme eri tapaa lukea xlsx -tiedosto käyttämällä kolmea python -moduulia. Jokaisella moduulilla on eri toiminnot ja ominaisuudet xlsx -tiedoston lukemiseen. Tämä opetusohjelma auttaa python -käyttäjiä lukemaan xlsx -tiedoston helposti python -komentosarjan avulla tämän opetusohjelman lukemisen jälkeen.