Pandas Sum -sarake

Pandas Sum Sarake



'Tämä artikkeli osoittaa, kuinka kaikki tai tietyt sarakkeet summataan Pandas DataFramessa Pythonilla. DataFrame.sum()-funktiota käytetään yhdessä muutaman hyödyllisen parametrin kanssa tämän opetusohjelman lukuisissa esimerkeissä.'

Kun tämä opetusohjelma on ohi, saatat tietää, miten:







    • Etsi Pandas-tietokehyksen sarakkeen summa.
    • Tietokehyksen sarakkeiden lisääminen yhteen
    • Lisää Pandas-tietokehykseen sarakkeita, jotka täyttävät määritetyn ehdon.
    • Määritä summa datakehyksen tietojen ryhmittelyn jälkeen.

Kuinka määrittää tietokehyksen sarakkeiden summa?

Pandasin 'dataframe.sum()'-funktio palauttaa määritetyn akselin kokonaissumman. Jos syöte on indeksin akseli, funktio lisää kunkin sarakkeen arvot yksitellen ja tekee saman jokaiselle sarakkeelle palauttaen sarjan, joka tallentaa kunkin sarakkeen tietojen/arvojen summan. Lisäksi se tukee tietokehyksen summan laskemista jättämällä huomioimatta puuttuvat arvot.



Syntaksi: DataFrame.sum(akseli = ei mitään, skipna = ei mitään, taso = ei mitään, numeerinen_vain = ei mitään, min_määrä = 0, **kwargs)



Missä,





akseli: {sarakkeet (1), hakemisto (0)}

Tilaus: Ohita NA/nolla-arvot tulosta laskettaessa.



taso: Jos määritetty akseli on hierarkkinen (moniindeksi), laske tietylle indeksitasolle ennen sarjaksi muuntamista.

vain numeerinen: Vain float-, int- ja boolean-sarakkeet ovat hyväksyttäviä. Jos Ei mitään, yritä käyttää kaikkea; jos ei, vain numeerisia tietoja. Sarjoille, ei toteutettu.

min_count: Toiminnon suorittamiseen tarvittavien mahdollisten arvojen määrä. Tulos on NA, jos läsnä on vähemmän ei-NA-arvoja kuin min_count.

Palautukset: DataFrame (jos taso määritetty) tai Series.

Esimerkki # 01: Määritä tietokehyssarakkeen ja kaikkien sarakkeiden summa

Olemme vaatineet ensin datakehyksen kelvollisilla tietotyypeillä, eli int, float jne., sarake tai sarakkeet, joille voimme löytää datan summan. Tietokehys luodaan käyttämällä pd.DataFrame()-funktiota.


Olemme luoneet tarvittavan datakehyksen python-sanakirjasta pd.DataFrame()-funktion sisällä. Yllä luodussa tietokehyksessä on neljä saraketta 'Nimi', 'päivä1', 'päivä2' ja 'päivä3'. Neljästä sarakkeesta kolme saraketta eli 'day1', 'day2' ja 'day3' ovat numeerisia sarakkeita, joissa on tietoarvot (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) ja (7, 4, 3, 5, 6, 2, 1, 4) vastaavasti. Voimme löytää vain näiden kolmen sarakkeen summan. Sekä sarjan (eli sarakkeen) että koko tietokehyksen summa voidaan määrittää käyttämällä sum()-menetelmää. Aloitetaan opettamalla, kuinka kaikki Pandas-sarakkeen tiedot lasketaan yhteen.


Summan määrittämiseksi käytimme sum()-menetelmää sarakkeessa 'day2'. Funktio on palauttanut summa-arvon 28. Samalla tavalla voimme määrittää jokaisen Dataframe-sarakkeen summan. Yksinkertaisesti käyttämällä sum()-menetelmää koko tietokehyksessä saavuttaa tämän.


Kuten voidaan nähdä, sarakkeen “day1” summa on 31; 'day2':n summa on 28, kun taas sarakkeen 'day3' summa on 32.

Esimerkki # 02: Sum()-funktion käyttö datakehyksen sarakkeen arvojen yhteenlaskemiseen

Kuten edellisen esimerkin lähdöstä näkyy, funktio ei palauttanut varsinaista datakehyssarakkeen dataa, josta summa muodostui. Määrittämällä menetelmän 'DataFrame.sum()' DataFrame-sarakkeeseen, voit kuitenkin käyttää kaikkia DataFrame-sarakkeita, mukaan lukien summasarake. Ensin luodaan toinen tietokehys tälle esimerkille.


Tietokehyksemme on luotu käyttämällä pd.DataFrame():tä. Olemme luoneet tietokehyksen, jossa on kolme saraketta: nimike, hinta ja vero. Sarakekohta, joka sisältää merkkijonoarvot ('kynä', 'merkitsin', 'viivain', 'pyyhekumi', 'lyijykynä', 'leikepöytä', 'nitoja', 'nastat'), sarakkeen hinta, joka tallentaa arvot (20, 15, 10, 3, 5, 30, 35, 10), ja 'vero' -sarake koostuu arvoista (8, 5, 3, 3, 4, 10, 5, 2). Lasketaan nyt yhteen hinta- ja verosarakkeen arvot ja tallennetaan tulokset uuteen sarakkeeseen säilyttämällä alkuperäiset tietokehyksen sarakkeet.


Kuten voidaan huomata uuden sarakkeen “yhteensä” kanssa, funktio palauttaa myös alkuperäiset sarakkeet kyseisestä datakehyksestä. Sarake 'yhteensä' tallentaa sarakkeiden 'hinta' ja 'vero' arvojen summan kutakin 'tuote' -tietoa vastaan.

Esimerkki # 03: Sum()-funktion käyttäminen määritettyjen tietokehyssarakkeiden summan määrittämiseen

Tietokehyksen useiden sarakkeiden yhteenlaskemiseksi voimme määrittää luettelon sarakkeiden otsikoineen ja soveltaa sitten luetteloon sum()-menetelmää summan löytämiseksi. Kuten aiemmissa esimerkeissä, luomme ensin tietokehyksen.


Olemme luoneet tietokehyksemme, jossa on neljä saraketta 'oppilaat', 'merkit1', 'merkit2' ja 'merkit3'. Sarake 'students' tallentaa tiedot ('Larry', 'James', 'Rob', 'Arya', 'Max', 'Ben', 'Gwen', 'Bill') ja sarake 'marks1' tallentaa tiedot arvot (8, 9, 6, 8, 10, 7, 9, 9), kun taas sarakkeet 'marks2' ja 'marks3' tallentavat numeroarvot (6, 6, 8, 6, 7, 9, 10, 9) ) ja (7, 6, 9, 7, 8, 7, 10, 10) vastaavasti.


Ensin olemme luoneet luetteloobjektin sarakeotsikoilla 'oppilaat', 'merkit1' ja 'merkit3'. Sitten listaan ​​sovelletaan menetelmää summa(). Funktio on summannut marks1- ja marks3-sarakkeiden arvot vain siksi, että sarake “oppilaat” ei ole numeerinen, joten sum()-funktio ei löydä summaa sarakkeen “students” arvoille. Olemme tallentaneet sarakkeiden “marks1” ja “marks3” arvojen summan sarakkeeseen “sum”.

Esimerkki # 04: Lisää Pandas-tietokehyksen sarakkeet, jotka täyttävät tietyn ehdon

Tässä esimerkissä lisäämme määritettyjen sarakkeiden arvot, jos ne täyttävät määritetyn ehdon.


Äskettäin luodussa tietokehyksessä on 5 saraketta, eli 'yritys', 'viikko1_myynti', 'viikko2_myynti', 'viikko 3_myynti' ja 'konttorit'. Oletetaan nyt, että emme halua lisätä viimeisen sarakkeen arvoa, kun lisäämme tai etsimme annettujen tietokehysrivien arvojen summaa. Oletetaan, että halusimme vain lisätä sarakkeiden arvot, joissa on sana 'viikko'. Luettelon ymmärtäminen voidaan luoda sen määrittämiseksi, onko sana 'viikko' sarakkeen otsikossa vai ei.


Nyt olemme hakeneet sarakkeet, joiden otsikoissa on sana 'viikko'. Voimme tehdä yhteenvedon sarakkeista, jotka sisältävät sanan 'viikko' käyttämällä sum()-funktion argumenttia axis=1.


Tällä tavalla voimme turvallisesti laskea yhteen sarakkeiden tiedot riveittäin ilman, että sisällytämme sarakkeita, joita emme halua.

Esimerkki # 5: Määritä summa tietokehyksen tietojen ryhmittelyn jälkeen

Voimme myös löytää tietokehyksen sarakkeiden summan yhden tai useamman sarakkeen tietojen ryhmittelyn jälkeen. Groupby()-menetelmää käytetään tietojen ryhmittelyyn sarakkeen sisällä oleviin luokkiin. Luodaan tietokehys, jotta voimme ryhmitellä yhden sen sarakkeen tiedot.


Nyt ryhmittelemme tiedot sarakkeessa 'ikä' ja laskemme yhteen sarakkeiden 'score1' ja 'score2' arvot ryhmän kunkin luokan osalta.


Näemme, että datakehyksen tietojen summaaminen sen jälkeen, kun tietoarvot on ensin ryhmitelty iän mukaan, saadaan sarakkeittainen summa ikäryhmittäin riippuen.

Johtopäätös

Tässä opetusohjelmassa yritimme opettaa sinulle kuinka laskea datakehysten summa käyttämällä Pandas-summamenetelmää. Olemme keskustelleet arvojen rivi- ja sarakekohtaisesta lisäämisestä tämän viestin esimerkeissä. Lisäksi opit lisäämään sarakkeita ehdollisesti ja kuinka arvot summataan datakehyksen sarakkeen ryhmittelyn jälkeen. Nyt voit ehkä laskea datakehyksen sarakkeet yhteen tai summata datakehyksen sarakkeen arvot itse.