Ainutlaatuinen Pandas Dataframe

Ainutlaatuinen Pandas Dataframe



Suosituin tietotieteessä käytetty Python-kirjasto on nimeltään Pandas. Se tarjoaa Python-ohjelmoijille tehokkaat, käyttäjäystävälliset ja tietojen analysointityökalut. Kun ymmärrät perustoiminnot ja kuinka niitä käytetään, Pandas on tehokas työkalu tietojen muuttamiseen. 'Pandoissa' vakiomenetelmiä tietojen tallentamiseksi taulukkomuodossa ovat DataFrames. Voimme käyttää joitain 'panda'-menetelmiä yksilöllisten arvojen saamiseksi 'pandas' DataFrame -sarakkeessa. Kun meidän on saatava yksilöllisiä arvoja DataFramen sarakkeisiin emmekä halua arvojen päällekkäisyyttä 'pandas' DataFrame -sarakkeessa, voimme käyttää 'pandan' tarjoamia menetelmiä tähän. Katsotaanpa tällaisia ​​menetelmiä tässä oppaassa sekä joitain esimerkkejä ja tulosteita saadaksesi yksilölliset arvot DataFramen pandasarakkeessa.

Menetelmät ainutlaatuisten arvojen saamiseksi 'panda' DataFramen sarakkeissa

Voimme käyttää kahta menetelmää yksilöllisten arvojen saamiseksi 'pandas' DataFramen sarakkeisiin. Pudotamme päällekkäiset arvot ja saamme vain yksilölliset arvot DataFrames-sarakkeisiin. Menetelmät, joita 'pandat' tarjoavat tämän tehtävän suorittamiseen, ovat:







  • Käyttämällä ainutlaatuista()-menetelmää.
  • Käyttämällä drop_dupliactes()-metodia.

Nyt käytämme molempia menetelmiä 'pandas'-koodeissa saadakseen yksilölliset arvot 'pandas' DataFrame -sarakkeisiin.



Esimerkki #01

'Spyder' -sovellusta käytetään täällä näiden 'panda'-koodien luomiseen, jotta voimme hyödyntää niitä menetelmiä, jotka auttavat meitä saamaan yksilölliset arvot 'panda' DataFramen sarakkeisiin. Meidän on tuotava 'pandas'-moduulit, jotka ovat välttämättömiä 'pandas'-koodille ennen DataFramen luomista. Käyttämällä termiä 'tuonti' ja sijoittamalla 'pandat pd:nä' tuomme nämä moduulit.



Nyt 'pd':n avulla saamme nopeasti 'panda'-funktiot tai -menetelmät. Laitamme sitten 'Subject_data', johon lisäämme 'Nimi' ja 'Nimi', lisäämme nimen tiedot, jotka ovat 'Roman, William, Peter, Smith, John, Milli, Thomas ja James'. Sitten lisäämme aiheen tiedot 'Aiheeseen', jotka ovat 'Maths, Economics, Science, Maths, Statistics, Statistics, Statistics ja Computer'. Sitten muunnetaan tämä 'Subject_data' 'Subject_df' -tietokehykseksi käyttämällä 'pd.DataFrame()' -menetelmää. Sijoitamme 'Subject_df' 'print()'-menetelmään, jotta se näkyy päätteessä.





Nyt haluamme saada ainutlaatuiset arvot 'pandas' DataFrame -sarakkeessa 'Subj'. Tätä tarkoitusta varten käytämme tässä 'unique()' -menetelmää ja lisäämme sarakkeen nimen ja myös DataFramen nimen alla olevan kuvan mukaisesti. Lisäämme tämän menetelmän 'print()' -kenttään, jotta tulos näkyy myös päätteessä.



Nyt painamme 'Shift+Enter' saadaksemme tämän koodin tuloksen ja se hahmonnetaan päätteellä ja näkyy myös tässä, joka sisältää DataFramen kaikkine arvoineen. Tämä on alkuperäinen DataFrame, jonka olemme lisänneet koodiin, ja sen alla näkyvät 'Subj' -sarakkeen ainutlaatuiset arvot. Se pudottaa päällekkäiset arvot ja näyttää DataFramen Subj-sarakkeen yksilölliset arvot.

Esimerkki # 02

Luomme 'Sample_list', joka sisältää joitain tietoja. Lisäämme 'Layla, 21, 28, 31, 14 ja 39', joka näkyy ensimmäisenä sarakkeena, kun muunnamme tämän luettelon DataFrame-kehykseksi. Sitten lisäämme 'Lusy, 31, 25, 34, 26 ja 21' DataFramen toiselle riville. Tämän jälkeen meillä on 'Peter, 38, 20, 20, 35 ja 24' ja 'Layla 38, 23, 39 24, 23', jotka ovat DataFramen kolmas ja neljäs rivi. Lisäämme myös kolme muuta dataa, jotka ovat 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' ja myös 'Peter, 21, 21, 31, 21, 29' .

Nyt muunnamme 'Sample_list':ksi 'DF_Sample', joka on DataFramen nimi tässä asettamalla 'pd.DataFrame()' -funktion. Lisäksi asetamme tämän DataFramen sarakkeiden nimet ja nämä nimet ovat 'Nimi, Ass_1, Ass_2, Ass_3, Ass_4 ja Ass_5'. Sitten käytämme 'print()', joka auttaa näyttämään DataFrame 'DF_Sample'. Käytämme nyt toista menetelmää tässä esimerkissä saadaksemme yksilölliset arvot DataFrame-sarakkeessa. Tämä menetelmä on 'pandan' 'drop_duplicates()' -menetelmä.

'drop_duplicates()' -menetelmässä asetamme sarakkeen nimen, josta haluamme saada yksilölliset arvot DataFrame-sarakkeessa. Saamme 'Nimi'-sarakkeen ainutlaatuiset arvot pudottamalla tämän sarakkeen päällekkäiset arvot 'drop_duplicates()'-menetelmän avulla ja myös hahmontamaan nämä ainutlaatuiset arvot 'print()'-funktiolla tässä.

Kaksinkertaiset nimet hylätään ja yksilölliset arvot hahmonnetaan 'drop_duplicates()'-menetelmän käytön jälkeen. Huomaa, että nimi 'Layla' näkyy kolmessa 'Nimi'-sarakkeen solussa. Mutta kun 'drop_duplicates()' -menetelmää käytetään tähän sarakkeeseen, kaikki päällekkäiset arvot jätetään pois ja yksi 'Layla' nimi on ilmestynyt näytölle. Päällekkäisten arvojen pudotuksen jälkeen ilmestyi uusi DataFrame, joka sisältää ainutlaatuiset arvot tässä 'Nimi'-sarakkeessa. Tällä tavalla voimme pudottaa päällekkäiset arvot ja saada yksilöllisen arvon DataFrame-sarakkeeseen 'drop_duplicates()' -menetelmän avulla.

Esimerkki #03

Samaa DataFramea hyödynnetään uudelleen ja nyt käytämme tässä 'unique()'-menetelmää. 'unique()'-menetelmällä sijoitamme sarakkeen nimen sekä DataFramen nimen, johon haluamme soveltaa tätä 'unique()'-menetelmää yksilöllisten arvojen saamiseksi. Tämä hahmontaa vain kyseisen sarakkeen yksilölliset arvot, eikä näitä arvoja näytetä DataFrame-muodossa.

Tässä DataFrame sisältää seitsemän arvoa 'Nimi'-sarakkeessa, mutta kun käytämme 'unique()'-menetelmää tähän sarakkeeseen, vain neljä arvoa on ilmestynyt, ja nämä ovat kyseisen sarakkeen yksilöllisiä arvoja. Se ei luo päällekkäisiä arvoja.

Esimerkki #04

DataFrame, jonka luomme tässä esimerkissä, on 'F_G_df'. Lisäämme 'My_fruits' ja 'my_Vegs' tähän DataFrameen. 'My_fruits' -sarake sisältää 'omena, appelsiini, omena, päärynä, litsi, omena, omena, päärynä ja omena'. Seuraavaksi meillä on 'My_Vegs', joka sisältää vihannesten nimet, jotka ovat 'chilli, bringle, porkkana, peruna, peruna, porkkana, sipuli, valkosipuli ja inkivääri'. Tämä DataFrame sisältää vain kaksi saraketta.

Nyt saamme molempien sarakkeiden yksilölliset arvot 'unique()'-menetelmän avulla. Mainitsemme DataFramen nimen. Kirjoita sitten sarakkeen ensimmäiseksi sarakkeen nimi. Tämän jälkeen käytämme append()-menetelmää. Tähän liitteeseen laitamme jälleen DataFramen nimen ja toisen sarakkeen nimen ja sijoitamme 'unique()'-menetelmän. Tämä saa molempien sarakkeiden yksilölliset arvot ja lisää molempien sarakkeiden yksilölliset arvot ja näyttää ne näytöllä.

DataFrame renderöidään ensin sisältäen kaikki arvot. Tämän jälkeen käytetään 'unique()'-menetelmää ja molempien sarakkeiden yksilölliset arvot esitetään alla. Tässä koodissa saamme yksilölliset arvot useisiin DataFramen sarakkeisiin käyttämällä 'unique()'-menetelmää.

Johtopäätös

Täydellinen selitys yksilöllisten arvojen hankkimisesta DataFrame-sarakkeessa on tässä oppaassa. Olemme keskustelleet 'unique()'- ja 'drop_duplicates()'-menetelmistä, jotka auttavat meitä saamaan DataFrame-sarakkeen ainutlaatuiset arvot. Olemme tutkineet kuinka käyttää näitä menetelmiä 'panda'-koodissa käyttämällä näitä menetelmiä täällä koodeissamme. Olemme havainnollistaneet erilaisia ​​esimerkkejä tässä oppaassa ja näyttäneet, kuinka saat yhden sarakkeen yksilölliset arvot käyttämällä 'unique()'- ja 'drop_duplicates()'-menetelmää. Olemme myös tutkineet, kuinka saada yksilölliset arvot useisiin sarakkeisiin käyttämällä 'unique()'-menetelmää tässä oppaassa.