Panda Reindex

Panda Reindex



''Pandoissa' voimme tallentaa paljon tietoa taulukkomuodossa, joka tunnetaan myös nimellä DataFrame. 'Pandat' helpottavat meitä 'DataFrame()'-menetelmällä DataFramen rakentamiseen. DataFrame sisältää indeksejä, ja voimme myös muuttaa DataFramen indeksejä käyttämällä 'panda'-toimintoja. Menetelmä, jota käytämme DataFramen uudelleenindeksoimiseen, on 'reindex()' -menetelmä. Tämä menetelmä auttaa muuttamaan rivin indeksiarvoja sekä sarakkeiden indeksiarvoja. Tätä menetelmää käyttämällä voimme muuttaa DataFramen oletusindeksiä, ja voimme myös muuttaa indeksiä, jonka asetimme DataFramea luotaessa. Käytämme 'reindex()'-menetelmää 'panda'-esimerkeissämme tässä opetusohjelmassa ja selitämme tämän käsitteen perusteellisesti täällä.

Esimerkki #01

'Spyder'-työkalu auttaa meitä kehittämään 'pandas'-koodia tässä opetusohjelmassa, ja aloitamme koodimme avainsanalla 'tuonti', joka auttaa 'pandas'-toiminnon tuomisessa. Asetamme 'pandas as pd' kirjoittamisen jälkeen 'tuonti'. Tämän jälkeen luomme DataFrame-kehyksen kirjoittamalla 'pd.DataFrame()'. Kirjoitamme tähän 'pd', koska 'DataFrame()' on 'pandan' menetelmä. Arvo_df on sen muuttujan nimi, johon DataFrame on tallennettu. Lisäämme 'RandomName', joka on sarakkeen nimi, ja 'RandomName' sisältää 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander ja Samuel'.







Sitten meillä on 'Arvo_1', johon olemme lisänneet '16, 29, 24, 35, 44, 50, 69, 74 ja 88'. Sitten tulee 'Arvo_2', ja olemme lisänneet '25, 38, 42, 56, 54, 65, 78, 89 ja 99'. Nyt 'Arvo_3' tulee seuraavaksi, ja sijoitamme siihen '36, 48, 52, 69, 74, 75, 87, 91 ja 69'. Tämän jälkeen on 'Arvo_4' sarake, johon olemme lisänneet '52, 64, 72, 88, 82, 95, 97, 21 ja 39'. Viimeinen sarake on tässä sarake Arvo_5, ja tähän sarakkeeseen lisäämämme arvot ovat '66, 78, 82, 99, 34, 45, 57, 61 ja 89'. Tämän jälkeen käytämme 'print()'-funktiota, johon 'Arvot_df' lisätään niin. Se tulostuu terminaaliin.




Kun olet painanut 'Shift + Enter', voimme helposti saada koodimme tuloksen 'Spyder' -sovelluksessa. Tässä koodi palauttaa DataFramen oletusindeksin kanssa. Nyt käytämme 'reindex()' -menetelmää tämän DataFramen uudelleenindeksoimiseen 'pandassa'.




'Reindex()'-funktiota käytetään tässä rivin indeksiarvon uudelleenindeksoimiseen. Yllä olevassa DataFrame-kehyksessä voit nähdä, että rivin oletusindeksiarvot näytetään, ja nyt käytämme 'reindex()' -menetelmää näiden rivien indeksien uudelleenindeksoimiseen. Asetamme DataFramen nimen ja sitten 'reindex()'-menetelmän, johon sijoitamme ne indeksiarvot, jotka haluamme lisätä yllä olevaan DataFrame-kehykseen. Laitamme 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H ja ind_I' 'reindex()' -funktioon. Joten näiden rivien indeksit päivitetään DataFrameen, kun suoritamme tämän koodin.






Tässä tuloksessa näytetään rivin indeksin arvot, ja voit huomata, että DataFrame-arvoja ei näytetä tässä, vaan 'NaN'-arvot ovat ilmestyneet. Tämä johtuu siitä, että uudet indeksiarvot eivät vastaa DataFramen aikaisempia indeksiarvoja. Kun uusi ja vanha indeksi eivät täsmää, siinä näkyy 'Nan'. Nämä 'NaN'-arvot näkyvät oletuksena, kun muutamme indeksiä, ja se ei vastaa edellistä indeksiä.



Esimerkki # 02

Muutamme nyt 'Value_df':n sarakeindeksiarvoja, jotka olemme aiemmin luoneet esimerkissä 1. Kun 'Value_df' on tulostettu, laitamme 'column'-muuttujan ja lisäsimme siihen arvoja. Lisäämme 'a_1, b_1, c_1, d_1 ja e_1'. Nyt haluamme säätää näitä arvoja sarakkeiden indekseiksi, joten käytämme tätä varten 'reindex()' -menetelmää ja asetamme muuttujan 'column' nimen, johon uudet sarakeindeksiarvot on tallennettu ja Aseta myös 'akseliksi' 'sarakkeet', joten se päivittää sarakkeen akseliindeksin. Laitamme 'reindex()'-menetelmän 'print()' -kenttään, joten se hahmontuu myös päätteessä.


Koska olemme käyttäneet 'reindex()'-menetelmää, ensimmäisessä DataFrame-kehyksessä olevat sarakeindeksiarvot päivitetään ja päivitettyyn DataFrame-kehykseen lisätään uusia arvoja. Voit myös huomata, että kaikki DataFramen arvot muunnetaan 'NaN'-muotoon, koska sarakkeiden molemmat indeksiarvot ovat erilaisia.

Esimerkki #03

Tämän koodin 'Ohjelmointitiedot' sisältää 'P_Languages', johon olemme lisänneet 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java ja JavaScript'. Sitten meillä on 'tunnit', joihin sijoitamme '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs ja 6_hrs'. Tämän jälkeen syötetään 'P_Code' ja lisäämme '11523, 12423, 12321, 11456, 11454, 12267, 13106 ja 14123'. Lisäämme 'p_index'-muuttujan ja laitamme 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G ja Pro_H'.

Näitä arvoja käytetään rivien indeksiarvoina. Muutamme 'Programming_data' 'Programming_df' DataFrame -kehyksessä. Lisäämme myös 'p_index' tähän DataFrameen käyttämällä 'index'-menetelmää. Laitamme 'Programming_df' ja sitten 'index'-menetelmän ja määritämme 'p_index' tälle. Nyt yllä olevat indeksiarvot lisätään rivien indeksiarvoiksi DataFrameen. Tulostamme myös 'Ohjelmointi_df'.

Tämän jälkeen lisäämme 'new_index'-muuttujaan uusia indeksiarvoja, jotka ovat 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 ja P_8'. Koska haluamme päivittää rivien indeksiarvoja, käytämme 'reindex()' -menetelmää ja laitamme 'new_index' tämän funktion parametriksi ja tallennamme myös päivitetyn DataFrame:n 'newProgramming_df' -kansioon ja sijoitamme 'newProgramming_df' kohtaan ' print()' näyttämistä varten.


Indeksiarvot päivitetään, ja voimme myös sanoa, että olemme indeksoineet luomamme DataFramen uudelleen. Kaikki DataFramen arvot muunnetaan myös 'NaN'-muotoon, koska molemmat indeksiarvot ovat erilaisia.

Esimerkki # 04

Muutamme parhaillaan sarakkeiden 'Programming_df's' indeksiarvoja, jotka olemme kehittäneet aiemmin esimerkissä 3. Sijoitamme 'column' -muuttujan ja lisäämme siihen uusia arvoja. 'P_Code, P_languages, Hours ja New' lisätään 'sarake'-muuttujaan. Sitten käytämme jälleen 'reindex()' -menetelmää, jossa asetamme 'column'-muuttujan, joka päivittää edelliset sarakeindeksiarvot ja lisää nämä uudet sarakeindeksiarvot DataFrame-kehykseen.

Tässä voit huomata, että uudet arvot, jotka olemme lisänneet 'sarakkeeseen' ovat samat kuin olemme lisänneet yllä olevaan DataFrame-kehykseen, mutta järjestys on erilainen, joten se muuttaa sarakkeiden järjestystä ja säätää kaikkia sarakkeita kuten mainitaan sarakemuuttujassa. Lisäksi lisäämme vielä yhden indeksiarvon, jota ei ole yllä olevassa DataFrame-kehyksessä, joka on tässä 'Uusi', joten 'NaN'-arvot näkyvät tässä sarakkeessa.


Sarakkeiden järjestystä muutetaan tässä, ja kaikki arvot näkyvät sellaisina kuin ne ovat alkuperäisen DataFramen sarakkeissa ja päivitetyn DataFramen sarake 'New' sisältää kaikki 'NaN'-arvot, koska tämä sarake ei ole alkuperäisessä DataFramessa.

Johtopäätös

Olemme esittäneet tämän opetusohjelman, joka auttaa meitä ymmärtämään 'pandareindex' -käsitteen yksityiskohtaisesti. Olemme keskustelleet siitä, kuinka voimme indeksoida DataFrame-sarakkeen ja rivin indeksiarvot uudelleen. Olemme selittäneet, että tähän käytetään 'pandan' 'reindex()'-funktiota. Olemme tehneet erilaisia ​​esimerkkejä, joissa olemme muuttaneet DataFramen rivien indeksiarvoja ja myös DataFramen sarakeindeksin indeksiarvoja. Olemme renderöineet kaikkien tässä opetusohjelmassa tekemiemme koodien tulokset ja selittäneet ne myös perusteellisesti.