Pandas Insert() -sarake

Pandas Insert Sarake



”Python tarjoaa laajan valikoiman tietorakenteita ja operaatioita numeeristen ja aikasarjatietojen käsittelyyn. Pandasissa luomamme tai tuomamme DataFrame-kehystä voidaan käyttää useisiin tarkoituksiin. Tietokehyksen sarakkeita voidaan myös säätää tietolähteen ohella. Pandat tekevät monista tietojen käsittelyyn liittyvistä työläistä ja aikaa vievistä tehtävistä yksinkertaisia. Pandassa on neljä tapaa lisätä sarake DataFrameen, mutta tässä artikkelissa käytämme pandan sarakkeen 'insert()' -toimintoa.

Kun olemme rakentaneet tai ladaneet dataFrame-kehyksemme Pandasiin, voimme haluta saavuttaa monia asioita. Saatamme esimerkiksi jatkaa tietojen käsittelyä esimerkiksi muuttamalla tietokehyksen sarakkeita. Seuraavaksi meidän on ymmärrettävä sarakkeiden sisällyttäminen tietokehykseen. Jos suurin osa tiedoista tulee yhdeltä tiedontoimittajalta, mutta osa tiedoista tulee toiselta. Sarake voidaan helposti lisätä Pandas-tietokehykseen.'







Pandas insert() -menetelmä

Tietokehyksen viimeinen sarake on luotu eri funktiolla. Käyttämällä DataFrame 'insert()' -menetelmää voit lisätä sarakkeita nykyisten sarakkeiden väliin sen sijaan, että lisäisit niitä pandan DataFramen alareunaan. Se tarjoaa meille mahdollisuuden lisätä sarakkeen mihin tahansa valitsemaamme, sen sijaan, että se voidaan lisätä vain lopuksi. Lisäksi se tarjoaa monia tapoja lisätä sarakkeiden arvoja. Kun haluat lisätä sarakkeen tiettyyn kohtaan tai indeksiin, pandan 'insert()' -toiminto on hyödyllinen.



Pandas insert() -sarakkeen syntaksi



Esimerkki 1: Sarakkeen lisääminen tietokehykseen Pandasin insert()-menetelmällä

Aloita artikkelin ensimmäisestä esimerkistä, jossa selitämme, kuinka sarake lisätään tietokehykseen. Käyttämällä 'spyder' -työkalua voimme todistaa tämän koodin. Ensin luomme tietokehyksen nimeltä 'kurssi'. Tässä tietokehyksessä on kaksi saraketta, 'course_title' ja 'fee'. Sarakkeessa 'course_title' on luettelo kursseista 'python', 'java', 'object_oriented' ja 'PHP'. Toisessa sarakkeessa 'maksu' on luettelo kurssimaksuista, joka on '30000', '25000', '15000' ja '22000'. DataFrame, 'kurssi' näyttäminen käyttämällä 'pd. Datakehys'.





Seuraavaksi käsittelemme koodin päätoimintoa, joka on pandas 'insert() column'. Se on tehokas tapa sisällyttää tietokehykseen uusi luettelo. Voit lisätä uuden sarakkeen mihin tahansa määritettyyn kohtaan lisäysmenetelmällä. Tämä menetelmä mahdollistaa myös sarakkeen manuaalisen lisäämisen tietokehykseen, mutta mukautuvuus on vähemmän.

Koko lisäys tarkoittaa, että lähde DataFrame päivitetään suoraan prosessin aikana, eikä uutta DataFramea luoda. Tässä tapauksessa olemme lisänneet tietokehykseemme uuden sarakkeen nimellä 'Time_duration' käyttämällä 'insert()'-funktiota. Tässä sarakkeessa olevat arvot ovat '6_months', '3_months', '3months' ja '6_months'. Meillä on sarake 'Time_duration', jonka indeksi on määritelty '2' alla olevassa ohjelmassa. Koska indeksi on määritetty, DataFramelle annettaisiin alue, joka alkaa 0:sta ja kasvaa portaittain, joten se tarkoittaa, että tämä sarake näytetään tietokehyksen kolmantena sarakkeena. DataFrame lisää uuden sarakkeen nimeltä 'Time _duration' käyttämällä 'pd.insert()'-funktiota.



Ja nyt keskustellaan ohjelman tuotosta ylhäältä. Sen tulos näyttää tietokehyksen, jossa on kolme saraketta. Lisäsarake lisätään tietokehyksen loppuun. Käyttämällä pd.DataFrame.insert()-menetelmää voit lisätä sarakkeen muiden sarakkeiden joukkoon sen sijaan, että lisäisit ne pandan DataFrame-kehyksen loppuun.'Time_ kesto' on uusi sarake, jonka lisäsimme 'inserting'-komennolla. toiminto. Sijainti “2” viittaa kolmatta sarakkeeseen DataFramessa, koska sijainti alkaa 0:sta. Sarake lisätään datakehyksen viimeiseen paikkaan.

Esimerkki 2:  Sarakkeiden lisääminen tietokehykseen Pandasin insert()-funktion avulla

Käytämme 'insert()' -menetelmää uusien sarakkeiden lisäämiseen tietokehykseen. Sen sijaan, että lisäisit sarakkeita pandojen loppuun, voit lisätä ne olemassa olevien sarakkeiden väliin. Edellisen esimerkin kaltaisen tietokehyksen luomiseksi otimme kolme saraketta ja määritimme niille arvot. Ensimmäisessä sarakkeessa 'Nimi' on luettelo nimistä, jotka sisältävät 'Emma', 'Ella',' Smith' ja 'Maxwell'. Toisessa sarakkeessa 'Ikä' on luettelo arvoistamme '29', '36', '39' ja '33'.

Tämän jälkeen tulostamme lausunnon 'DataFrame'. Näytämme datakehyksen 'datakehys' -lausekkeen alla. Luomme Pandas-tietokehykselle yhden sarakkeen lisää käyttämällä 'insert()'-funktiota. Luettelo on luotava, jotta se voidaan lisätä uudeksi sarakkeeksi annettuun tietojoukkoon. Panda DataFramen 'assign()'-menetelmää voidaan käyttää myös sarakkeiden lisäämiseen. Lisäämme uuden sarakkeen käyttämällä 'df. lisää'. Lisäsarakkeessa 'Gender' näkyy sukupuoli joko 'mies' tai 'nainen'.

Tulostetaan vain toinen lausunto, 'New Dataframe'. Uusi tietokehys esitetään nyt lausekkeen 'New Dataframe' alla, ja se sisältää lisäsarakkeen, jonka lisäsimme 'pd. insert()”-funktio. Samannimistä saraketta ei voi lisätä 'insert()'-funktiolla. Jos sarake on jo olemassa tietokehyksessä, arvovirhe heitetään oletusarvoisesti.

Tässä tulosteessa sarake, jonka loimme käyttämällä 'insert()'-funktiota, lisätään tietokehykseen. Sen tulos näyttää kaksi datakehystä; ensimmäinen dataFrame luotiin käyttämällä 'pd.data frame', jossa meillä on kaksi saraketta, 'Name' ja 'Age'. Uusi sarake 'sukupuoli', jonka lisäsimme 'insert()'-funktiolla, näkyy alla näytetyssä toisessa datakehyksessä. Tämä tietokehys osoittaa, että siinä on kolme saraketta, joissa on tietoja. Indeksin koko on '2', mikä tarkoittaa, että siinä on merkintöjä '0 - 3'. Uuden sarakkeen, jonka määritimme tälle tietokehykselle, indeksipaikka on '3'.

Johtopäätös

Yleisesti käytetty tietojen analysointi- ja päivitystoiminto on sarakkeiden lisääminen DataFrameen. Pandas tarjoaa kuitenkin lukuisia vaihtoehtoja tehtävän suorittamiseen tarjoamalla neljä erilaista menetelmää; Käytämme kuitenkin artikkelissamme vain yhtä tekniikkaa, joka on panadas 'insert()' -sarake. Yksi vaikeimmista osista DataFrame-kehyksen laajentamisessa uusilla sarakkeilla on indeksointi. Kuvataanpa nopeasti molemmat esimerkit. Loimme ensin tietokehyksen nimeltä kurssi ja lisäsimme sarakkeet 'kurssin nimi' ja 'maksu' ja määritimme arvot tähän sarakkeeseen. Käyttämällä 'insert()'-funktiota lisäämme sitten uuden sarakkeen samaan tietokehykseen, joka osoittaa sen sijainnin '2' indeksissä. Toisessa esimerkissä näytetään kaksi datakehystä. Olemme luoneet kaksi saraketta ja listanneet joitain arvoja ensimmäiseen tietokehykseen. Sitten käyttämällä insert()-funktiota lisäsimme tietokehykseen uuden sarakkeen nimeltä 'Gender', joka sijoitettiin myös indeksiin '2'; nyt se näytti taulukon uudelleen, kuten yllä olevassa toisessa esimerkissä näkyy.

Yllä olevien tekniikoiden hallitsemisen jälkeen voimme helposti lisätä uusia sarakkeita DataFrame-kehykseen.