Liitä Dict DataFrameen Pandasissa

Liita Dict Dataframeen Pandasissa



Keskustelemme siitä, kuinka sanakirja voidaan liittää olemassa olevaan Pandas DataFrame -kehykseen käyttämällä funktioita pandas.DataFrame.append() ja pandas.concat() esimerkein. Tässä sanakirja viittaa avain:arvo-pariin siten, että avain viittaa olemassa oleviin sarakeotsikoihin, jotka ovat DataFramessa ja arvot lisätään riville. Näemme myös esimerkit, jotka lisäävät useita sanakirjoja Pandas DataFrameen.

Pandas.DataFrame.Append

Pandas.DataFrame.append()-funktiota käytetään liittämään toisen DataFramen rivit olemassa olevaan DataFrame-kehykseen. Jos olemassa olevan DataFrame-kehyksen sarakkeita ei ole, muut DataFrame-sarakkeet luodaan olemassa olevaan DataFrame-kehykseen. Käytä tätä toimintoa siten, että rivi on lisättävä DataFrameen liittämällä sanakirja.

Syntaksi :







Seuraava on funktion pandas.DataFrame.append() todellinen syntaksi:



pandat. Datakehys . liittää ( muu , ignore_index , verify_eheys , järjestellä )
  1. muu : Tämä viittaa toiseen DataFrame-kehykseen, jossa tämän DataFramen rivit on liitetty olemassa olevaan DataFrame-kehykseen. Jos haluat liittää yhden rivin, sinun on annettava parametrina arvojen sanakirja.
  2. ignore_index (oletuksena = False): Tätä parametria käytetään, kun lisäät rivejä DataFrame-kehykseen, jossa on jo rivejä. Jos se on 'False', myös olemassa olevat riviindeksit liitetään. Jos se on 'True', rivit merkitään 0 - n-1. Varmista, että tämän parametrin arvo on 'True', kun lisäät sanakirjan DataFrame-kehykseen. Muussa tapauksessa esiin tulee virhetyyppi – 'TypeError: Voi lisätä sanelun vain, jos ignore_index=True'.
  3. Voimme tarkistaa päällekkäiset indeksit verify_integrity-parametrilla (oletuksena = False). Jos indeksit ovat päällekkäisiä ja verify_integrity-asetuksena on 'True', se palauttaa 'ValueError: Indekseillä on päällekkäisiä arvoja'.
  4. Sarakkeet on mahdollista lajitella, jos olemassa olevan DataFramen ja toisen DataFramen sarakkeita ei ole kohdistettu lajitteluparametrilla asettamalla se arvoon 'True' (oletuksena = False).

Esimerkki 1: Liitä yksittäinen sanakirja

Luo Pandas DataFrame, jossa on neljä saraketta – 'Campaign_Name', 'Location', 'StartDate' ja 'Budget' - ja kolme riviä. Liitä sanakirja tähän DataFrame-kehykseen.



tuonti pandat

# Luo DataFrame - Kampanja, jossa on 4 saraketta ja 3 riviä
Kampanja = pandat. Datakehys ( [ [ 'Markkinointileiri' , 'Intia' , '01/12/2023' , 8000 ] ,
[ 'Myyntileiri' , 'Italia' , '25.01.2022' , 10 000 ] ,
[ 'Toinen leiri' , 'USA' , '17.04.2023' , 2000 ] ] ,
sarakkeita = [ 'Campaign_Name' , 'Sijainti' , 'Aloituspäivämäärä' , 'Budjetti' ] )
Tulosta ( Kampanja , ' \n ' )

# Liitä yksi rivi
Kampanja = Kampanja. liittää ( { 'Campaign_Name' : 'Tekninen leiri' , 'Sijainti' : 'USA' , 'Aloituspäivämäärä' : '05/12/2023' , 'Budjetti' : 2000 } , ignore_index = Totta )
Tulosta ( Kampanja , ' \n ' )

Lähtö :





Näemme, että sanakirja on liitetty 'Campaign' DataFrame -kehykseen. Tämän uuden rivin indeksi on 3, koska indeksi jätetään huomiotta.



Esimerkki 2: Liitä useita sanakirjoja

Käytä samaa DataFrame-kehystä, joka on luotu esimerkissä 1, ja lisää kolme riviä kerrallaan pandas.DataFrame.append()-funktiolla. Aseta ignore_index-parametriksi 'True'.

tuonti pandat

# Luo DataFrame - Kampanja, jossa on 4 saraketta ja 3 riviä
Kampanja = pandat. Datakehys ( [ [ 'Markkinointileiri' , 'Intia' , '01/12/2023' , 8000 ] ,
[ 'Myyntileiri' , 'Italia' , '25.1.2022' , 10 000 ] ,
[ 'Toinen leiri' , 'USA' , '17.04.2023' , 2000 ] ] ,
sarakkeita = [ 'Campaign_Name' , 'Sijainti' , 'Aloituspäivämäärä' , 'Budjetti' ] )
Tulosta ( Kampanja , ' \n ' )

Kampanja = Kampanja. liittää ( { 'Campaign_Name' : 'Tekninen leiri' , 'Sijainti' : 'USA' , 'Aloituspäivämäärä' : '05/12/2023' , 'Budjetti' : 2000 } , ignore_index = Totta )
Kampanja = Kampanja. liittää ( { 'Campaign_Name' : 'Markkinointileiri' , 'Sijainti' : 'Intia' , 'Aloituspäivämäärä' : '23.06.2023' , 'Budjetti' : 9000 } , ignore_index = Totta )
Kampanja = Kampanja. liittää ( { 'Campaign_Name' : 'Males Camp' , 'Sijainti' : 'Italia' , 'Aloituspäivämäärä' : '24.01.2023' , 'Budjetti' : 1200 } , ignore_index = Totta )
Tulosta ( Kampanja )

Lähtö :

Olemassa olevaan DataFrame-kehykseen lisätään peräkkäin kolme riviä 3, 4 ja 5 indeksillä.

Pandas.Concat

Pandas.concat()-funktio ketjuttaa kaksi tai useampi datakehys rivejä tai sarakkeita pitkin. Joten meidän on muutettava sanakirja DataFrame-kehykseksi ja siirrettävä kaksi DataFrame-kehystä tälle funktiolle.

Syntaksi :

Liitä sanakirja olemassa olevaan DataFrame-kehykseen:

pandat. concat ( [ Existing_DataFrame , Transformed_Dictionary ] , akseli = 0 , ignore_index , verify_eheys )
  1. Jos akseli = 0, ketjutus tehdään rivejä pitkin. Yhdistäminen tehdään sarakkeita pitkin, jos se on asetettu. Tarvittavat isot kirjaimet ovat käytössä, koska tämä on alaotsikko. Lisätty tarvittava artikkeli lyhyyden vuoksi.to 1.
  2. ignore_index (oletuksena = False): Tätä parametria käytetään, kun lisäät rivejä DataFrame-kehykseen, jossa on jo rivejä. Jos se on 'False', myös olemassa olevat riviindeksit liitetään. Jos se on 'True', rivit merkitään 0 - n-1.
  3. Voimme tarkistaa päällekkäiset indeksit verify_integrity-parametrilla (oletuksena = False). Jos indeksit ovat päällekkäisiä ja verify_integrity-asetuksena on 'True', se palauttaa 'ValueError: Indekseillä on päällekkäisiä arvoja'.

Esimerkki 1: Liitä yksi sanakirja

Luo Pandas DataFrame, jossa on neljä saraketta – 'Campaign_Name', 'Location', 'StartDate' ja 'Budget' - ja kolme riviä. Käytä pandas.concat()-funktiota ja lisää yksi sanakirja (DataFrame) riviksi tähän DataFrame-kehykseen.

tuonti pandat


# Luo DataFrame - Kampanja, jossa on 4 saraketta ja 3 riviä
Kampanja = pandat. Datakehys ( [ [ 'Markkinointileiri' , 'Intia' , '01/12/2023' , 8000 ] ,
[ 'Myyntileiri' , 'Italia' , '25.01.2022' , 10 000 ] ,
[ 'Toinen leiri' , 'USA' , '17.04.2023' , 2000 ] ] ,
sarakkeita = [ 'Campaign_Name' , 'Sijainti' , 'Aloituspäivämäärä' , 'Budjetti' ] )
Tulosta ( Kampanja , ' \n ' )

dictionary_from_DataFrame = pandat. Datakehys ( [ { 'Campaign_Name' : 'palveluleiri' , 'Sijainti' : 'USA' , 'Aloituspäivämäärä' : '17.04.2023' , 'Budjetti' : 1000 } ] )

# Liitä yksi rivi
Kampanja = pandat. concat ( [ Kampanja , dictionary_from_DataFrame ] , akseli = 0 )
Tulosta ( Kampanja , ' \n ' )

Lähtö :

Näemme, että sanakirja on liitetty 'Campaign' DataFrame -kehykseen. Tämän uuden rivin indeksi on 0, koska indeksiä ei huomioida.

Esimerkki 2: Liitä useita sanakirjoja

Käytä edellistä DataFrame-kehystä ja liitä kolme sanakirjaa (DataFrame) jättämällä hakemisto huomioimatta.

tuonti pandat


# Luo DataFrame - Kampanja, jossa on 4 saraketta ja 3 riviä
Kampanja = pandat. Datakehys ( [ [ 'Markkinointileiri' , 'Intia' , '01/12/2023' , 8000 ] ,
[ 'Myyntileiri' , 'Italia' , '25.01.2022' , 10 000 ] ,
[ 'Toinen leiri' , 'USA' , '17.04.2023' , 2000 ] ] ,
sarakkeita = [ 'Campaign_Name' , 'Sijainti' , 'Aloituspäivämäärä' , 'Budjetti' ] )
Tulosta ( Kampanja , ' \n ' )

dictionary_from_DataFrame = pandat. Datakehys ( [ { 'Campaign_Name' : 'Tech Camp' , 'Sijainti' : 'USA' , 'Aloituspäivämäärä' : '17.5.2023' , 'Budjetti' : 1000 } ,
{ 'Campaign_Name' : 'Sosiaalipalvelut' , 'Sijainti' : 'Japani' , 'Aloituspäivämäärä' : '17.04.2023' , 'Budjetti' : 200 } ,
{ 'Campaign_Name' : 'Myyntileiri' , 'Sijainti' : 'USA' , 'Aloituspäivämäärä' : '18.04.2023' , 'Budjetti' : 500 } ] )

# Liitä useita rivejä
Kampanja = pandat. concat ( [ Kampanja , dictionary_from_DataFrame ] , akseli = 0 , ignore_index = Totta )
Tulosta ( Kampanja , ' \n ' )

Lähtö :

Näemme, että 'Campaign' DataFrame -kehykseen on liitetty kolme sanakirjaa. Näiden sanakirjojen indeksit ovat 3, 4 ja 5, koska ignore_index-parametrin arvo on 'False'.

Johtopäätös

Yksittäiset tai useat sanakirjat liitetään DataFrameen käyttämällä funktioita pandas.DataFrame.append() ja pandas.concat(). Uusien rivien indeksit voivat olla yksilöllisiä asettamalla ignore_index-parametrin arvoksi 'True' pandas.concat()-funktiossa. Kun käytät funktiota pandas.DataFrame.append(), aseta ignore_index-parametrin arvoksi 'True'. Muussa tapauksessa TypeError nostetaan esiin.