Mitä ovat AWS:n luetteloindeksointirobotit?

Mita Ovat Aws N Luetteloindeksointirobotit



Datalla on ollut valtava vaikutus yritysten kasvuun, koska monet niistä ovat erittäin riippuvaisia ​​siitä saadakseen näkemyksiä siitä. Metadata on dataa koskevaa dataa, joka selittää tiedot, jotta dataa voidaan käyttää mahdollisimman suuren tiedon saamiseksi. Metadata sisältää tietoja, kuten tietojen sijainnin, skeeman rakenteen, tietotyypin tai esimerkiksi tiedon omistajan.

Tämä opas selittää AWS:n indeksointirobotit.

Mitä ovat AWS:n luetteloindeksointirobotit?

Indeksointirobotti on AWS-liiman osa, jota käytetään indeksoimaan tietosijainnin yli ja päättelemään tiedot takaisin luetteloon. Indeksoijan keräämät tiedot voivat olla datatyyppejä, skeemarakennetta tai toisin sanoen se kerää metatietoja. Indeksointia voidaan käyttää myös Data-luettelon kanssa, jota käytetään, kun tietoja siirretään Glue-ekosysteemin sisällä ETL-töitä käytettäessä jne.









Mikä on Amazon Glue Service?

AWS Glue on Amazon Extract Transform and Load -palvelu, jonka avulla käyttäjä voi järjestää, paikantaa, siirtää ja muuntaa kaiken tiedon. AWS Glue on palvelimeton, koska käyttäjän ei tarvitse valmistaa ja määrittää palvelimia tai hallita elinkaaria. Tietoluettelo ja indeksointirobotit ovat AWS Gluen komponentteja, jotka toimivat pysyvänä metatietovarastona:







Kuinka luoda indeksointirobotti AWS:ssä?

Luo indeksointirobotti AWS:ssä käymällä AWS Glue -palvelussa AWS-hallintakonsolista:



Suuntaa ' Indeksoijat ” -sivu napsauttamalla sen nimeä vasemmasta paneelista:

Klikkaa ' Luo indeksointirobotti ”-painike:

Kirjoita indeksointirobotin nimi ja napsauta ' Seuraava ”-painike:

Valitse liimataulukoiden kartoitusvaihtoehto ja napsauta ' Lisää lähde ” -painiketta saadaksesi tiedot:

Valitse S3-palvelu ja napsauta ' Selaa S3 ” -painiketta saadaksesi lähteen sijainnin:

Valitse vain S3-kansio ja napsauta ' Valita ”-painike:

Kun sijainti on lisätty lähteeseen, napsauta ' Lisää S3-tietolähde ”-painike:

Klikkaa ' Seuraava ”-painike:

Klikkaa ' Luo uusi IAM-rooli ' -painiketta kohdasta ' Määritä suojausasetukset ”-osio:

Kirjoita roolin nimi ja napsauta ' Luoda ”-painike:

Napsauta sen jälkeen ' Seuraava ”-painike:

Valitse kohdetietokanta ja kirjoita taulukolle käytettävä nimi:

Ajoita indeksointi ' Tarpeen vaatiessa ' ja napsauta ' Seuraava ”-painike:

Tarkista kokoonpano ja napsauta ' Luo indeksointirobotti ”-painike:

Indeksointirobotti on luotu onnistuneesti ja sitä voidaan käyttää tietojen hakemiseen lähteestä napsauttamalla ' Juosta ”-painike:

Siinä kaikki AWS:n indeksointiroboteista.

Johtopäätös

ListCrawler on AWS Glue -palvelun osa, jonka avulla voidaan indeksoida tietoja lähteistä ja palata luetteloon. Tietoluetteloita ja indeksointirobotteja voidaan käyttää tietojen keräämiseen saadakseen tietoa tiedoista, joita kutsutaan metadataksi. Käyttäjä voi myös luoda indeksointirobotin AWS Gluesta saadakseen tietoja S3-palvelusta tai muista lähteistä ja sijoittaa luontitaulukoita tietokantaan. Tässä oppaassa on selitetty AWS:n ListCrawlers ja kuinka niitä luodaan.