Tesseractin asentaminen Windowsiin

Tesseractin Asentaminen Windowsiin



Tesseract on vapaasti saatavilla oleva avoimen lähdekoodin tekstintunnistustyökalu, joka tunnetaan myös nimellä OCR (optinen merkintunnistus). Sitä käytetään ensisijaisesti tekstin tunnistamiseen ja poimimiseen kuvista. Se lukee tekstiä kuvatiedoista ja kirjoittaa tulosteen uuteen .txt-tiedostoon. Tesseract toimii myös Pythonin alla, sillä sitä käytetään pääasiassa käsinkirjoituksen tunnistamiseen kuvista. Se käyttää LSTR (Long short-term memory) -mallia. Tesseract toimii Apache 2.0 -lisenssillä.

Tässä blogissa kerromme tarkemmin menetelmästä, jolla Tesseract asennetaan Windowsiin.







Joten aloitetaan!



Kuinka asentaa Tesseract Windowsiin?

Tesseract on komentorivityökalu, jota käytetään tekstin poimimiseen kuvista. Asentaaksesi Tesseractin Windowsiin, sinun on noudatettava alla annettuja ohjeita.



Vaihe 1: Lataa Tesseract Installer





Siirry ensin alla olevaan linkkiin ja lataa Tesseract-asennusohjelma järjestelmätietojesi mukaisesti:

https: // github.com / UB-Mannheim / tesserakti / viikko



Vaihe 2: Suorita Tesseract Installer

Vieraile ' Lataukset ” hakemistoon, johon Tesseract-asennusohjelma ladataan. Asenna Tesseract Windowsiin suorittamalla Tesseract-asennusohjelma kaksoisnapsauttamalla sitä:

Vaihe 3: Valitse kieli

Tesseract-asennusohjelma tukee monia kieliä. Jos haluat olla vuorovaikutuksessa asennusohjelman käyttöliittymän kanssa, valitse ' Englanti ' kieleksi ja napsauta ' OK ':

Vaihe 4: Asenna Tesseact

Kun teet niin, Tesseract OCR:n ohjattu asennustoiminto ilmestyy näyttöön. Aloita Tesseractin asennus napsauttamalla ' Seuraava ”-painike:

Hyväksyäksesi ' Lisenssisopimus ', Klikkaa ' Olen samaa mieltä ”-painike:

Valitse ' Asenna kaikille tietokoneen käyttäjille ' -vaihtoehto ja paina ' Seuraava ”-painike:

Jos haluat lisätä skriptitietoja tai sisällyttää toisen kielen, merkitse niiden vastaavat valintaruudut ja paina ' Seuraava ”-painiketta. Koska emme siksi halua lisätietokomentosarjaa tai -kieltä, jatkamme oletusarvoisesti valituilla vaihtoehdoilla:

Valitse asennuspaikka ja napsauta ' Seuraava ”-painike:

Jos et halua luoda pikakuvaketta Käynnistä-valikossa, merkitse ' Älä luo oikopolkuja ' -valintaruutu ja paina ' Asentaa ”-painike:

Sen jälkeen Tesseractin asennus alkaa. Odota, kunnes asennus on valmis ja paina ' Seuraava ”-painike:

Napsauta lopuksi ' Suorittaa loppuun ”-painike:

Vaihe 5: Aseta ympäristömuuttuja

Asennuksen jälkeen sinun on asetettava Tesseractin ympäristömuuttuja. Voit tehdä tämän siirtymällä ensin hakemistoon, johon olet asentanut Tesseractin ja kopioimalla polun ' Osoite ' baari:

Tee haku ' ympäristömuuttujat ' kohdassa ' Aloittaa 'valikko ja avaa' Muokkaa järjestelmäympäristömuuttujia ':

Siirry asetuksissa kohtaan ' Pitkälle kehittynyt ' asetusvalikko ja napsauta ' ympäristömuuttujat ”-painike:

Valitse ' Polku 'Muuttuja '' Järjestelmän muuttujat ' -paneeli ja paina ' Muokata ”-painike:

Sen jälkeen ' Muokkaa ympäristömuuttujaa ' -ikkuna tulee näkyviin näytölle. Paina ' Uusi ” -painiketta ja liitä kopioitu Tesseract-asennushakemistopolku tähän. Napsauta lopuksi ' OK ”-painike:

Vaihe 6: Tarkista Tesseractin asennus

Tarkista Tesseract-asennus avaamalla Windowsin komentokehote etsimällä ' Komentokehote ' kohdassa ' Aloittaa ”valikko:

Tarkista Tesseract-versio käyttämällä annettua komentoa:

> tesserakti --versio

Alla oleva tulos osoittaa, että olemme onnistuneesti asentaneet Tesseract-version ' v5.2.0 ' Windowsissa:

Siirrytään eteenpäin tarkistaaksemme, kuinka Tesseractia käytetään Windowsissa.

Kuinka käyttää Tesseractia Windowsissa?

Tesseractia käytetään käsinkirjoituksen lukemiseen tai tekstin poimimiseen kuvista. Katsotaan kuinka se toimii:

Vaihe 1: Valitse kuva

Valitse kuva, josta haluat poimia tekstiä. Kuten olemme valinneet' 1.png ':

Vaihe 2: Pura teksti kuvasta

Kun CMD on avattu. Käytä ' CD ” -komento muuttaaksesi hakemistoa, johon kuva on tallennettu. Suorita sitten ' tesserakti ' -komento ja määritä kuvatiedoston nimi määrittämämme ' 1.png ”. ' Teksti ” parametri näyttää tulostiedoston nimen:

> CD C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesserakti 1 .png 'Teksti'

Vaihe 3: Tarkista tekstin purkaminen

Tarkistaaksesi tekstin purkamisen, siirry hakemistoon, jossa kuvatiedosto on. Voit nähdä, että tulostiedosto ' Teksti ” on myös tallennettu tänne. Kaksoisnapsauta tulostiedostoa tarkistaaksesi, onko tesserakti poiminut tekstin kuvasta vai ei:

Voit nähdä, että olemme poimineet tekstin onnistuneesti käyttämällä Tesseract-komentorivityökalua:

Olemme osoittaneet tekniikan Tesseractin asentamiseksi ja käyttämiseksi Windowsissa.

Johtopäätös

Tesseractin asentaminen Windowsiin edellyttää Tesseractin asennusohjelman lataamista. Seuraa tätä tarkoitusta varten tämän artikkelin ensimmäistä istuntoa. Aseta seuraavaksi Path-ympäristömuuttuja käyttämään Tesseractia Windowsin komentokehotteesta. Valitse sitten kuvatiedosto ja käytä ' Tesseact ” -komento tunnistaa ja poimia tekstin kuvasta. Täällä olet oppinut asentamaan ja käyttämään ' Tesseact ”ikkunoissa.