Luettelo 10 parhaasta datatieteen kirjasta ja kuvauksista generalistille

Luettelo 10 Parhaasta Datatieteen Kirjasta Ja Kuvauksista Generalistille



Datatiede on tutkimusala, joka käsittelee valtavia tietomääriä tieteellisillä menetelmillä, prosesseilla, algoritmeilla ja järjestelmillä löytääkseen näkymättömiä kaavoja, johtaakseen merkityksellistä tietoa, tehdäkseen liiketoimintapäätöksiä yrityksissä ja käyttääkseen sitä myös ei-liiketoiminnassa. Ei-liiketoiminnan instituutioita ovat terveydenhuolto, pelit, kuvantunnistus, suositusjärjestelmät, logistiikka, petosten havaitseminen (pankit ja rahoituslaitokset), Internet-haku, puheentunnistus, kohdennettu mainonta, lentoreittien suunnittelu ja lisätty todellisuus. Tietotiede on tekoälyn alajoukko. Analyysissä käytettävät tiedot voivat tulla useista eri lähteistä ja ne esitetään eri muodoissa. Osa lähdetiedoista voi olla standardoituja; muita ei ehkä ole standardoituja.

Toisin sanoen datan keräämiseen käytetään erilaisia ​​menetelmiä (datumin monikko). Sitten kootusta tiedosta poimitaan tietoa (arvokkaita johtopäätöksiä). Prosessissa, kun tiedot on kerätty, niitä (dataa) tutkitaan saadakseen uutta tietoa (tuloksia), joista ongelmat ratkaistaan.







Tietotiede (pää)tieteenalana on olemassa yliopiston kandidaatin ja maisterin tutkintotasolla. Kuitenkin vain harvat yliopistot maailmassa tarjoavat datatieteen kandidaatin tai maisterin tutkinnon. Kandidaatin tutkintotasolla opiskelija valmistuu tietotieteen tutkinnon. Tämä on kuin yleiskäyttöinen tutkinto. Maisterintutkintotasolla opiskelija lähtee suorittamalla datatieteen jatkotutkinnon, joka on erikoistunut tietoanalyysiin, tietotekniikkaan tai tietotieteilijäksi.



Lukija saattaa yllättyä ja mahdollisesti valitettavasti, että koneoppiminen, mallintaminen, tilastot, ohjelmointi ja tietokannat ovat tietotekniikan kandidaattitason opiskelun edellytyksiä huolimatta siitä, että ne ovat omissa oikeuksissaan arvostettuja yliopistokursseja. muut tieteenalat kandidaatin tai maisterin tasolla. Siitä huolimatta, että kun opiskelija menee yliopistoon opiskelemaan tietotieteitä tutkintotason tasolla, kaikki nämä kurssit opiskellaan silti tietojenkäsittelytieteen omien kurssien rinnalla tai ennen niitä.



Tietotiede kandidaatin tutkintoon tai sen erikoisaloja, kuten Data Analytics, Data Engineering tai tietotieteilijä, kehitetään edelleen; vaikka he ovat saavuttaneet vaiheen, jossa niitä sovelletaan teollisuudessa opiskeltuaan (yliopistossa). Tietotiede on kaiken kaikkiaan suhteellisen uusi tieteenala.





Muista, että sinun tulee ensin olla yleislääkäri ennen kuin alat ryhtyä asiantuntijaksi. Erikoisohjelmien väliset erot eivät ole vielä selviä. Erot yleis- ja asiantuntijaohjelmien välillä eivät ole vielä selvät.

Koska tietotiede on suhteellisen uusi tieteenala, tässä asiakirjassa esitetyt kirjat perustuvat sisällön kattamiseen eivätkä pedagogiikkaan (kuinka hyvin kirja opettaa). Ja ne ovat Bachelor's Degree (yleisopiskelija) -ohjelmaa varten. Yleisiä kursseja on erilaisia.



Lista

Lisätietoa ja mahdollista luottokortilla ostamista varten on hyperlinkki jokaiseen kirjaan. Yksikään kirjoista ei kata kaikkia yleisiä kursseja.

Tärkeää datatieteen matematiikkaa: laskenta, tilastot, todennäköisyysteoria ja lineaarinen algebra

Käsikirjoitus: Hadrien Jean

  • Kustantaja: Hadrien Jean
  • Julkaisupäivä: 30.9.2020 jälkeen
  • Kieli: Englanti
  • Sivujen lukumäärä: yli 400

Tämän kirjan sisältöä voidaan pitää tietotieteen matematiikan kurssina. Vaikka datatieteen opiskelua ei suositella itse, lukiosta valmistuneen, joka haluaa oppia datatiedettä itse, kannattaa aloittaa tästä kirjasta.

Sisältö: Calculus; Tilastot ja todennäköisyys; Lineaarialgebra; skalaarit ja vektorit; Matriisit ja tensorit; Span, lineaarinen riippuvuus ja avaruusmuunnos; Lineaariyhtälöjärjestelmät; Ominaisvektorit ja ominaisarvot; Singular Value Decomposition.

https://www.essentialmathfordatascience.com/

Tervejärkeä koskeva opas tietorakenteisiin ja algoritmeihin: nosta perusohjelmointitaitojasi / 2. painos

Käsikirjoitus: Jay Wengrow

  • Kustantaja: Pragmatic Bookshelf
  • Julkaistu: 15.9.2020
  • Kieli: Englanti
  • Mitat: 7,5 x 1,25 x 9,25 tuumaa
  • Sivujen lukumäärä: 508

Tämä kirja käsittelee datatieteessä käytettäviä algoritmeja ja tietorakenteita. Olettaen, että joku opiskelee tietotieteitä itse lukiosta valmistumisen jälkeen, tämä on seuraava kirja, joka luetaan edellisen matematiikan kirjan lukemisen jälkeen. Esimerkkiohjelmat ovat JavaScript-, Python- ja Ruby-kielillä.

Sisältö: Miksi tietorakenteet ovat tärkeitä; Miksi algoritmeilla on merkitystä; Oi kyllä! Iso O-merkintä; Nopeuttaa koodiasi Big O:lla; Koodin optimointi isolla O:lla ja ilman sitä; Optimointi optimistisia skenaarioita varten; Big O jokapäiväisessä koodissa; Blazing Fast Lookup hash-taulukoilla; Elegantin koodin luominen pinojen ja jonojen avulla; Rekursiivisesti Recurse with Recursion; Rekursiivisen kirjoittamisen oppiminen; Dynaaminen ohjelmointi; Rekursiiviset nopeuden algoritmit; Solmupohjaiset tietorakenteet; Kaikkien asioiden nopeuttaminen binäärihakupuilla; Pidä prioriteetit suorina kasoilla; Kokeileminen ei satu; Kaiken yhdistäminen kaavioilla; Tilarajoitusten käsittely; Tekniikat koodin optimointiin

Älykkäämpää datatiedettä: Menestystä yritystason datan ja tekoälyprojektien avulla / 1 st Muokkaus

Käsikirjoitus: Neal Fishman, Cole Stryker ja Grady Booch

  • Kustantaja: Wiley
  • Julkaistu: 14.4.2020
  • Kieli: Englanti
  • Sivujen lukumäärä: 286

Sisältö: AI Ladder -kiipeily; Kehystys osa I: Tekoälyä käyttäviä organisaatioita koskevia huomioita; Kehystysosa II: Tietojen ja tekoälyn kanssa työskentelyyn liittyviä näkökohtia; Katsaus analytiikkaan: enemmän kuin yksi vasara; Katse eteenpäin analytiikkaan: kaikki ei voi olla kynsiä; Toiminnan kurinalaisuuden käsitteleminen AI Ladderissa; Tietojesi käytön maksimointi: arvolähtöisyys; Tietojen arvottaminen tilastollisen analyysin avulla ja tarkoituksenmukaisen käytön mahdollistaminen; Pitkäaikainen rakentaminen; Matkan loppu: IA tekoälylle.

Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning -sarja) kuvitettu painos

Käsikirjoitus: Kevin P. Murphy

  • Kustantaja: The MIT Press
  • Julkaistu: 24. elokuuta 2012
  • Kieli: Englanti
  • Mitat: 8,25 x 1,79 x 9,27 tuumaa
  • Sivujen lukumäärä: 1104

Tämä kirja on hyvä aloittelijoille. Jälleen, kuten kaikki muutkin tässä asiakirjassa määrätyt kirjat, tämä kirja ei kata kaikkea, mitä tarvitaan yleisohjelmaan, jota ei valitettavasti ole vielä viimeistelty (ammattiohjelmia ei myöskään ole vielä viimeistelty). Tyypillinen aloittelija täällä on ylioppilas, jolla on matematiikan ja tietojenkäsittelytieteen tutkinto.

Sisältö: Johdanto (Koneoppiminen: mitä ja miksi?, Ohjaamaton oppiminen, Jotkut koneoppimisen peruskäsitteet); Todennäköisyys; Generatiiviset mallit diskreetille datalle; Gaussin mallit; Bayesin tilastot; Frequntist tilastot; Lineaarinen regressio; Logistinen regressio; Yleistetyt lineaariset mallit ja eksponentiaalinen perhe; Suunnatut graafiset mallit (Bayes-verkot); Seosmallit ja EM-algoritmi; Piilevät lineaariset mallit; Harvat lineaariset mallit; Ytimet; Gaussin prosessit; Mukautuvat perusfunktiomallit; Markov ja piilotetut Markov-mallit; valtion tila mallit; Ohjaamattomat graafiset mallit (Markovin satunnaiset kentät); Tarkka päättely graafisista malleista; Vaihteleva päättely; Lisää vaihtelevia päätelmiä; Monte Carlon johtopäätös; Markovin ketju Monte Carlo (MCMC) päätelmä; Klusterointi; Graafisen mallin rakenteen oppiminen; Piilevät muuttujamallit diskreetille datalle; Syvä oppiminen.

Data Science for Business: Mitä sinun tulee tietää tiedon louhinnasta ja data-analyyttisesta ajattelusta / 1. painos

Käsikirjoitus: Tom Fawcett ja Foster Provost

  • Kustantaja: O'Reilly Media
  • Julkaistu: 17.9.2013
  • Kieli: Englanti
  • Mitat: 7 x 0,9 x 9,19 tuumaa
  • Sivujen lukumäärä: 413

Sisältö: Data-analyyttinen ajattelu; Liiketoimintaongelmat ja tietotieteen ratkaisut; Johdatus ennustavaan mallinnukseen: korrelaatiosta valvottuun segmentointiin; Mallin sovittaminen tietoihin; Yliasennus ja sen välttäminen; Samankaltaisuus, naapurit ja klusterit; Päätösanalyyttinen ajattelu I: Mikä on hyvä malli?; Mallin suorituskyvyn visualisointi; Todisteet ja todennäköisyydet; Tekstin edustaminen ja louhinta; Päätös Analyyttinen ajattelu II: Kohti analyyttistä suunnittelua; Muut datatieteen tehtävät ja tekniikat; Tietotiede ja liiketoimintastrategia; Johtopäätös.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Käytännön tilastoja datatieteilijöille: 50+ olennaista käsitettä R:n ja Pythonin avulla / 2. painos

Käsikirjoitus: Peter Bruce, Andrew Bruce ja Peter Gedeck

  • Kustantaja: O'Reilly Media
  • Julkaistu: 2.6.2020
  • Kieli: Englanti
  • Mitat: 7 x 0,9 x 9,1 tuumaa
  • Sivujen lukumäärä: 368

Sisältö: Tutkiva data-analyysi, data- ja otantajakautumat, tilastolliset kokeet ja merkitsevyystestaus, regressio ja ennuste, luokittelu, tilastollinen koneoppiminen, ohjaamaton oppiminen.

The Book of Why: Syyn ja seurauksen uusi tiede

Käsikirjoitus: Judea Pearl, Dana Mackenzie

  • Kustantaja: Basic Book
  • Julkaistu: 15.5.2018
  • Kieli: Englanti
  • Mitat: 6,3 x 1,4 x 9,4 tuumaa
  • Sivujen lukumäärä: 432

Vaikka monet Data Science -kirjat käyttävät havainnollistamiseen puhdasta liike-elämää, tämä kirja käyttää havainnollistamiseen lääketeollisuutta ja muita tieteenaloja.

Sisältö: Johdanto: Mind over Data; Syy-yhteyden tikkaat; Buccaneersista marsuihin: kausaalisen päättelyn synty; Todistuksista syihin: pastori Bayes tapaa herra Holmesin; Hämmentäminen ja hämmennyksen purkaminen: Tai, Slaying the Lurking Variable; Savun täyttämä keskustelu: Ilman puhdistaminen; Paradokseja yllin kyllin!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrafaktuaalit: kaivosmaailmat, jotka olisivat voineet olla; Välitys: mekanismin etsiminen; Big Data, tekoäly ja suuret kysymykset.

Rakenna ura tietotieteessä

Käsikirjoitus: Emily Robinson ja Jacqueline Nolis

  • Kustantaja: Manning
  • Julkaistu: 24.3.2020
  • Kieli: Englanti
  • Mitat: 7,38 x 0,8 x 9,25 tuumaa
  • Sivujen lukumäärä: 354

Sisältö: Datatieteen käytön aloittaminen; Datatieteen työpaikan löytäminen; Tietotieteeseen asettuminen; Kasvu tietotieteen roolissasi.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2nd Edition

Käsikirjoitus: Lillian Pierson

  • Kustantaja: For Dummies
  • Julkaistu: 6. maaliskuuta 2017
  • Kieli: englanti
  • Mitat: 7,3 x 1 x 9 tuumaa
  • Sivujen lukumäärä: 384

Tämä kirja olettaa, että lukijalla on jo valmiiksi vaaditut matematiikan ja ohjelmoinnin tiedot.

Sisältö:  Pään kiertäminen datatieteen ympärille; Tietotekniikan putkilinjojen ja infrastruktuurin tutkiminen; Tietoihin perustuvien näkemysten soveltaminen liike-elämään ja teollisuuteen; Koneoppiminen: Datasta oppiminen koneellasi; Matemaattinen, todennäköisyys- ja tilastollinen mallinnus; Klusterin käyttö tietojen jakamiseen; Mallintaminen instanssien avulla; Esineiden internet-laitteita käyttävien mallien rakentaminen; Tietojen visualisoinnin suunnittelun periaatteiden noudattaminen; D3.js:n käyttö tietojen visualisointiin; Web-pohjaiset sovellukset visualisointisuunnitteluun; Kojelaudan suunnittelun parhaiden käytäntöjen tutkiminen; Karttojen tekeminen paikkatiedoista; Python for Data Science; Open Source R:n käyttö Data Sciencelle; SQL:n käyttö tietotieteessä; Datatieteen tekeminen Excelillä ja Knimellä; Tietotiede journalismissa: Viiden W:n (ja H:n) naulaaminen; Syventäminen ympäristötietotieteeseen; Datatiede sähköisen kaupankäynnin kasvun edistämiseksi; Datatieteen käyttäminen rikollisen toiminnan kuvaamiseen ja ennustamiseen; Kymmenen ilmiömäistä avoimen datan resurssia; Kymmenen ilmaista datatieteen työkalua ja sovellusta.

Massiivisten tietojoukkojen louhinta / 3 rd Muokkaus

Käsikirjoitus: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Kustantaja: Cambridge University Press
  • Julkaistu: 13.2.2020
  • Kieli: englanti
  • Mitat: 7 x 1 x 9,75 tuumaa
  • Sivujen lukumäärä: 565

Tässä kirjassa oletetaan myös, että lukijalla on jo valmiiksi vaaditut matematiikan ja ohjelmoinnin tiedot.

Sisältö: Tiedonlouhinta; MapReduce ja uusi ohjelmistopino; MapReducea käyttävät algoritmit; vastaavien kohteiden löytäminen; Tietovirtojen kaivostoiminta; Linkki analyysi; Usein esineet; Klusterointi; Mainonta Webissä; Suositusjärjestelmät; Sosiaalisen verkoston kaavioiden louhinta; Mittasuhteiden vähentäminen; Laajamittainen koneoppiminen.

Johtopäätös

Erikoisohjelmien väliset erot eivät ole vielä selviä. Myöskään yleis- ja asiantuntijaohjelmien välinen ero ei ole vielä selvä. Luettuaan annettu kirjaluettelo lukija pystyy kuitenkin ymmärtämään paremmin dataanalyytikon, tietotekniikan ja datatieteilijän erityisrooleja ja siirtyä sitten eteenpäin.