Inženjerstvo podataka rapidno je napredovao u protekloj deceniji, ostavljajući mnoge softverske inženjere, naučnike podataka i analitičare u potrazi za sveobuhvatnim pogledom na ovu praksu. Uz pomoć ove praktične knjige, naučićete kako da planirate i gradite sisteme koji služe potrebama vaše organizacije i klijenata prikazivanjem najboljih dostupnih tehnologija kroz okvir životnog ciklusa inženjerstva podataka.
Autori Joe Reis i Matt Housley vode vas kroz životni ciklus inženjerstva podataka i pokazuju kako da povežete različite klaud tehnologije kako biste zadovoljili potrebe korisnika podataka. Razumećete kako da primenite koncepte generisanja, unošenja, orkestracije, transformacije, skladištenja i upravljanja podacima koji su ključni u bilo kom okruženju podataka, nezavisno od primenjene tehnologije.
U knjizi ćete naći:
Pregled čitave oblasti inženjerstva podataka
Procene problema inženjerstva podataka koristeći najbolje prakse
Tehnologije, arhitekture i procese za podatke
Životni ciklus inženjerstva podataka za dizajniranje i izgradnju robusne arhitekture
Upravljanje i bezbednost podataka
Joe Reis je naučnik, inženjer i arhitekta podataka.
Matt Housley je konsultant za inženjerstvo podataka i stručnjak za klaud.
Osnove inženjerstva podataka su odličan uvod u posao premeštanja, obrade i upravljanja podacima. Toplo bih je preporučio svakome ko želi da se upozna sa inženjerstvom i analitikom podataka, ili postojećim praktičarima koji žele da popune praznine u svom razumevanju."
—Jordan Tigani osnivač i izvršni direktor, MotherDuck i jedan od osnivača i kokreatora BigQueryja
Sadržaj
Predgovor, xvii
Deo I Temelji i gradivni blokovi
1. Opis inženjerstva podataka, 3
2. Životni ciklus inženjerstva podataka, 35
3. Projektovanje dobre arhitekture podataka, 75
4. Izbor tehnologija tokom ciklusa inženjerstva podataka, 121
Deo II Životni ciklus inženjerstva podataka
5. Generisanje podataka u izvornim sistemima, 163
6. Skladištenje, 199
7. Unošenje podataka, 245
8. Upiti, modelovanje i transformacija, 283
9. Serviranje podataka za analitiku, mašinsko učenje i reverzan ETL, 351
Deo III Bezbednost, privatnost i budućnost inženjerstva podataka
10. Bezbednost i privatnost, 385
11. Budućnost inženjerstva podataka, 395
A. Serijalizacija i kompresija: tehnički detalji, 407
B. Umrežavanje u oblaku, 415
Indeks, 419
USPEŠNO DODATO U KORPU