CalendarioIl programma completo dei prossimi corsi Corsi solo "In House"I corsi che teniamo solo presso i nostri clienti InformazioniTutte le notizie utili per partecipare ai corsi IscrizioniLe informazioni per iscriversi ai corsi
Big Data: tecnologie e problematiche - Technology Transfer

Big Data: tecnologie e problematiche



Dal 19 aprile 17 al 21 aprile 17
Costo: 1.100,00 Euro + IVA


Visconti Palace Hotel
Via Federico Cesi, 37
00193 Roma (RM)

maggiori informazioni...

Segnala ad un amico

Descrizione

I Big Data rappresentano la principale tendenza in campo informatico degli ultimi anni. Con Big Data si intendono dataset aventi dimensioni e caratteristiche tali da non essere facilmente trattati con sistemi tradizionali quali, ad esempio, i database relazionali. Questo non vuol dire che gli strumenti di gestione dati normalmente presenti in azienda non siano in grado di trattare i Big Data ma che il loro utilizzo può essere poco produttivo in termini di tempi e costi di elaborazione. A tal fine, gli strumenti tradizionali, possono essere affiancati (mai sostituiti) da nuovi prodotti quali file system distribuiti, database NoSQL e framework di elaborazione distribuita come map reduce. La scelta degli strumenti non può essere fatta in modo superficiale e deve essere basata sui requisiti di business dell’azienda.

Ma quali caratteristiche devono avere i dati per essere considerati “Big”? Quali vantaggi di business possono derivare dalla loro elaborazione? Quali sono le principali tecnologie per la loro memorizzazione, elaborazione e gestione? Questo corso vuole fornire una panoramica sullo stato dell’arte delle tecnologie e dei processi per la gestione di Big Data.

Gli argomenti sono descritti tramite l’esposizione di casi di studio reali.

A chi si rivolge

  • Capi progetto
  • Analisti
  • Progettisti
  • Sviluppatori
  • Chiunque sia interessato ad approfondire i concetti relativi ai Big Data

Prerequisiti

Conoscenze base sui database, sulle tecnologie internet e sulle applicazioni distribuite.

Argomenti Trattati

Introduzione ai Big Data

  • Cosa sono i Big Data
  • Quanto sono grandi i Big Data? Le principali proprietà: volume, velocità, varietà, valore, veracità
  • Classificazione dei Big Data
  • Come individuare i Big Data
  • Sorgenti di provenienza dei Big Data
  • Quali opportunità per il business? Vantaggi e svantaggi nel loro utilizzo
  • Come si posizionano i Big Data rispetto agli strumenti tradizionali (RDBMS, DWH, BI…)
  • Il processo di gestione dei Big Data

Come memorizzare i Big Data

  • pattern architetturali 
  • utilizzo di file system distribuiti (es. HDFS)
  • database NoSQL e loro classificazione
  • criteri per la scelta dello strumento di storage
  • il concetto di Data Lake: cos’è e come implementarlo 
  • come trasferire i dati da e verso il Data Lake
  • memorizzare i dati in base alle esigenze del business
  • strumenti per il trasferimento dei dati

Come elaborare e analizzare i Big Data

  • Elaborazione distribuita
  • Map/Reduce
  • Strumenti per l’implementazione del Map/Reduce (YARN, TEZ, PIG…)
  • Integrazione con i linguaggi di programmazione tradizionali
  • Real-time analytics e complex event processing
  • Utilizzo di Spark, Python e R
  • Concetti base di Data Mining

Come interrogare e come visualizzare i Big Data

  • Utilizzo degli strumenti e dei linguaggi di interrogazione nativi
  • Mapping su SQL (Hive, Drill, Impala.)
  • Integrazione con RDBMS e con strumenti di Business Intelligence tradizionali

Big Data Governance

  • Che cos’è la data governance
  • Processo di governance
  • Il repository dei metadati
  • ruoli e responsabilità
  • Nuove figure professionali (es. Data Scientist)

Introduzione ad Hadoop

  • Che cos’è Hadoop
  • Principali strumenti forniti
  • Principali pattern architetturali
  • Principali distribuzioni a confronto (MapR, Cloudera, Hortonworks)

Principali NoSQL Database a confronto

  • Architettura, caratteristiche e funzionalità di MongoDB, Cassandra, CouchDB e altri

Integrazione con i sistemi aziendali esistenti

  • Architetture di integrazione
  • Strumenti utilizzabili

Problematiche di sicurezza e privacy

  • Come memorizzare i dati in modo sicuro
  • Gestione multitenancy
  • Politiche di accesso

Casi di studio ed esempi pratici

Precedenti Edizioni

Dal 06 luglio 2016 al 08 luglio 2016
Dal 04 maggio 2016 al 06 maggio 2016
Dal 16 dicembre 2015 al 18 dicembre 2015

Scarica il Calendario dei Corsi

Scarica il Programma Completo dei Corsi