Responsable experto de data

Coste

Curso gratuito 100% financiado por el SEPE

Duraci贸n

240 h

Objetivo general:

Dominar el dato para entenderlo, transformarlo y capturar su m谩ximo potencial con inteligencia artificial para optimizar procesos y simplificar el desarrollo de los proyectos y, comenzar con la creaci贸n de modelos de machine learning.

Relaci贸n de m贸dulos de formaci贸n:

M贸dulo 1 Introducci贸n: la importancia del dato (6 horas).

– Concienciaci贸n en relaci贸n a c贸mo la ciencia del dato afecta a todos los sectores y puede ser el aliado perfecto para el mundo de los negocios.
– Conocimiento de los diferentes modelos de negocio basado en datos:
– Nuevos modelos de negocio en torno al dato.
– Tipolog铆a de datos y c贸mo se obtienen.
– Maneras de rentabilizar el dato.
– Data Business Model Canvas.
– Adquisici贸n de conocimientos sobre los avances en Big Data & Inteligencia Artificial (IA).
– Estado actual.
– Posible evoluci贸n futura.
– Dominio de Conceptos b谩sicos:
– Qu茅 es Big Data.
– Qu茅 es Machine Learning.
– Qu茅 es Deep Learning.
– Concienciaci贸n sobre el poder de los datos en las organizaciones tanto para mejorar la toma de decisiones como para crear modelos de negocio basado en datos.
– Visi贸n trasversal sobre c贸mo Data Science se aplica en las diferentes 谩reas de la organizaci贸n para impulsar las capacidades.

M贸dulo 2 Nociones iniciales de python, data engineering y estad铆stica (24 horas).

– Desarrollo de los fundamentos de Big Data.
– Qu茅 es el Big Data.
– Perfiles t茅cnicos: Data Analyst, Engineer, Arquitect, QA…
– El proceso de construir un proyecto de Big Data.
– Arquitecturas de Big Data.
– Las claves del 茅xito del big data.
– Identificaci贸n de los fundamentos de Machine Learning.
– Introducci贸n al Machine Learning: Datos, algoritmos, modelos, producci贸n…
– Aproximaci贸n a los algoritmos: clasificaci贸n, predicci贸n y clustering.
– Creaci贸n de modelos de Machine Learning.
– Las claves del aprendizaje autom谩tico.
– La productivizaci贸n de modelos.
– An谩lisis de los fundamentos de IA: Visi贸n, NPL…
– Introducci贸n al Deep Learning y sus aplicaciones.
– Tipos de redes neuronales y su entrenamiento.
– Funcionamiento y retos del Data Science aplicado al Computer Vision y al NPL.
– Conocimientos avanzados de Python Crash Course.
– Uso de pycharm como entorno de trabajo.
– Uso de notebooks.
– Conocimiento de la sintaxis del lenguaje: bucles, variables.
– Librer铆as.
– Funciones.
– Programaci贸n orientada a objetos en Python.
– Aproximaci贸n a la arquitectura de la informaci贸n y al SQL.
– Qu茅 es la arquitectura de datos.
– Modelo relacional tradicional.
– Modelo estrella.
– Modelo copo de nieve.
– Bases de la normalizaci贸n de datos.
– Definiciones esenciales: base de datos, tablespace, tabla, vista, vista materializada, clave primaria, 铆ndice y partici贸n.
– SQL.
– Sintaxis del lenguaje.
– Identificaci贸n del Crash course de python para data engineers: SQL y dataframes.
– Consulta de datos.
– Cruce de tablas.
– Inserci贸n y borrado.
– Dataframes:
– Qu茅 es una serie.
– Qu茅 es un dataframe.
– Cruces con dataframe.
– Funciones lambda con columnas.
– Leer y salvar datos desde y a dataframe desde distintos formatos.
– Diferenciaci贸n entre ETL/ELT y preproceso de datos.
– ELT o ETL.
– Pipelines de datos.
– 驴C贸mo estructurar los distintos pasos del workflow de datos?
– Automatizaci贸n de procesos.
– Aplicaci贸n del proceso del an谩lisis exploratorio.
– Arranque de un proceso exploratorio.
– Los objetivos de un an谩lisis exploratorio.
– Uso del proceso exploratorio para validaci贸n de hip贸tesis.
– Naturaleza iterativa del proceso.
– Utilizaci贸n de herramientas de visualizaci贸n exploratoria y librer铆as.
– An谩lisis descriptivo gr谩fico.
– An谩lisis descriptivo basado en estad铆sticos.
– Realizaci贸n de an谩lisis univariante y multivariante.
– An谩lisis multivariante.
– An谩lisis univariante.
– Conocimiento de la Estad铆stica descriptiva.
– Media, mediana, momentos, etc.
– Desviaci贸n, varianza.
– Sesgos y medidas de homogeneidad de la informaci贸n.
– Aproximaci贸n breve al algebra lineal.
– Operaciones matriz-escalar.
– Operaciones matriz-matriz.
– Propiedades de las matrices: no conmutativa, asociativa, distributiva, matriz identidad.
– Trasposici贸n e inversa de una matriz.
– An谩lisis de correlaci贸n de variables: fundamentos de estad铆stica y probabilidad.
– Ingenier铆a de caracter铆sticas: descarte y selecci贸n de caracter铆sticas.
– C贸mo analizar la correlaci贸n entre variables.
– Efecto de las correlaciones.
– Eliminaci贸n de la correlaci贸n.
– Deducci贸n estad铆stica y contraste de hip贸tesis.
– Definici贸n de una distribuci贸n una variable aleatoria.
– Definici贸n de una funci贸n de probabilidad.

M贸dulo 3 Conocimiento avanzado de machine learning & artificial intelligence (100 horas).

– Aproximaci贸n a la modelizaci贸n.
– Introducci贸n a la modelizaci贸n.
– Tipos de modelos.
– Identificaci贸n de los Modelos de regresi贸n.
– Modelos de regresi贸n simple.
– Modelos de regresi贸n m煤ltiple.
– Modelos de regresi贸n generalizado.
– Clasificaci贸n de los distintos modelos de 脕rboles: .
– Modelos de inferencia de 谩rboles de decisi贸n y regresi贸n:
– Clasificadores binarios.
– Regresi贸n.
– Modelos de inferencia de 谩rboles de decisi贸n: clasificadores multiclase.
– Modelos avanzados de 谩rboles:
– Boosting.
– Random forest.
– Conocimientos de Algoritmos alternativos de clasificaci贸n.
– Conocimientos de Eager y Lazy classifiers
– Utilizaci贸n de Clustering.
– Introducci贸n a los modelos no supervisados.
– An谩lisis cl煤ster.
– Aproximaci贸n al m茅todo cient铆fico:
– Evaluaci贸n de modelos.
– Evaluaci贸n y optimizaci贸n de modelos:
– Control de outliers y an谩lisis de residuos.
– Modelos no supervisados.
– Modelos supervisados.
– Creaci贸n de Ingenier铆a de variables:
– Principios de la ingenier铆a de variables en la creaci贸n de variables.
– La dimensionalidad.
– T茅cnicas: PCA y SVD.
– Ensamblado de modelos:
– Definici贸n de model ensembles.
– Modelos d茅biles y modelos fuertes.
– Creaci贸n de pipelines para crear modelos ensamblados.
– Gesti贸n del ciclo de vida de los modelos.
– Interpretabilidad.
– Aproximaci贸n a modelos heur铆sticos de optimizaci贸n
– Conocimiento de los algoritmos gen茅ticos.
– Principios de optimizaci贸n basado en heur铆sticos.
– Gradiente descendente.
– Modelos basados en comportamientos animales.
– El algoritmo gen茅tico.
– Aplicaciones de los algoritmos gen茅ticos.
– Cromosoma y funci贸n de fitness.
– Resoluci贸n de un problema usando algoritmos gen茅ticos.
– Utilizaci贸n de series temporales y forecasting.
– Bases sobre componentes de las series temporales: tendencia, ciclo y estacionalidad.
– Series estacionarias y no estacionarias.
– An谩lisis de anomal铆as.
– Suavizado exponencial.
– Modelos autoregresivos.
– Modelos univariantes y multivariantes.
– Modelos arima.
– Modelos con parametrizaci贸n autom谩tica.
– Gesti贸n de proyectos de Data Science.

M贸dulo 4 Aplicaciones del deep learning (36 horas).

– Aproximaci贸n a redes neuronales artificiales (ANN).
– 驴Qu茅 es una red neuronal artificial?
– Tipos de redes: profundas y superficiales (shallow).
– T茅cnica del gradiente descendiente.
– Conocimiento de los campos de aplicaci贸n de ANN.
– Visi贸n por computador.
– An谩lisis y s铆ntesis del lenguaje.
– An谩lisis de secuencias.
– GAN y deepfake.
– Aproximaci贸n al Shallow & Deep neural networks. Introducci贸n CNN.
– Perceptr贸n simple.
– Topolog铆as de redes neuronales.
– MNIST.
– Regularizaci贸n: L1, L2, dropout y otros.
– Creaci贸n de una CNN con keras.
– Comprensi贸n del dise帽o de redes neuronales artificiales (ANN), redes convolucionales (CNN) y redes recurrentes (RNN).

M贸dulo 5 Entornos big data & cloud (14 horas).

– Conocimientos de Big Data y de los principios de arquitecturas de computaci贸n distribuidas y altamente escalables.
– Comprender el papel del Big data en la ciencia de datos.
– Apache Spark.
– Spark en modo batch y en semi-tiempo real (microbatches).
– Lazy evaluation.
– Utilizaci贸n de Dataframes y Data pipelines en Spark.
– Operaciones sobre dataframes (SQL o pyspark).
– Creaci贸n de data pipelines con spark.
– Transformaci贸n de dataframes.
– Creaci贸n de modelos de Machine Learning en Spark.
– Entrenamiento de modelos e integraci贸n en pipelines.
– Aplicaci贸n de la inferencia de modelos en Spark.
– Despliegue de pipelines de modelos con Spark.
– Desarrollo de modelos con proveedores de Cloud Machine Learning.

M贸dulo 6 Visualizaci贸n de los datos (30 horas).

– Comprensi贸n de las claves del storytelling a trav茅s de los datos.
– La ciencia de la visualizaci贸n de datos y el storytelling: su valor en el mundo profesional.
– Uso del storytelling con datos.
– Principios de la comunicaci贸n visual de los datos.
– Uso de los distintos controles visuales.
– Comprensi贸n de los conceptos Business Intelligence y Data Visualization.
– Entender el proceso para trabajar en la herramienta de visualizaci贸n en un contexto de Business Intelligence.
– Fuentes de datos, tratamiento y preparaci贸n de datos, modelaje de datos (relaciones), an谩lisis exploratorio y espec铆ficos, visualizaci贸n y reporting.
– Profundizaci贸n en la herramienta PowerBI para poder conectar datos, prepararlos, modelarlos, explorarlos y visualizarlos.
– Entorno de PowerBI: organizaci贸n y componentes.
– Importaci贸n de datos.
– Visualizaciones b谩sicas realizando agrupaciones y aplicando filtros.
– Trabajar y preparar los datos: columnas calculadas, medidas, f贸rmulas con DAX, tablas calculadas鈥
– Trabajar con tablas matrices para aumentar la granularidad de los informes.
– Filtrar los datos de manera din谩mica con la segmentaci贸n de datos.
– Aproximaci贸n a la herramienta Tableau.

M贸dulo 7 Habilidades y competencias de gesti贸n, personales y sociales, para el entorno digital (30 horas).

– Impulso de habilidades digitales:
– Liderazgo participativo.
– Gesti贸n del cambio.
– Inteligencia emocional.
– Storytelling.
– Creaci贸n de marca personal.
– Comunicaci贸n y negociaci贸n en entornos digitales.
– Comprensi贸n de las competencias necesarias para el nuevo entorno digital:
– La influencia digital.
– La colaboraci贸n en el entorno.
– La integraci贸n de la diversidad.
– La gesti贸n emocional.
– La agilidad en toma de decisiones.
– La anticipaci贸n en contextos digitales.
– La flexibilidad para la transformaci贸n.
– La asunci贸n de incertidumbre y riesgos.
– La elaboraci贸n, gesti贸n y difusi贸n de contenidos.
– Conocimiento de las herramientas imprescindibles para:
– El trabajo colaborativo.
– El trabajo en remoto.
– La gesti贸n de proyectos.
– Automatizaci贸n de flujos de trabajo.
– Pr谩ctica en las claves del trabajo en equipo y de la productividad en remoto.
– Fomento del liderazgo participativo y la gesti贸n del cambio.
– Dominio de la comunicaci贸n y la negociaci贸n en entornos digitales.
– Pr谩ctica del modelo de competencias para el entorno digital.
– Elaboraci贸n y gesti贸n de la marca personal desde la importancia del storytelling.

Requisitos:

-No existen requisitos espec铆ficos para la participaci贸n en esta acci贸n formativa, salvo que se deber谩 aportar la documentaci贸n necesaria. -Se reserva un porcentaje m谩ximo de plazas destinadas para desempleados. -No hay plazas destinadas a funcionarios.

Lo sentimos, en este momento no hay grupos ni plazas para este curso.

Entre en este enlace para ver otros cursos con plazas disponibles.