Ciclo EMC-DS: El ciclo de Big Data

Tras la jornada monográfica que dedicamos el último fin de semana a las certificaciones en Big Data, iniciamos un grupo de estudio que, durante los próximos cuatro meses, se dedicará a repasar el contenido de una de las certificaciones en Data Science de referencia.

En esta jornada quedaron claras varias cosas, como que el panorama actual en Big Data es un verdadero caos de siglas, productos, distribuciones y titulaciones, siendo difícil encontrar la forma de seguir el ritmo de innovación del mercado. Pero también sacamos conclusiones positivas, como el hecho de que el punto de partida para cualquier carrera en este ámbito es la comprensión de los principios de la ciencia de análisis de datos, que comúnmente se denomina “Data Science”.

Atendiendo los principios de economía, facilidad de acceso a los recursos, versatilidad para apoyar pasos posteriores en la carrera profesional y otros temas que tratamos en esa mañana, hemos decidido iniciar este grupo de estudio para repasar el contenido de la certificación EMC Data Scientist Associate y su examen E20-007. Para ello vamos a dedicar un viernes de cada dos a estudiar y aplicar todos sus puntos.

Igual que pasa con el grupo de estudio del PMP en el MeetUp de Dirección de Proyectos, antes que un curso hay que entender este ciclo como un grupo de estudio, en el que nos juntamos con la intención de resolver dudas, comprender y practicar detenidamente los puntos clave de este cuerpo de conocimiento. No se trata, por tanto, de un “curso de preparación de la certificación”, aunque el contenido y prácticas cubran el temario y hagamos ensayos.

El objetivo no es “memorizar” respuestas para preparar un examen tipo test, sino “comprender” los objetivos de los procesos y prácticas más importantes, lo que ayudará tanto a aplicar su contenido en el trabajo diario como a preparar la certificación. El verdadero objetivo es estar preparados para afrontar una carrera en Big Data; obtener la certificación es algo deseable pero dependerá del esfuerzo que cada uno haga tanto dentro como fuera del grupo. Igual de interesante es prepararnos para el siguiente ciclo, en otoño, que consiste en preparar una certificación de desarrollo en Big Data. Para ello ya hemos empezado a buscar los medios para disponer de clusters reales en el punto de encuentro para el grupo.

Vamos a dedicar esta primera sesión de trabajo al ciclo de vida el análisis de datos, consistente en las siguientes fases:

  • Descubrimiento
  • Preparación de datos
  • Planificación del modelo
  • Construcción del modelo
  • Comunicación de resultados
  • Traslado a operaciones

Aparte de la comprensión teórica de todos estos puntos, veremos un par de casos prácticos y haremos ejercicios de aplicación de los conocimientos, reservando un bloque de tiempo a la resolución de obras.

Para aprovechar al máximo las tres horas del seminario, es conveniente haber leído por adelantado el material didáctico que recomendamos y seguiremos durante todo el ciclo. Para este primer día son los dos primeros capítulos del libro Data Science & Big Data Analytics, hasta la página 60. Este es el libro que ha editado EMC para la preparación del examen y, por tanto el más adecuado. Si tienes intención de seguir el grupo de estudio en serio, es recomendable que compres el libro en papel. Puedes encontrarlo en http://amzn.to/1RJPyEF.

Usaremos de vez en cuando otras fuentes de documentación, que siempre se indicarán por adelantado, normalmente 10 a 12 días antes de cada convocatoria. Siempre que sea posible, serán fuentes abiertas o gratuitas o nos limitaremos al libro de referencia anterior.

El ciclo durará unos cuatro meses, con una sesión cada dos semanas los viernes por la tarde, siempre en horario de seis a nueve. La previsión es que terminemos la última semana de julio. Este ciclo no tiene nada que ver con las charlas y talleres de los sábados, que seguirán realizándose también cada dos o tres semanas con otros temas relacionados con análisis de datos y supercomputación.

Al término del seminario, está previsto (aprovechando que lo vamos a hacer siempre en viernes), que salgamos un rato a tomar algo de manera informal. Si puedes quedarte, mucho mejor.

Requisitos

No es necesario tener conocimientos previos ni haber asistido a otros seminarios. Es muy recomendable haber leído el texto indicado, aunque no es obligatorio, ya que lo repasaremos. No obstante, es fácil de entender que teniendo un tiempo limitado, todo lo que se pueda preparar por adelantado ayudará a aprovecharlo mejor.

Material

Material de papelería para tomar notas. Si vas a asistir a todo el ciclo, o a una parte importante, podría ser interesante dedicar desde el principio un cuaderno de notas para juntar todos los apuntes, ejercicios y recomendaciones. Igualmente, vuelvo a insistir que si piensas venir a menudo es conveniente que consigas una copia del libro de referencia. Si no lo consigues para este primer día, no pasa nada.

Información del evento

  • Fecha: 21 de Enero de 2017
  • Horario: 09:00 a 11:30 horas
  • Lugar: MeetingPlace Embajadores
  • Inscripción: 15’00 €

Este evento ha terminado. Si quieres que te avisemos, suscríbete a las actualizaciones del blog en el formulario que encontrarás en la parte inferior de la página.