Profesiones de la ciencia de datos

Post on 15-Jan-2017

20 views 6 download

Transcript of Profesiones de la ciencia de datos

Las Profesiones de la Ciencia de Datos

Hay muchas cosas que hacemos cuando hablamos de Ciencia de Datos… Pero lo importante es saber porqué hacemos dichas cosas…

La Ciencia de Datos se trata de comprender Sistemas Complejos

Sin Método no hay Paraíso

La Ciencia de Datos no solo se relaciona con conceptos como Big Data, Estadística, Análisis de Datos, Minería de Datos, Machine Learning o Visualización de Datos, sino que los trasciende y solo puede existir gracias a quienes logran poner todo esto en el viejo y buen Método Científico.

The Dark Scientist Rises

La explosión de los datos, junto a conocimientos que parecen sacados de Ciencia Ficción y nuevas herramientas potentes, permiten hacer frente a importantes problemas sin resolver.Debido a que esta ciencia será un factor clave para empresas, sociedad y gobierno en los próximos años, muchas personas quieren convertirse en "Data Scientist".

A Beautiful Mindset

En DataLab Community llamamos Data Scientists no a quienes pueden procesar y analizar datos, por muy complejas que sean sus estadísticas, habilidades de programación o conjuntos de datos, sino a quienes además sigan el Método Científico y puedan generar ciencia con los conocimientos y habilidades mencionados.

The Theory of Everyone

La Ciencia es la que realmente importa, pues de este conjunto de conocimientos es que surgen tanto mejores Data Scientists como mejores Data Analysts, Data Engineers y Data Managers.

DataLab Community engloba e impulsa a todos los Profesionales de la Ciencia de Datos.

El Análisis de Datos

“El objetivo es convertir los datos en información y la información convertirla en insights”.

- Carly Fiorina

Data Analysts, Data Analysts Everywhere

La Filosofía de un analista de datos es la de SaberSus modelos son descriptivos y diagnósticos.Su trabajo suele ser sistemático y en un ámbito específico y bien delimitado, dando resultados operacionales y tácticos.Para un analista de datos, sus conjuntos de datos ideales son coherentes y con un control sobre la calidad y la certeza.

La Ingeniería de Datos

“Los datos son algo precioso y durarán incluso más que los sistemas mismos”

- Tim Berners Lee

Big Data? There’s an engineer for that

Idealmente, evolución del Ingeniero de Software.Debe poder hacer funcionar todo tipo de bases de datos, relacionales y no relacionales.Debe poder ser el amo y maestro de diversas infraestructuras, incluyendo las distribuidas.Debe entender los algoritmos y poder construir algoritmos de alta eficiencia.No debe temer a problemas complejos.

La Visualización de Datos

“El conocimiento es placentero, luego conlleva un disfrute estético, y es bello lo que gusta por medio de la vista y el oído”.

- Aristóteles

But first, let me design a dashboard

El Visualizador de datos se asegura de que el trabajo del equipo de Ciencia de Datos pueda ser comprendido y valorado por el alto mando.Tienen conocimientos en UI/UX.No se trata de simples informes, debe permitir que el usuario pueda “tocar” los insights.Le agrega valor a la historia que el analista o científico de datos quiere contar.

La Gestión de Datos

“Ha habido una sustitución de ideologías por hechos, datos científicos e ingeniería de datos en esta administración”

- Vinton Cerf

Shut up and approve my project

El data manager impulsa la cultura de trabajo del equipo de ciencia de datos.Es el intermediario con la gestión organizacional.Capaz de comprender qué direcciones puede valer la pena intentar y cuáles son distracciones.Debe ser bueno en relaciones y comunicación, atendiendo peticiones y fuentes de datos.Tiene que calcular y asegurar un buen ROI.

El Científico de Datos

“En los próximos 10 años, la ciencia de datos y el software harán más por la medicina que todas las ciencias biológicas juntas”

- Vinod Khosla

I fucking love Science

Su filosofía es la de comprenderSus modelos son predictivos y prescriptivosSu trabajo suele ser experimental y ad-hoc, sus resultados al ser estratégicos, generan valor.Su conjunto de datos es diverso, y formado flexiblemente, debiendo lidiar con la incerteza y calidad variable de los datos.Sigue el Método Científico

Yeah Mr. White! Yeah, Science!

Necesita hacer las preguntas adecuadasConocer estadística, matemática, algoritmia, modelado predictivo y conocer el trasfondotrasfondo.Comunicar resultados, oral y visualmenteCurioso, va más allá de la superficie del problemaPaciente al integrar múltiples sistemas y datosConocer disciplinas como ML, NLP, Pruebas de Hipótesis, Análisis Predictivo, NoSQL, entre otros.

Bro, do you even science?

¿Hay evidencia suficiente para validar hipótesis?¿Se ha evitado la parcialidad de los datos?¿Se han evitado las variables de confusión?¿Se ha mantenido la consistencia de los datos?¿Se ha validado tu modelo predictivo?¿Cuál es la precisión y cuál es la sensibilidad?¿Tu modelo no está demasiado ajustado?¿Experimento controlado, resultados repetibles?¿Qué dicen los Peer-Reviews de tu Paper?

Preguntas y Respuestas

Gracias por su atenciónFin de la Presentación