Del curso: Aprende data science: Conceptos básicos
Define una práctica multidisciplinar con muchos significados
Del curso: Aprende data science: Conceptos básicos
Define una práctica multidisciplinar con muchos significados
¿Qué hace un científico de datos? No es una pregunta fácil. Definir al científico de datos no es tan fácil como con otras ciencias. Si eres científico político o medioambiental, tienes un título que responde a un programa específico. El término «científico de datos» ya se utilizaba antes de que la ciencia de datos se considerara una disciplina. Hoy, los que se autodenominan científicos de datos provienen de varias áreas de investigación. Como disciplina, la ciencia de datos todavía no está definida. Es como la primera arqueología: cualquiera que con una pala buscara artefactos del pasado podía decir que era arqueólogo. Hoy, para serlo, hay que pasar por una universidad reconocida e investigar durante varios años. Como con la arqueología temprana, la ciencia de datos es más una práctica que una disciplina: eres científico de datos si trabajas con datos de forma científica. Así que queda al criterio de cada persona si se quiere presentar como científico de datos. Aun así, algunas profesiones están más preparadas que otras. Si eres estadístico, o analista de datos o trabajas en ciencias biológicas, podrías afirmar que siempre has sido científico de datos, con el énfasis en los datos o en lo científico. Algunos de los primerosque se autodenominaron científicos de datos eran matemáticos, otros venían de ingenierías de sistemas e información; e incluso algunos provenían de los negocios y las finanzas. Si habías trabajado con números y sabías algo sobre datos, podías autodenominarte científico de datos. Como la demanda de científicos de datos no para de crecer, se intentará que las habilidades se estandaricen para que las empresas sepan a quién están contratando. Pero eso aún no ha ocurrido. De hecho, existe el riesgo de que se piense que cualquiera que trabaja con datos y tiene dos dedos de frente es científico de datos. La mejor forma de pensar en la ciencia de datos es centrándose en la ciencia y no en los datos. En este contexto, hablamos del empirismo, que reacciona ante los datos, mediante experimentos y preguntas. Es probable que uses el método empírico todo el tiempo sin pensarlo como un método. Un científico de datos usa este método cada día. Una aproximación empírica combina el conocimiento y la práctica. Veamos un ejemplo de cómo uso yo una aproximación empírica. Como asesor y formador, viajo bastante a menudo y paso las noches en habitaciones de hotel con diferentes estilos de cuarto de baño. No dejo de sorprenderme ante la variedad de canillas, llaves y dispositivos que hay en el mundo. Siempre me cuesta descubrir cómo se enciende la ducha en cada hotel. Comienzo formulando la pregunta empírica: «¿Cómo enciendo la ducha?» Luego pruebo con un experimento, aprieto un botón y el agua llena la bañera. Si aprieto otro, la lluvia comienza a caer. Con el agua ya fluyendo, debo controlar la temperatura. Uso los distintos tiradores y botones para conseguirlo. Si giro demasiado de uno, el agua sale demasiado caliente; si giro el otro, sale demasiado fría. Con preguntas y reevaluaciones consigo que el agua salga a temperatura confortable. Es verdad que podría adoptar una teoría sobre cómo conseguir la temperatura confortable, meterme de un salto, girar una perilla y cruzar los dedos. El problema es que tengo la misma probabilidad de congelarme que de quemarme. Los científicos de datos usan esta aproximación empírica todo el tiempo. Hacen preguntas a los datos y las ajustan para ganar entendimiento, ajustan las perillas e intentan mejorar la calidad de las preguntas. La ciencia de datos es una disciplina fluida, con muchos profesionales de formación variada, que se autodesignan científicos de datos. Céntrate en el método científico y utiliza la aproximación empírica para obtener conocimiento a partir de los datos y refuerza el lado científico, no el de los datos. Te convertirás en un mejor científico de datos mientras no se sistematice el tema.