10 preguntas frecuentes para la entrevista de científicos de datos

El campo de la ciencia de datos está en constante evolución, abarcando varias industrias y requiere un amplio conjunto de habilidades que incluye matemáticas, estadísticas, programación y marketing. Como tal, convertirse en un científico de datos requiere una combinación impresionante de habilidad técnica, creatividad y comunicación.

Las descripciones de trabajo para los científicos de datos pueden variar mucho, aunque todos buscan candidatos con una larga lista de las habilidades laborales más deseables, como pensamiento crítico, resolución de problemas, análisis de datos, inteligencia emocional, atención al detalle y trabajo en equipo. Esto significa que las preguntas de la entrevista para los científicos de datos pueden abarcar varios temas diferentes y abarcar desde consultas típicas de habilidades blandas hasta discusiones extremadamente técnicas.

Las entrevistas de ciencia de datos requieren mucha preparación. Ya sea que recién haya salido de una escuela superior de ciencias de la computación o esté buscando cambiar a una compañía o industria diferente, debe tomarse el tiempo para repasar los conceptos principales de su trabajo. Del mismo modo que sabe cómo conducir, pero puede tener problemas para recitar reglas específicas del camino, puede quedar atrapado en una entrevista tratando de articular cómo funciona un algoritmo específico.

Para ayudarlo a prepararse, hemos compilado 10 de las preguntas más comunes para entrevistas con científicos de datos. Desde las primeras proyecciones hasta los videos de segunda y tercera etapa y las entrevistas en el sitio, se encontrará con una amplia variedad de exámenes como estos de sus habilidades técnicas, habilidades de comunicación y estilo de trabajo.

1. 'Cuéntanos más sobre el proyecto más reciente en tu cartera'.

Los científicos de datos tienen demanda en muchas industrias diferentes, pero las empresas a menudo buscan a alguien con habilidades muy específicas y una buena cultura. Un portafolio detallado en línea que muestra el tipo de trabajo del que es capaz, así como una fuerte presencia en las redes sociales y una marca personal, lo ayuda a destacarse de otros candidatos, así como a conectarse con gerentes de contratación y reclutadores para trabajos en los que es perfectamente adecuado para.

Esté preparado en cualquier entrevista de ciencia de datos para hablar ampliamente sobre todos los elementos de su CV, cartera o sitio web. Adapte su respuesta sobre un proyecto a su audiencia. Si se trata de una evaluación inicial o un panel con participantes de una variedad de departamentos, su enfoque debe estar en las formas en que su trabajo creó resultados positivos para el cliente y su negocio.

Cuando llegue a la parte del proceso de entrevista donde se reúne con otro científico de datos, ingeniero, analista u otra persona técnica, se requiere una descripción más detallada de los datos y procesos involucrados en su trabajo.

2. '¿Por qué quieres trabajar para esta empresa?'

Incluso si fue contactado directamente a través de su cartera en línea o perfil de LinkedIn e invitado a una entrevista para un puesto vacante, la compañía aún querrá saber por qué ha aceptado y por qué cree que será un buen candidato para el trabajo.

Además de repasar sus habilidades técnicas, su preparación para la entrevista debe incluir una investigación sobre el negocio al que se postula. La información sobre su industria, misión, personal, exactamente lo que hacen y qué tan bien lo están haciendo lo ayudará a elaborar una respuesta específicamente diseñada para esta pregunta.

Aborde cómo su conjunto de habilidades los ayudará a alcanzar sus objetivos. Encuentre una manera de expresar pasión por uno o más aspectos de su puesto de trabajo, incluida la misión, filosofía, innovación o línea de productos de la empresa. Si este es el trabajo de sus sueños, puede valer la pena armar un proyecto de ciencia de datos antes de la entrevista que les resuelva un problema, como apelar a un nuevo grupo demográfico o programar entregas de manera más eficiente.

3. 'Nombra los científicos de datos que más admiras y explica por qué'.

Si bien esta es una pregunta muy personal que técnicamente no tiene una respuesta correcta, las respuestas que seleccione son muy importantes. Su investigación sobre la compañía, así como las del panel de entrevistas, pueden ayudarlo a causar una buena primera impresión solo con esta pregunta.

Conocer a las personas que son prominentes en el campo, así como a las que están haciendo olas, mostrará a los entrevistadores que usted es conocedor y apasionado de la industria. Es útil hablar sobre los científicos de datos que son valorados en el ámbito profesional específico que está solicitando, como las finanzas, la medicina o el mercado de valores.

Esta pregunta es más que una impresionante lista de nombres. La parte 'por qué' de la ecuación también mostrará a sus posibles empleadores lo que valora en su campo y cómo abordará su trabajo. Si su investigación ha demostrado que la empresa valora la innovación, la integridad o incluso un cierto método estadístico, esta es una gran oportunidad para hacerles saber que comparte esos mismos valores.

4. '¿Cómo explicaría un motor de recomendación a alguien del departamento de Marketing?'

Una de las cualidades importantes que diferencia a los científicos de datos de otros genios técnicos es la capacidad de convertir, mostrar y explicar datos de una manera que las personas no técnicas puedan entender. Eso hace que una consulta como esta sea una de las preguntas más importantes de entrevista de científicos de datos que encontrará. Los entrevistadores quieren ver qué tan bien puede comunicar conceptos como modelado de datos, árboles de decisión y regresión lineal a cualquier audiencia.

En este caso específico, primero querrá explicar en términos simples cómo funciona un motor de recomendaciones, con ejemplos de filtrado basado en contenido y filtrado colaborativo. Luego, querrá analizar cómo puede trabajar con el departamento de marketing para combinar sus habilidades de atraer a los clientes con el poder del algoritmo que utiliza los datos recopilados para ayudar a determinar qué quieren los consumidores.

5. '¿Cuáles son las diferencias entre el aprendizaje supervisado y el no supervisado?'

Puede comenzar resumiendo que la principal diferencia entre estos dos es que el aprendizaje supervisado tiene datos de entrenamiento de los que el algoritmo puede aprender y proporcionar respuestas. El aprendizaje no supervisado requiere agrupar las cosas por similitudes, anomalías comunes y otros procesos de búsqueda de patrones en lugar de datos duros y rápidos.

El entrevistador querrá que entre en más detalles, por lo que es importante enumerar las diferencias específicas y poder hablar sobre los diversos algoritmos utilizados.

Aprendizaje supervisado

  • utiliza datos conocidos y etiquetados como entrada
  • tiene un mecanismo de retroalimentación
  • utilizado para la predicción
  • Sus algoritmos comunes incluyen árbol de decisión, regresión logística, regresión lineal, máquina de vectores de soporte y bosque aleatorio

Aprendizaje sin supervisión

  • utiliza datos no etiquetados como entrada
  • no tiene mecanismo de retroalimentación
  • utilizado para el análisis
  • Sus algoritmos comunes incluyen clustering K-means, clúster jerárquico, autoencoders y reglas de asociación.

Querrá tener algunos ejemplos, genéricos o de un proyecto específico en el que haya trabajado, para ilustrar las diferencias entre estos dos tipos de aprendizaje automático y en qué casos cada uno podría usarse. Por ejemplo, se puede utilizar el aprendizaje no supervisado cuando se lanza un nuevo producto donde se desconoce la demografía del cliente al que podría recurrir.

Suscribir

¡Suscríbete a nuestro boletín para obtener más contenido increíble y obtén un 20% de descuento en nuestra prueba de carrera!

Suscribir

6. '¿Cómo se evita el sesgo de selección?'

Esta pregunta puede tomar muchas formas en una entrevista de ciencia de datos. Se le puede pedir que defina el sesgo de selección, cómo evitarlo o que dé un ejemplo específico de cómo desempeñó un papel en un proyecto en el que trabajó.

El principal problema con el sesgo de selección es que se han sacado conclusiones de una muestra no aleatoria. Obviamente, la solución más fácil es seleccionar siempre de una muestra aleatoria de una población claramente definida. Tendrá que explicar por qué eso no siempre es posible.

Tenga en cuenta que, dado que el sesgo de selección puede ser intencional, ya que la selección de temas o la eliminación de datos se hacen a propósito para probar una teoría o proyección preconcebida, esta podría ser una forma indirecta para que el panel de contratación haga una de esas difíciles preguntas de entrevista sobre ética e integridad en el trabajo .

En última instancia, querrá enfatizar cómo el sesgo de selección suele ser un caso de datos no intencionales o inevitablemente sesgados. Asegúrese de detallar algunas de las áreas donde puede ocurrir sesgo de selección, incluyendo muestreo, intervalo de tiempo, datos y desgaste. Luego, dé algunos ejemplos de cómo las técnicas de apalancamiento, como el muestreo y el refuerzo, pueden ayudarlo a trabajar con muestras no aleatorias.

Si está en la parte de una entrevista cuando habla con representantes de departamentos menos técnicos, use un ejemplo fácilmente digerible que ilustre claramente el sesgo de selección. El científico de datos Eric Hollingsworth hace referencia a una lección aprendida del brote de gripe aviar de 2011, donde "solo se contabilizaron individuos muy enfermos" en una muestra estadística de "casos confirmados". El índice de mortalidad reportado del 80% resultante, tan grave debido al sesgo de selección, creó un miedo generalizado considerable.

7. '¿Cómo se pueden tratar los valores atípicos?'

Esta es una pregunta de entrevista común para los científicos de datos, ya que revela cómo usas los datos que te dan, los métodos que usas para procesar esos datos y si estás dispuesto a dedicar tiempo para evaluar cada parte de esos datos.

Primero querrá hablar sobre lo que constituye un valor atípico, como los números que existen fuera del grupo de datos en un gráfico, como 2-3 desviaciones estándar de la media, y así sucesivamente. El siguiente paso para lidiar con los valores atípicos es evaluar por qué ocurrieron.

Se elimina fácilmente una pequeña cantidad de valores atípicos que pueden atribuirse a un simple error humano o de máquina. Sin embargo, asegúrese de tener en cuenta que incluso un solo valor atípico puede ser un punto de datos clave en lugar de un problema, ya que puede indicar el éxito de una táctica de marketing única, un nuevo ingrediente de medicamentos o una línea de productos.

A continuación, querrás explicar cómo lidiar con una gran cantidad de valores atípicos, lo que requiere soluciones más complejas. Por ejemplo, es posible que deba cambiar el modelo que está utilizando, normalizar los datos al promedio o usar un algoritmo de bosque aleatorio. Una vez más, intente utilizar un caso de la vida real de su experiencia como científico de datos para explicar las tácticas correctas.

8. '¿Por qué es importante la limpieza de datos?'

La recolección y limpieza de datos son una parte dominante de su trabajo como científico de datos, ya que ocupan hasta el 80% de su tiempo. Independientemente de la industria a la que se postule, las preguntas de la entrevista siempre incluirán una sobre por qué es importante la limpieza de datos. Los entrevistadores también le preguntarán sobre sus técnicas y programas de limpieza preferidos.

Debe enfatizar cuán limpios son los datos necesarios para sacar las conclusiones correctas, pero no se trata solo de los números. Explicar cómo comenzar con datos completos, precisos, válidos y uniformes impacta directamente en su negocio. Los beneficios clave para discutir incluyen:

  • toma de decisiones mejorada sobre los objetivos de la empresa
  • adquisición de clientes más rápida y reorientación de clientes anteriores
  • ahorro de tiempo y recursos debido a la eliminación de datos inexactos o duplicados
  • productividad mejorada
  • aumento de la moral del equipo gracias a los resultados eficientes y precisos repetidos

9. '¿Cuál es el objetivo de las pruebas A / B?'

Las preguntas sobre las pruebas A / B durante su entrevista para un puesto de científico de datos pueden comenzar con una referencia más genérica al uso del diseño experimental para responder una sola consulta sobre el comportamiento o las preferencias del usuario. El objetivo de probar una variable de diseño de un sitio web, aplicación o boletín es simplemente evaluar si un cambio aumentará las tasas de interés, participación y conversión.

Una forma de diferenciarse al responder este tipo de preguntas de la entrevista es discutir cómo otros científicos de datos pueden sacar conclusiones erróneas de las pruebas A / B. Las posibles trampas incluyen:

  • no recopilar suficientes datos durante un período de tiempo suficientemente largo
  • probar demasiadas variables a la vez
  • no tiene en cuenta los factores externos que pueden afectar el tráfico durante el período de prueba
  • ignorando las pequeñas ganancias que pueden acumularse con el tiempo y combinarse con otros cambios positivos para aumentar los ingresos
  • faltan interpretaciones generales como ganancias o pérdidas financieras netas en relación con las tasas de conversión

Además de señalar estos problemas, deberá expresar cómo los resolvería o, mejor aún, cómo ya los evitó en sus proyectos de ciencia de datos anteriores.

10. "Tienes 48 horas para resolver este desafío de codificación".

El desafío de la codificación puede ser una forma inicial de evaluar a los posibles científicos de datos, o puede ser un segundo paso en el proceso de la entrevista después de haber superado el primer obstáculo con un reclutador o gerente de contratación. Esta puede ser una prueba en el sitio que demora de 30 minutos a 2 horas, donde codificará en una pizarra o en un teclado a la vista del entrevistador. A menudo se le da una opción de idioma, pero esté preparado para codificar en SQL o Python.

Algunas empresas asignan tareas más largas, con plazos de hasta una semana. Los desafíos de la pizarra pueden requerir escribir consultas SQL bastante simples, pero las pruebas más largas son, por supuesto, más complejas. Por lo general, se le proporcionarán datos y se le pedirá que haga predicciones específicas utilizando esos datos, y tendrá que mostrar su trabajo. Por ejemplo, a un sujeto entrevistado recientemente por un científico de datos se le dieron datos de Airbnb y se le pidió que prediga los precios de la vivienda según las características del alojamiento.

Los entrevistadores querrán discutir sus elecciones con usted, las suposiciones que hizo, las características que eligió, por qué utilizó ciertos algoritmos y más. A menudo, la respuesta a la que llega es menos importante que su proceso, creatividad, legibilidad de código y diseño.

Esta puede ser una experiencia de entrevista que te pone los nervios de punta, así que prepárate creando y completando desafíos de codificación práctica con amigos o colegas en el campo de la ciencia de datos. También puede visitar sitios como Leetcode y SQLZOO para realizar ejercicios de codificación. Las entrevistas simuladas reales que involucran problemas algorítmicos y de diseño de sistemas están disponibles de forma gratuita a través de Interviewing.io.

Como puede ver, las preguntas de la entrevista para los científicos de datos pueden ser difíciles, y el proceso general puede ser largo y agotador. Uno de los consejos más importantes para la entrevista es mantenerse positivo, incluso si siente que una parte del proceso de la entrevista fue deficiente. A menudo somos más duros con nosotros mismos que con los demás, y aún puedes conseguir el trabajo a pesar de no obtener cada respuesta tan perfecta como te hubiera gustado.

Si pierde la oportunidad, solicite comentarios y utilícelos para mejorar su próxima experiencia de entrevista. Después de todo, muchos científicos de datos bien establecidos fueron rechazados de varios puestos y aún así tuvieron éxito en los trabajos que finalmente encajaron mejor.

¿Qué preguntas y desafíos de codificación encontró al intentar conseguir un trabajo de ciencia de datos? ¡Únase a la discusión en los comentarios a continuación y ayude a sus colegas científicos de datos a prepararse para su próxima entrevista!

Deja Tu Comentario

Please enter your comment!
Please enter your name here