Análisis del desempeño de los estudiantes de APO para futuras predicciones de deserción

Dado que más de mil estudiantes toman el curso de APO I (Algorítmica y Programación Orientada Por Objetos I) semestralmente, nuestro cliente quiere establecer cuales son las principales razones por las que un estudiante que toma el curso decide retirarlo o lo pierde. Lo anterior con el fin de poder tomar medidas preventivas hacia estos estudiantes y hacer que su paso por el nuevo primer curso de programación IP (Introducción a la programación) sea lo más exitoso posible.

Modismo 1

By Nicolas Caceres

Modismo 2

By Juan Camilo Sanguino Perez

Modismo 3

By Valentina Chacón Buitrago

What

Para obtener datos óptimos para la visualización, el archivo CSV original tuvo que modificarse. Originalmente se contaba con 44 columnas de las cuales se seleccionaron solo 35. Entre estos atributos se tienen 13 categóricos y 22 ordenados, cuantitativos, y secuenciales. Lo anterior dado que estas columnas son las únicas que contienen información váliosa para las tareas y visualización. En más detalle se cuenta con un dataset de tipo tabla con información estática clasificada por items y atributos.

Atributo Interpretación Descripción
id Id del registro tomado por el equipo cupi2. Atributo categórico.
semestre Semestre en el cual se tomó el registro. Atributo ordenado, cuantitativo secuencial.
curso Identificador del curso en código uniandes. Ej: ISIS 1204. Atributo categórico.
código Código del estudiante anonimizado. Atributo categórico.
colegio Nombre del colegio del estudiante. Atributo categórico.
colegio_codigo Código icfes del colegio. Atributo categórico.
saber_v1 Puntaje acumulado del icfes del estudiante, en el formato 1 Atributo ordenado, cuantitativo secuencial.
saber_v2 Puntaje acumulado del icfes del estudiante, en el formato 2 Atributo ordenado, cuantitativo secuencial.
mate1203 Nota obtenida en la asignatura cálculo diferencial. Atributo ordenado, cuantitativo secuencial.
leng1501 Nota obtenida en la asignatura español version leng1501. Atributo ordenado, cuantitativo secuencial.
lite1611 Nota obtenida en la asignatura español version lite1611. Atributo ordenado, cuantitativo secuencial.
huma1300 Nota obtenida en la asignatura español version huma1300. Atributo ordenado, cuantitativo secuencial.
creditos_inscritos Créditos inscritos por el alumno en ese semestre. Atributo ordenado, cuantitativo secuencial.
semestre_segun_creditos Semestre el cual está cursando un estudiante según el número de créditos vistos. Atributo categórico.
spp Valor que identifica si un estudiante es beneficiario o no del programa Ser Pilo Paga. Atributo categórico.
generacion_e Valor que identifica si un estudiante es beneficiario o no del programa Generación - E. Atributo categórico.
curso_nombre Nombre de la materia que está cursando el estudiante. Atributo categórico.
veces_visto Número que identifica el número de veces que un estudiante ha visto la materia. Atributo ordenado, cuantitativo, secuencial.
definitiva_profesor Nota obtenida por un estudiante en la materia de APO sin aproximaciones. Atributo ordenado, cuantitativo, secuencial
retiro_banner Valor que identifica si el estudiante retiro o no la materia. Atributo categórico.
pga Promedio acumulado del estudiante. Atributo ordenado, cuantitativo, secuencial.
riesgo_deca Valor que indica si el estudiante se encuentra en riesgo de acuerdo a los criterios de la decanatura o no Atributo categórico.
tipo_riesgo_deca Una de las 5 categorías {2SPG, PGSS, PRAC, PRIM y PRRE} de riesgo en las que se puede clasificar un estudiante. Atributo categórico.
spadies Puntaje entre 1 y 4 SPADIES identificando el nivel de riesgo que presenta un estudiante. Atributo categórico.
saber_biologia Puntaje obtenido en el área de biología en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_ciencias Puntaje obtenido en el área de ciencias en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_filosofia Puntaje obtenido en el área de filosofía en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_fisica Puntaje obtenido en el área de física en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_lenguajes Puntaje obtenido en el área de lenguajes en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_quimica Puntaje obtenido en el área de química en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_matematicas Puntaje obtenido en el área de matemáticas en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_cienciasnaturales Puntaje obtenido en el área de ciencias naturales en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_ingles Puntaje obtenido en el área de inglés en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_lecturacritica Puntaje obtenido en el área de lectura crítica en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_socialesciudad Puntaje obtenido en el área de Sociales-ciudad en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.

Why

Tareas Primarias:
  1. Resumir (Query-> Summarize) las distribuciones (Attributes->One->Distribution) de las notas de precalculo de los estudiantes con su desempeño en la materia de APOI, desempeño en termino de la nota obtenida y retiros.
  2. Uno de los objetivos principales de la visualización es identificar ( Query -> Identify) las correlaciones (Attributes -> Many -> Correlation) entre las notas de español y las obtenidas en la clase de APO.
  3. Uno de los objetivos principales de la visualización es identificar ( Query -> Identify) las correlaciones (Attributes -> Many -> Correlation) entre el puntaje del icfes (en el criterio de lectura crítica) y las notas obtenidas en la clase de APO

How

Modismo 1.1:

Marcas

Lineas para representar las barras.

Canales

Escala express para representar cantidad de estudiantes. (Eje X)

Escala separate & align para representar la nota obtenida en precálculo y si fue inscritos, retiros, terminaron el curso, aprobaron o reprobaron el curso de APO I(Eje Y)

Encode

Color hue: sirve para diferenciar entre inscritos, retiron, terminaron el curso, aprobaron y reprobaron el curso de APO I.

Manipulate

En cuanto al manipulate hay un Select sobre cada barra para obtener la información detallada.

Reduce

En cuanto al reduce hay un filter según las notas definitivas de precálculo.

Modismo 1.2:

Marcas

Lineas para representar cuartiles y medianas

Puntos para representar los semestres

Canales

Escala express para representar el porcentaje de retiros por nota de precalculo, es decir del 100% de los estudiantes que sacaron A en precalculo, que porcentaje retiro. (Eje Y)

Escala separate & align para representar la nota obtenida en precálculo. (Eje X)

Encode

Color hue: sirve para diferenciar entre los que están debajo de la media y los que no.

Manipulate

En cuanto al manipulate hay un Select sobre cada barra para obtener la información detallada.

Reduce

En cuanto al reduce hay un filter según las notas definitivas de calculo diferencial.

Modismo 2:

Marcas

Puntos: Representa la nota de un estudiante en APO y en Español

Canales

Posicion vertical y horizontal: Se ubican los puntos segun la nota en español y APO

Encode

Arrange -> Express: Usado para las notas de ambas materias (APO y español)

Map -> Color -> Saturation: Determinar la cantidad de estudiantes con comportamientos en las notas similares

Modismo 3:

Marcas

Lineas: las lineas permiten visualizar la nota promedio en APO obtenida por los estudiantes que se encuentran dentro de una categoria de puntaje obtenido en la prueba de lectura crítica del icfes.

Canales

Position on common scale: El eje x representa el puntaje, en intervalos, obtenido por los estudiantes en el criterio de lectura critica.

Encode

Se muestran los datos en una configuración separate and align donde se dividen las puntuaciones de la prueba de lectura critica en intervalos. Asi mismo se cuenta con una escala lineal express para denotar las notas promedio de los estudiantes en la clase de APO. Además se tiene una escala de colores para determinar la cantidad de estudiantes clasificados en ese rango de puntajes de lectura critica.

Manipulate

Se tiene una visualización interactiva dónde por medio de un select se puede obtener información especifica correspondiente a la barra seleccionada. En mayor detalle, la información presentada incluye el promedio de la nota de APO y el promedio de la puntuación en lectura critica del intervalo.