Análisis del desempeño de los estudiantes de APO para futuras predicciones de deserción

Dado que más de mil estudiantes toman el curso de APO I (Algorítmica y Programación Orientada Por Objetos I) semestralmente, nuestro cliente quiere establecer cuales son las principales razones por las que un estudiante que toma el curso decide retirarlo o lo pierde. Lo anterior con el fin de poder tomar medidas preventivas hacia estos estudiantes y hacer que su paso por el nuevo primer curso de programación IP (Introducción a la programación) sea lo más exitoso posible.

Modismo 1

Nota: Por categoría cálculo precálculo hacemos referencia al último registro de la nota obtenida por un estudiante en precálculo o cálculo, al momento de ver el curso de APO I.

By Nicolas Caceres

Contextualización sobre los diagramas de caja y bigotes para entender las visualizaciones 1.2 y 1.3

Mediana:
La mediana está representada por la línea en la caja. La mediana es una medida común del centro de sus datos. La mitad de las observaciones es menor que o igual al valor y la mitad es mayor que o igual al valor.

Bigotes:
Los bigotes se extienden de cualquier lado de la caja. Los bigotes representan los rangos del 25 % de valores de datos de la parte inferior y el 25 % de la parte superior, excluyendo los valores atípicos.

Cuartiles:
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

Ejemplo:
Del 100% de los estudiantes que aprobaron precalculo, el diagrama representaria que porcentaje retiro en la visualización 1.2 y que porcentaje reprobó APOI en la visualizacion 1.3.

By Nicolas Caceres

By Nicolas Caceres

Modismo 2

By Juan Camilo Sanguino

Modismo 3.1

Modismo 3.2

By Valentina Chacón Buitrago

What

Para obtener datos óptimos para la visualización, el archivo CSV original tuvo que modificarse. Originalmente se contaba con 44 columnas de las cuales se seleccionaron solo 35. Entre estos atributos se tienen 13 categóricos y 22 ordenados, cuantitativos, y secuenciales. Lo anterior dado que estas columnas son las únicas que contienen información váliosa para las tareas y visualización. En más detalle se cuenta con un dataset de tipo tabla con información estática clasificada por items y atributos.

Atributo Interpretación Descripción
id Id del registro tomado por el equipo cupi2. Atributo categórico.
semestre Semestre en el cual se tomó el registro. Atributo ordenado, cuantitativo secuencial.
curso Identificador del curso en código uniandes. Ej: ISIS 1204. Atributo categórico.
código Código del estudiante anonimizado. Atributo categórico.
colegio Nombre del colegio del estudiante. Atributo categórico.
colegio_codigo Código icfes del colegio. Atributo categórico.
saber_v1 Puntaje acumulado del icfes del estudiante, en el formato 1 Atributo ordenado, cuantitativo secuencial.
saber_v2 Puntaje acumulado del icfes del estudiante, en el formato 2 Atributo ordenado, cuantitativo secuencial.
mate1203 Nota obtenida en la asignatura cálculo diferencial. Atributo ordenado, cuantitativo secuencial.
leng1501 Nota obtenida en la asignatura español version leng1501. Atributo ordenado, cuantitativo secuencial.
lite1611 Nota obtenida en la asignatura español version lite1611. Atributo ordenado, cuantitativo secuencial.
huma1300 Nota obtenida en la asignatura español version huma1300. Atributo ordenado, cuantitativo secuencial.
creditos_inscritos Créditos inscritos por el alumno en ese semestre. Atributo ordenado, cuantitativo secuencial.
semestre_segun_creditos Semestre el cual está cursando un estudiante según el número de créditos vistos. Atributo categórico.
spp Valor que identifica si un estudiante es beneficiario o no del programa Ser Pilo Paga. Atributo categórico.
generacion_e Valor que identifica si un estudiante es beneficiario o no del programa Generación - E. Atributo categórico.
curso_nombre Nombre de la materia que está cursando el estudiante. Atributo categórico.
veces_visto Número que identifica el número de veces que un estudiante ha visto la materia. Atributo ordenado, cuantitativo, secuencial.
definitiva_profesor Nota obtenida por un estudiante en la materia de APO sin aproximaciones. Atributo ordenado, cuantitativo, secuencial
retiro_banner Valor que identifica si el estudiante retiro o no la materia. Atributo categórico.
pga Promedio acumulado del estudiante. Atributo ordenado, cuantitativo, secuencial.
riesgo_deca Valor que indica si el estudiante se encuentra en riesgo de acuerdo a los criterios de la decanatura o no Atributo categórico.
tipo_riesgo_deca Una de las 5 categorías {2SPG, PGSS, PRAC, PRIM y PRRE} de riesgo en las que se puede clasificar un estudiante. Atributo categórico.
spadies Puntaje entre 1 y 4 SPADIES identificando el nivel de riesgo que presenta un estudiante. Atributo categórico.
saber_biologia Puntaje obtenido en el área de biología en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_ciencias Puntaje obtenido en el área de ciencias en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_filosofia Puntaje obtenido en el área de filosofía en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_fisica Puntaje obtenido en el área de física en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_lenguajes Puntaje obtenido en el área de lenguajes en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_quimica Puntaje obtenido en el área de química en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_matematicas Puntaje obtenido en el área de matemáticas en el saber 11-1 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_cienciasnaturales Puntaje obtenido en el área de ciencias naturales en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_ingles Puntaje obtenido en el área de inglés en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_lecturacritica Puntaje obtenido en el área de lectura crítica en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.
saber_v2_socialesciudad Puntaje obtenido en el área de Sociales-ciudad en el saber 11-2 (va de 0 a 100). Atributo ordenado, cuantitativo, secuencial.

Why

Tareas Primarias:
  1. Resumir (Query-> Summarize) las distribuciones (Attributes->One->Distribution) de las notas de precalculo y calculo de los estudiantes en relación con el desempeño en la materia de APOI, desempeño en terminos de la nota obtenida y retiros. (Modismo 1)
  2. Uno de los objetivos principales de la visualización es identificar ( Query -> Identify) las correlaciones (Attributes -> Many -> Correlation) entre las notas de español y las obtenidas en la clase de APO.(Modismo 2)
  3. Uno de los objetivos principales de la visualización es identificar ( Query -> Identify) las correlaciones (Attributes -> Many -> Correlation) entre el puntaje del icfes (en el criterio de lectura crítica y matemáticas) y las notas obtenidas en la clase de APO.(Modismo 3)
Tareas Secundarias:
  1. Identificar (Query->Identify) outliers (All Data -> Outliers) en los porcentajes de los retiros y porcentaje de estudiantes que repobraron el curso de APO I a lo largo de los semestres, según la nota de precalculo o calculo que obtuvieron los estudiantes. (Modismo 1)
  2. Comparar (Query->Compare) las distribuciones (Attributes->One->Distribution) de las notas de precalculo y calculo de los estudiantes en relación con el desempeño en la materia de APOI, desempeño en terminos de la nota obtenida y retiros. (Modismo 1)
  3. Comparar (Query->Compare) la cantidad de estudiantes (Attributes->Many) que comparten una misma nota de apo y una nota similar en español (Modismo 2)
  4. Comparar (Query->Identify) la cantidad de estudiantes que obtuvieron la misma nota en APO y en el segmento de lectura crítica en el icfes para ver si existe una relación de implicación ( Attributes->Many->Dependency) entre los dos.(Modismo 3.1)
  5. Comparar (Query->Identify) la cantidad de estudiantes que obtuvieron la misma nota en APO y en el segmento de matemáticas en el icfes para ver si existe una relación de implicación ( Attributes->Many->Dependency) entre los dos.(Modismo 3.2)

How

Modismo 1.1:

Nota: Por categoría calculo precalculo hacemos referencia al último registro de la nota obtenida por un estudiante en precalculo o calculo, al momento de ver el curso de APO I.

Marcas

Lineas para representar las barras.

Canales

Escala express para representar porcentaje de estudiantes dentro de una categoria de precalculo-calculo. (Eje X)

Escala separate & align para representar la categoria de precalculo-calculo y si se esta haciendo referencia a porcentaje de inscritos, retiros, terminaron el curso, aprobaron o reprobaron el curso de APO I (Eje Y)

Encode

Color hue: sirve para diferenciar entre inscritos, retiron, terminaron el curso, aprobaron y reprobaron el curso de APO I.

Manipulate

En cuanto al manipulate hay un Select sobre cada barra para obtener la información detallada.

Reduce

En cuanto al reduce hay un filter según algun semestre en particular.

Modismo 1.2:

Marcas

Lineas para representar cuartiles y medianas

Puntos para representar los semestres

Canales

Escala express para representar el porcentaje de retiros por categoria de calculo-precalculo, es decir del 100% de los estudiantes que aprobaron precalculo, que porcentaje retiro. (Eje Y)

Escala separate & align para representar las categoria de calculo-precalculo. (Eje X)

Encode

Color hue: sirve para diferenciar entre los que están debajo de la media y los que no.

Manipulate

En cuanto al manipulate hay un Select sobre cada caja para obtener la información detallada.

Reduce

En cuanto al reduce hay un filter según algun semestre en particular.

Modismo 1.3:

Marcas

Lineas para representar cuartiles y medianas

Puntos para representar los semestres

Canales

Escala express para representar el porcentaje de estudiantes que perdieron APO I por categoría de calculo precalculo, es decir del 100% de los estudiantes que aprobaron precalculo, que porcentaje reprobo APO I. (Eje Y)

Escala separate & align para representar las categoria de calculo-precalculo. (Eje X)

Encode

Color hue: sirve para diferenciar entre los que están debajo de la media y los que no.

Manipulate

En cuanto al manipulate hay un Select sobre cada caja para obtener la información detallada.

Reduce

En cuanto al reduce hay un filter según algun semestre en particular.

Modismo 2:

Marcas

Puntos: Representa el total de estudiantes que obtuvieron una determinada nota de APO y la nota de español. Aún cuando se tienen rectangulos que ocupan un área, esta área no representa ningún valor por lo que la marca es un punto.

Canales

Posicion vertical y horizontal: Se ubican las areas segun la nota en español y APO

Color: representa la cantidad de estudiantes que comparte una nota de apo y de español en especifico

Encode

Arrange -> Express: Usado para las notas de ambas materias (APO y español)

Map -> Color -> Saturation: Determinar la cantidad de estudiantes con comportamientos en las notas similares

Reduce

En cuanto al reduce hay un filter según los estudiantes que retiraron o no la materia de APO.

Manipulate

Se tiene una visualización interactiva dónde por medio de un select se puede obtener información especifica correspondiente al recuadro seleccionado. En mayor detalle, la información presentada incluye la catidad total de estudiantes que pertenecen al grupo con la nota de APO y calificación en español seleccionado.

Modismo 3:

Marcas

Puntos: Representa el total de estudiantes que obtuvieron una determinada nota de APO y del critério de evaluación del icfes. Aún cuando se tienen rectangulos que ocupan un área, esta área no representa ningún valor por lo que la marca es un punto.

Canales

Color saturation: El numero total de estudiantes que obtuvieron cierta nota en APO y en el critério de evaluación en el icfes varia de acuerdo a una saturación (dependiendo del critério puede ser azul o verde). Entre más intenso es el color, mayor es la cantidad de estudiantes en ese punto.

Encode

Arrange -> Express: Usado para la nota de APO y el resultado en el critério del icfes.

Map -> Color -> Saturation: Denota el número de estudiantes que obtuvieron la misma nota en APO y en el críterio de evaluación del icfes.

Manipulate

Se tiene una visualización interactiva dónde por medio de un select se puede obtener información especifica correspondiente al recuadro seleccionado. En mayor detalle, la información presentada incluye la catidad total de estudiantes que pertenecen al grupo con la nota de APO y criterío del icfes seleccionado.