Volver

Experiencias de enseñanza de Ciencia de Datos en escuelas secundarias

Autoría:

  • Claudia Banchoff
  • Sofía Martin

La Ciencia de Datos, estrechamente vinculada a la Ciencia de Computación (CC), es una disciplina que ha crecido en popularidad y relevancia en los últimos años. Teniendo en cuenta los distintos planes y programas para introducir la CC en las escuelas, especialmente aspectos de programación,  se pensó en presentar esta temática como una forma distinta de abordar la resolución de problemas. Además, la introducción de esa temática permite  preparar a las y los estudiantes para un futuro laboral donde la toma de decisiones basada en datos es fundamental.

La adquisición y posterior uso de datos para su análisis permite construir y hacer ejercicio pleno de lo que denominamos  Ciudadanía Digital, reflexionando acerca del uso de los mismos de manera cuidadosa, responsable y respetuosa, asegurando que su análisis no perpetúe sesgos ni produzca resultados engañosos. 

Este trabajo presenta una experiencia docente en la que se implementó un enfoque práctico para la enseñanza de la Ciencia de Datos, integrando el análisis de datos reales y problemáticas relevantes para los jóvenes. Se hizo foco en el uso de datos abiertos y las distintas formas de comunicar los resultados obtenidos. 

Introducción 

En la actualidad, la Ciencia de Datos se ha convertido en una habilidad esencial en el mundo laboral y académico. Se define como el proceso de recopilar, analizar e interpretar grandes volúmenes de datos para extraer información  significativa y tomar decisiones informadas. Esta disciplina, como se muestra en la Figura 1,  combina conocimientos de estadística, programación y análisis de datos, y está presente en diversos campos, desde la medicina hasta el marketing. La relevancia de la Ciencia de Datos en la educación radica en su capacidad para preparar a los estudiantes para un futuro laboral donde la toma de decisiones basada en datos es fundamental.

Figura de un gráfico con tres círculos que se interconectan. Uno de los círculos tiene el texto "Ciencia de la computación", el otro "Matemáticas y Estádísticas" y el tercero "Disciplinas / Carreras disciplinares". 
La conexión entre el primero y el segundo dice Aprendizaje automático, entre el segundo y el tercero "Investigación tradicional" y entre el tercero y el primero "Desarrollo de software". La conexión entre los 3 "Ciencia de datos"

Este trabajo comparte una experiencia docente en la que se implementó un enfoque práctico para la enseñanza de la Ciencia de Datos, integrando el análisis de datos reales y problemáticas relevantes para los jóvenes. Se hizo foco en el uso de  datos abiertos centrados en contenido de Argentina donde los estudiantes no solo desarrollaron habilidades técnicas en programación y análisis, sino que también fomentaron el pensamiento crítico y la conexión con su entorno.

Además, la enseñanza de la Ciencia de Datos permite  a las y los estudiantes adquirir conocimientos que les ayuda a pensar y  resolver situaciones problemáticas complejas  desde contenidos propios como el análisis de datos.  

Otro  aspecto que consideramos importante en el proceso de análisis de datos es brindar a nuestros estudiantes orientaciones conceptuales acerca  del uso, producción y circulación de la información considerando que trabajar con datos sensibles les permite construir y hacer ejercicio pleno de lo que denominamos  Ciudadanía Digital. Teniendo en cuenta que el uso de los datos de manera cuidadosa, responsable y respetuosa, asegurando que su análisis no perpetúe sesgos ni produzca resultados engañosos. Asimismo, la comunicación de los resultados debe realizarse con transparencia, destacando las limitaciones del análisis y evitando la manipulación de la información. Fomentar una cultura de ética en el análisis y presentación de datos es crucial para formar ciudadanos responsables que comprendan el impacto de sus decisiones y contribuyan positivamente a la sociedad.

Este relato ofrece a los docentes recursos que pueden adaptar a sus propios contextos, promoviendo una educación significativa en el ámbito de la ciencia de datos.

Desarrollo de la experiencia

En Argentina, se ha avanzado en la incorporación de la Ciencia de la Computación, en la currícula escolar. Considerando la estrecha vinculación con  la Ciencia de Datos, y para  aprovechar estas iniciativas, en 2021 se presentó un proyecto en el marco de la convocatoria “Universidad, Cultura y Territorio” del Ministerio de Educación de la Nación, con el objetivo de integrar la Ciencia de Datos en el aula de manera transversal. Este proyecto fue implementado desde la Facultad de Informática de la Universidad Nacional de La Plata con dos escuelas secundarias de la región, la EEST N°9 y la EES N°4. del distrito de La Plata.

El objetivo fue formar a docentes en el uso de herramientas informáticas como Jupyter Notebook1 y Python2,  muy populares en el análisis de datos. Jupyter Notebook permite crear documentos interactivos que combinan código, visualizaciones y texto, facilitando el aprendizaje y la experimentación. Python, conocido por su simplicidad y versatilidad, es uno de los lenguajes de programación más utilizados en el ámbito de la Ciencia de Datos, especialmente con la librería pandas3, que simplifica el manejo y análisis de grandes volúmenes de datos.

Estas herramientas no solo simplifican el proceso de enseñanza, sino que también ofrecen a los estudiantes una base sólida para futuras exploraciones en programación. Para apoyar este proceso educativo, se generó un sitio web4 con guías y propuestas que integran datos relevantes trabajados en los talleres, sirviendo como recurso de referencia para otras actividades en el aula.

Si bien esta propuesta tuvo una  buena aceptación en escuelas que ya trabajan aspectos de  programación, resultó una experiencia desafiante en aquellas que no lo hacen. Por ello, se exploraron alternativas más accesibles, como DataExplore5 y PandasGUI6, que permiten una interacción visual con los datos y no requieren conocimientos previos en programación. A pesar de sus ventajas, estas herramientas presentaron problemas como dificultades de instalación e interfaces poco amigables. Se evaluaron también otras herramientas que tampoco requieren de conocimientos en programación,  como BlockPy7 y CODAP8, pero su falta de funcionalidades y de interfaces intuitivas limitó su eficacia en el contexto educativo propuesto. Como resultado, se decidió desarrollar Pandalyze, una herramienta de programación basada en bloques, diseñada específicamente para trabajar con datos utilizando pandas. Los primeros talleres con esta nueva herramienta han mostrado resultados prometedores, sugiriendo que puede ser una solución efectiva para la enseñanza de la Ciencia de Datos en el aula.

Las capacitaciones incluyeron cuatro encuentros en los que se exploraron temas como la salud escolar, la conectividad en Argentina y la accesibilidad urbana, utilizando datos abiertos disponibles en portales gubernamentales y otras fuentes. Durante estas sesiones, se trabajó con gráficos de barras, dispersión y otros tipos de visualización, utilizando herramientas como Matplotlib9 para representar los datos de manera efectiva.

Además, se llevó a cabo un taller con estudiantes de la EEST N°9, del distrito de La Plata  quienes ya tenían experiencia en programación, permitiendo un aprendizaje rápido de conceptos básicos de Ciencia de Datos. Las actividades enfatizaron la importancia de trabajar con datos abiertos, el diseño de preguntas claras para el análisis y la comunicación efectiva de resultados a través de visualizaciones apropiadas.

El proyecto no solo sentó las bases para la enseñanza de la Ciencia de Datos en el nivel secundario, sino que también propició un trabajo de investigación sobre las herramientas y metodologías didácticas aplicadas en esta área. Se crearon recursos accesibles en un sitio público para que otros docentes puedan replicar estas experiencias.

Para simplificar el proceso de aprendizaje y facilitar la comprensión de las sentencias propias de la programación, se desarrollaron documentos con soluciones semi resueltas. Estos recursos permiten a los estudiantes abordar problemas de programación de manera más efectiva, ya que proporcionan ejemplos y pasos intermedios que guían a los estudiantes en la resolución de ejercicios. Al ofrecer un enfoque más gradual y accesible, estos documentos no solo ayudan a los estudiantes a familiarizarse con las estructuras y sintaxis del lenguaje, sino que también promueven la reflexión sobre el proceso de programación, facilitando así una mejor asimilación de conceptos clave y aumentando su confianza en la resolución de problemas.

Reflexiones finales 

La experiencia aportó al grupo docente conocer una nueva herramienta digital que les aportó no solamente pensar otras estrategias de enseñanza en la resolución de situaciones problemáticas, sino además incorporar aspectos básicos de la Ciencia de Datos. El desafío, además  del uso de la aplicación y los contenidos propios de las materias curriculares,  estuvo en la importancia de poner en valor la transversalidad del uso de tecnología digital en la formación de ciudadanos digitales desde la reflexión, el análisis y la construcción crítica en la toma de las decisiones.


1 Sitio oficial de Jupyter Notebook: https://jupyter.org/

2 Sitio oficial de Python : https://docs.python.org/es/3/

3 Sitio oficial de pandas: https://pandas.pydata.org/

4 Repositorio con guías del proyecto: https://ciencia_datos_escuela.gitlab.io/

5 Sitio oficial de DataExplore: https://pandastable.readthedocs.io/en/latest/dataexplore.html

6 Sitio oficial de PandasGUI: https://github.com/adamerose/pandasgui

7 Sitio oficial de Blockpy: https://think.cs.vt.edu/blockpy/blockpy/

8 Sitio web de CODAP: https://codap.concord.org/app/static/dg/es/cert/index.html

9 Sitio oficial de Matplotlib: https://matplotlib.org/

Modalidad de presentación: Presencial.
Distrito: La Plata, Región Educativa 1.
Institución educativa: Facultad de Informática - UNLP, Escuela Secundaria Técnica 9 y Escuela Secundaria 4.