El proceso de extraer conocimiento a partir de grandes volúmenes de datos ha sido reconocido por muchos investigadores como un tópico clave en los sistemas de bases de datos.
Compañías industriales consideran al proceso, una importante área y oportunidad para obtener mayores ganancias basadas en el estudio de la información sistematizada.
La Ciencia de Datos se encarga de estudiar los algoritmos y procesos que se tienen que realizar para extraer conocimiento de los datos. Su influencia abarca diferentes áreas del conocimiento como: agricultura, ganadería, medicina, estudios sociales, sector empresarial, telecomunicaciones, entre otras.
En este contexto surge la investigación del Dr. Amilkar Puris, docente investigador de la UTEQ, uno de los ganadores de la séptima convocatoria de Focicyt. El objetivo del proyecto de investigación se focalizó en aplicar técnicas de Ciencia de Datos en escenario complejos de estudio
Se abordaron dos importantes áreas del conocimiento:
1- Química Informática: Modelo para clasificar la actividad inhibidora de dos enzimas antidiabéticas (?-amilase y ?-glucosidase) que son reguladoras de la azúcar en sangre.
2- Educación: Sistema de recomendación de ejercicios para fortaleces el aprendizaje informal de programación en estudiantes de primer módulo de carreras con perfil informático.
¿Cuáles fueron los resultados? Para el primer problema se transformó el problema original de Regresión a Clasificación y luego se obtuvo un modelo de Árbol de Decisión con una precisión por encima de 80%, que permitió a los Ingenieros Químicos interpretar las asociaciones y comprender las situaciones puntuales que se descubrieron. Este resultado fue publicado en la revista JCR, Chemical Biology & Drug Design, con el título "Beyond model interpretability using LDA and decision trees for ? amylase and ? glucosidase inhibitor classification studies", https://doi.org/10.1111/cbdd.13518
Por otra parte, se construyó un sistema de recomendación de ejercicios teniendo en cuenta las relaciones entre estudiantes con percepciones similares en el proceso de aprendizaje. Este sistema formó parte de una plataforma llamada "Caramba" (Scratch + Sistema de Recomendación) que en su etapa de prueba demostró incidir de forma significativa en el desarrollo de las habilidades básicas de programación, mejorando el rendimiento y la motivación de los estudiantes. Este resultado fue publicado en la revista JCR, IEEE Transactions on Learning Technologies, bajo el título "Recommender Systems and Scratch: An integrated approach for enhancing computer programming learning", DOI: 10.1109/TLT.2019.2901457.