Técnicas de pre-procesamiento en conjuntos de datos desbalanceados para mejorar la clasificación

El problema de desbalance es complejo, y no solamente depende de la proporción que existe entre el número de instancias de cada clase, dicho problema es conocido como “desbalance entre clases”. La complejidad de los datos juega un papel importante en este tipo de problemas, así como la falta de datos representativos en algunas regiones del espacio de entrada o la existencia de subconceptos. Cuando dentro de un problema de clasificación existen subconceptos que contienen pocas instancias, se presenta lo que se conoce como el “desbalance al interior de las clases”.

El objetivo fundamental de la presente monografíaes determinar el estado del arte en las técnicas de manejo del desbalance para mejorar la clasificación, analizando su posible aplicación en problemas de Bioinformática; en específico, en el problema de predicción de las interacciones de proteínas en un caso de estudio de Arabidopsisthaliana.

Ana Caridad Castillo Sánchez, Leidys Cabrera Hernández, María del Carmen Chávez Cárdenas, María Matilde García Lorenzo
20200113
Computación
Descargar