Trabajo de Investigación para optar el Título Profesional, 2018-1
Lorena Xiomara Castillo Galdos; Cristian José Lopez Del Alamo
Objetivo
Resumen:
La clasificación de documentos de texto es un tema de investigación importante en el campo de recuperación de información, así como la manera en la que representamos la información extraída de los documentos a ser clasificados. Como parte de esta investigación, dos aportes significativos serán desarrollados, el primero es la obtención de vectores característica, los cuales están basados en un enfoque de comparación de documentos por similaridad, el cual utiliza conceptos adaptados de comparación de modelos 3D no rígidos y grafos como estructura de datos para la representación de dichos documentos. El segundo aporte es el método de clasificación, el cual está basado en la obtención de vectores característica representativos de cada clase de documentos.
Palabras clave
clasificación de documentos, grafos, modelos no rígidos, vector característica, Arequipa, UNSA
Problema central
En la actualidad con el aumento del uso de la tecnología se crea gran cantidad de información textual, la cual genera la necesidad de métodos y técnicas innovadoras para su análisis, comparación y clasificación. El problema en el que se centra esta investigación es la clasificación de documentos de texto, para lo cual se propone la creación de un método de clasificación mediante un enfoque que adapta conceptos del área de computación gráfica. La clasificación de texto o documentos de texto, es la tarea de asignar clases predefinidas a documentos de texto libre, la cual tiene muchas aplicaciones importantes en el mundo real.
Hipótesis planteada
Es posible realizar un método de comparación de documentos de texto que utilice vectores característica para representar dichos documentos.
Resultados esperados
- Un (01) artículo científico publicado en revista indizada en la base Scopus o Web of Science.
-Título profesional.
- Ponencia donde se difunda los resultados intermedios o finales de la investigación en eventos científicos de nivel internacional de reconocido prestigio.
- Mayor visibilidad mundial de los trabajos de investigación que se desarrollan en la UNSA.
- Prototipo de clasificación de documentos.
Impactos esperados
- Impacto acádemico: Un nuevo método para clasificación de documentos.
- Impacto social: La clasificación de documentos de texto, tiene muchas aplicaciones importantes en el mundo real. Por ejemplo, se puede aplicar a documentos pertenecientes a diferentes sectores, así como, clasificación de libros en bibliotecas y segmentación de artículos en noticias, ya que estas suelen estar organizadas por categorías; los informes de pacientes en las organizaciones de atención médica, éstos a menudo se clasifican utilizando diferentes criterios como enfermedades, tipos de procedimientos quirúrgicos, tipo de seguros, entre otros. Otra aplicación ampliamente conocida es el filtrado de correo no deseado, donde los mensajes de correo electrónico son separados en las categorías de spam y no spam.