|
Palabras clave
|
clasificación de documentos, vector característica, redes neuronales, modelos no-rígidos, UNSA, Arequipa
|
|
Justificación del proyecto
|
Una de las características de las redes neuronales actuales es que tienen un alto perfomance en cuanto a resultados, sin embargo muchas de estas dependen del vector característica que representa el objeto el con el cual se va a entrenar, en tal sentido, un problema puntual es encontrar un vector característica adecuado que represente de la mejor manera la semántica de un documento.
Las redes neuronales juegan un rol importante en la clasificación de documentos de texto. Día a día se necesita categorizar distintos tipos de datos en diferentes áreas y sectores como por ejemplo, en el sector médico, se podría utilizar historias de pacientes anteriores ya diagnosticados, para poder elegir un posible diagnóstico de un paciente nuevo; en el ámbito constitucional, existe también la necesidad de clasificación con respecto a casos ya resueltos, para poder facilitar el análisis de un caso nuevo con respecto a uno existente, o también poder clasificar documentos de procedimientos jurídicos para una mejor organización. La clasificación de documentos es ampliamente utilizada al momento de asignarle categorías a una gran cantidad de documentos, lo cual es una tarea difícil de realizar manualmente, más aún si éstos son de gran tamaño.
|
|
Hipótesis del proyecto
|
Es factible desarrollar un algoritmo para obtener un vector característica que almacene información semántica de documentos.
|
|
Resultados esperados del proyecto
|
- Un (01) artículo científico publicado en revista indizada en la base Scopus o Web of Science
-Título profesional.
- Ponencias donde difunda los resultados intermedios o finales de la investigación en eventos científicos de nivel internacional de reconocido prestigio.
- Mayor visibilidad mundial de los trabajos de investigación que se desarrollan en la UNSA.
- Prototipo de clasificación semántica de documentos.
|
|
Impactos esperados
|
-Respecto a lo académico un nuevo algoritmo para la clasificación de documentos.
-En cuanto a lo social día a día se necesita categorizar distintos tipos de datos en diferentes áreas y sectores como por ejemplo, en el sector médico, se podría utilizar historias de pacientes anteriores ya diagnosticados, para poder elegir un posible diagnóstico de un paciente nuevo. Por otro lado, en el ámbito judicial, existe la necesidad de clasificar documentos con respecto a casos ya resueltos; entonces, un sistema automático de clasificación podrá facilitar el análisis de un caso nuevo.
|