Pasantias, Ponencias en Eventos y Participación en Cursos - Convocatoria 01
Disraeli Fausto Ari Mamani
Objetivo
Resumen:
El proyecto se realizara en la universidad de Sao Paulo, Brasil, con una duración de 90 días, con el objetivo de profundizar en la investigación de modelos probabilisticos para su aplicación en el análisis de sentimientos que permiten determinar de forma automática la orientación positiva, negativa o neutra de una opinión en un texto dado. De esta forma es posible analizar grandes cantidades de información y determinar tendencias de opiniones, por ejemplo en redes sociales, sobre marcas, políticos, entidades, etc. A pesar de ser una técnica consolidada, aún no se ha conseguido tener una precisión adecuada principalmente cuando se analiza opiniones en textos cortos, como en Twitter. Por otro lado, la mayor parte de investigaciones ha sido realizada en el idioma inglés. Por lo tanto esta tesis tiene como objetivo realizar el análisis de opiniones de textos cortos en español, utilizando un abordaje basado en redes Bayesianas y redes de Markov, enfatizando el análisis a nivel de tópicos o aspectos relevantes. Los experimentos serán realizados sobre datasets benchmark para Twitter en español. Se espera conseguir tener un desempeño competitivo con el estado del arte en el área. El proyecto es financiado por los fondos del convenio de Cienciactiva-UNSA, mediante el fondo por concurso de "Pasantias y ponencias".
Palabras clave
Twitter, Sentiment Analisys, modelos probabilísticos, UNSA, CIENCIACTIVA, CONCYTEC
Problema central
El análisis de opinión es una área en activo estudio en la actualidad, se han aplicado distintas técnicas para la solución de este problema, sin resultados óptimos. Los mejores resultados con el Dataset usado llegan a un 72%, lo que lo convierte en un tema sin resolver aún. Por lo tanto se proponen otros modelos para su solución junto a la mentoria del Prof. Denis Deratani Mauá de la Universidad São Paulo (USP).
Hipótesis planteada
La introducción de información contextual y semántica, principalmente basada en word embedding, así como el análisis y selección de un modelo probabilístico adecuado debe ayudar a mejorar la precisión de la clasificación de sentimientos de textos cortos en español.
Resultados esperados
Un estudiante UNSA capacitado en modelos probabilisticos para el análisis de texto.
Una Difusión en la comunidad científica de los conocimientos adquiridos en técnicas de inteligencia artificial para impartir los resultados, experiencias y conocimientos adquiridos en la pasantia y que ayudaran a las personas interesadas a conocer las tendencias en el tema de análisis de sentimientos y al pasante adquirir los conocimientos suficientes para completar su programa de maestría.
Impactos esperados
Impacto Social, alcanza a originar estudios sociales en las personas que crearon los comentarios que se analicen, dando lugar
nuevas lineas de estudio en otros campos.
Impacto Académico, alcanza a buscar y reforzar nuevas alternativas para mejorar las existentes, contribuyendo ademas con un método mas para la tarea de análisis de opinión, y así contribuir un poco a las investigaciones en el tema.
Impacto Organizacional, alcanza a la industria, dado que muchas de estas requieren analizar comentarios relacionados a su marca. ya que el mercado de hoy se mueve en las redes sociales, las marcas invierten en publicidad y les ayudaría para saber que promociones son aceptadas o no por su publico.