Búsqueda de proyectos de investigación, programas de impacto, trabajos de investigación y otros

Tesis para optar el Título Profesional - UNSA
Tesis para optar el Título Profesional - Convocatoria 02
Optimización del algoritmo BLAST en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y Distribuido

Franklin Luis Antonio Cruz Gamero; Juan Carlos Gutierrez Caceres

URI:
http://proyectos-vri.unsa.edu.pe/handle/91.103.221022/492

Objetivo

Optimizar en tiempo de procesamiento el algoritmo BLAST en el alineamiento de secuencias de ADN usando procesamiento masivamente paralelo y distribuido, comparando el algoritmo BLAST con los algoritmos BWT y algoritmos evolutivos.

Resumen:

En Bioinformática intentan definir modelos matemáticos de sistemas biológicos usando grandes cantidades de unidades de procesamiento (CPU), generando aplicaciones poco prácticas. Esto está siendo superado por paralelismo usando GPU y sistemas distribuidos, como en el alineamiento de secuencias de ADN. Siendo el objetivo de este proyecto optimizar en tiempo de procesamiento el algoritmo BLAST en el alineamiento de secuencias de ADN usando procesamiento masivamente paralelo y distribuido, comparando el algoritmo BLAST con los algoritmos BWT y algoritmos evolutivos, donde las secuencias de ADN serán obtenidas de bases de datos de acceso público, implementando los algoritmos BLAST, BWT y algoritmos evolutivos en CPU sin paralelismo y sus optimizaciones de los mismos en GPU y sistemas distribuidos, obteniendo algoritmos optimizados para el alineamiento de secuencias más eficiente en cuanto al tiempo de procesamiento.

Palabras clave

Bioinformática, BLAST, alineamiento de secuencias, paralelismo, ADN, CIENCIACTIVA/CONCYTEC.

Problema central

El alineamiento de secuencias permite realizar múltiples estudios en ADN, ARN y proteínas por lo cual es importante tener algoritmos eficientes que permitan optimizar su tiempo de procesamiento. Se optimizarán los algoritmos BLAST, BWT y algoritmos evolutivos debido a que muestran diferencias de rendimiento en sensibilidad y tiempo de procesamiento, siendo indispensable esta información para una rápida y adecuada interpretación por los investigadores en el campo de bioinformática. El impacto de este trabajo será brindar a investigadores una alternativa para realizar alineamientos de secuencias y comparaciones con igual o mayor exactitud y menor coste en tiempo de procesamiento que algoritmos sin optimización. Este proyecto puede ser la base para la construcción de un framework que permita brindar el uso de la optimización de diferentes algoritmos optimizados para la comparación y alineamiento de secuencias de ADN, ARN y proteínas. Así mismo podrá ser utilizado en la generación del software para resolver el problema de alineamiento durante la construcción de nuevas tecnologías como secuenciadores de ADN.

Hipótesis planteada

El algoritmo de alineamiento BLAST optimizado en el alineamiento de secuencias de ADN presentará una reducción en el tiempo de procesamiento que el algoritmo BLAST sin optimizar sin perder su exactitud al momento de alinear secuencias de ADN. Así mismo el BLAST optimizado presentará una reducción en el tiempo de procesamiento mayor que los algoritmos BWT y algoritmos evolutivos optimizados de forma masivamente paralela y distribuida. Esta reducción será afectada por el número de núcleos o procesadores usados.

Resultados esperados

- Tesis de pregrado sustentada satisfactoriamente y publicada en el repositorio oficial de la UNSA.
- Al menos un (01) artículo científico sometido a una revista indexada para revisión en relación a los resultados.
- Presentación de los Resultados de la tesis en un evento nacional o internacional.

Impactos esperados

Impacto Social
Al final de este proyecto se espera optimizar el algoritmo BLAST, así como los algoritmos BWT y algoritmos evolutivos y obtener con ello una nueva tecnología para resolver el problema de alineamiento de secuencias de ADN, brindado el resultado de alineamiento de secuencias en menos tiempo.

Impacto Económico
Contribuirá al desarrollo en el mercado de nuevas tecnologías. La solución presentada podrá ser incorporada en la construcción de un framework de alineamiento de secuencias destinado para investigadores de las áreas de biología molecular y genética en un sentido más amplio que el propuesto en este proyecto, proporcionando avances tecnológicos con impacto social-científico, asimismo puede ser usado como parte del software en el secuenciamiento de ADN, identificación de genes, identificación y diferenciación de especies, obtención de árboles filogenéticos, etc.

Impacto Tecnológico
A pesar de existir grupos de investigación en Bioinformática en el Perú, pocos dedican sus esfuerzos en el área de alineamiento de secuencias. De esta manera, este proyecto contribuirá al desarrollo de esta área en nuestro país.

Impacto Científico
Además de la contribución para el área de bioinformática, la obtención de algoritmos que presenten costos computacionales bajos y escalables con un tiempo de procesamiento bajo contribuirá con el área de alineamiento y comparación de secuencias de ADN, ARN y proteínas, permitiendo su uso para diferentes estudios en las áreas de bioinformática, biología molecular y genética.