Análisis de algoritmos basados en técnicas de conglomerado aplicados en el alineamiento y comparación de secuencias de proteínas

La Bioinformáticatiene como objetivo el desarrollo y uso de técnicas matemáticas y computacionales para ayudar a resolver problemas referentes ala Biología. En la actualidad existen muchas técnicas de Minería de Datos que han posibilitado el desarrollo de ésta, entre las que sobresalen la Clasifi...

Full description

Main Author: Concepcion, Mendieta
Format: Artículo
Language: Español
Español
Español
Published: Máster Alicia María Idiáquez López 2015
Subjects:
Online Access: http://repositorio.unan.edu.ni/5792/
http://repositorio.unan.edu.ni/5792/
http://repositorio.unan.edu.ni/5792/1/cover_issue_16_es_ES.png
http://repositorio.unan.edu.ni/5792/2/99-265-1-SM.pdf
http://repositorio.unan.edu.ni/5792/3/cc.jpg
Summary: La Bioinformáticatiene como objetivo el desarrollo y uso de técnicas matemáticas y computacionales para ayudar a resolver problemas referentes ala Biología. En la actualidad existen muchas técnicas de Minería de Datos que han posibilitado el desarrollo de ésta, entre las que sobresalen la Clasificación y el Conglomerado con la finalidad de construir herramientas de análisis más eficientes. No obstante, dada la complejidad que involucra la búsqueda de información interesante en las bases de datos biológicas, desde una perspectiva proteínica, una necesidad en la ciencia actual recae en demandar mayor capacidad de almacenamiento y tratamiento de los datos recopilados a través de los años en los distintos experimentos científicos de orden biológico. Esta necesidad, por tanto, ha implicado la afloración de muchos algoritmos afines al problema de estudio. Sin embargo la calidad de resultados varía considerablemente al aplicar diversos algoritmos a un mismo conjunto de datos proteínicos. En este documento se presenta un análisis de algunos algoritmos de Conglomerados aplicados en áreas específicas de la Bioinformática, la Proteómica, desde el punto de vista de alineamiento y comparación de secuencias de proteínas. Para tal fin, se examinaron tres algoritmos muy populares por su amplio uso, siendo estos: ClustalW, Muscle y T-Coffee. Dado los resultados experimentales se determinó que el mejor algoritmo, desde el punto de vista de tiempo de ejecución fue Muscle, pero T-Coffee presentó mayor calidad y claridad de los alineamiento resultantes.