Matches in SemOpenAlex for { <https://semopenalex.org/work/W94785903> ?p ?o ?g. }
- W94785903 abstract "El campo de la Bioinformatica esta continuamente generando nuevos retos debido a la necesidad de analizar la gran cantidad de informacion biologica de la que se dispone en la actualidad, principalmente extraida de las nuevas tecnicas de secuenciacion masiva (NGS). Algunos de estos desafios estan enfocados al analisis de secuencias de proteinas, para obtener o predecir otras caracteristicas relacionadas tales como estructuras, funcionalidades u homologias. Una de las herramientas mas potentes en este sentido son los alineamientos multiples de secuencias (MSAs). Los MSAs constituyen una de las estrategias mas ampliamente utilizadas en la actualidad en la Biologia Molecular. Su principal cometido es la comparacion de cadenas moleculares (principalmente nucleotidos o aminoacidos) en la busqueda de las semejanzas y diferencias mas relevantes. Estas tecnicas fueron inicialmente disenadas para la transferencia de homologia gracias a lo cual secuencias de proteinas pobremente caracterizadas podian compararse con otras homologas, profundamente conocidas, pertenecientes a organismos modelos. En la actualidad, el uso de las estrategias de MSAs se ha extendido a otros numerosos campos como los analisis filogeneticos, modelado estructural de proteinas o predicciones de funcionalidad.El desarrollo en los ultimos anos de novedosas tecnicas experimentales tales como la secuenciacion masiva o de nueva generacion (NGS) y experimentos de alto rendimiento, han conllevado una gran demanda de este tipo de analisis. Las estrategias de MSAs contribuyen a la obtencion de informacion biologica a partir de las coincidencias entre las secuencias de nucleotidos o de aminoacidos. Asi, es esencial que las herramientas de MSAs sean capaces de procesar la enorme cantidad de informacion generada a traves de las anteriormente citadas tecnicas. Con este fin se estan aplicando numerosas estrategias computacionales avanzadas basadas en algoritmos de inteligencia artificial y de aprendizaje supervisado (machine learning) tales como modelos ocultos de Markov (hidden Markov models, HMMs), maquinas de vector soporte (support vector machines, SVMs) o algoritmos geneticos (GAs). Asi, las tecnicas de alineamiento multiple de secuencias estan considerados en la actualidad uno de los procedimientos mas potentes y necesarios en la Bioinformatica. Sin embargo, es todavia necesario abordar ciertas carencias que presentan estas tecnicas.En primer lugar, a pesar de la existencia de numerosas herramientas para el alineamiento multiple de secuencias, todavia no se dispone de un estandar apropiado para construir los alineamientos. Como consecuencia, cada herramienta genera un alineamiento que puede diferir notablemente del generado por otra, debido a la aplicacion de sus propios criterios. La evaluacion de los alineamientos tambien genera un problema adicional. Dado que no existe un consenso acerca de que metodologia es la mas adecuada para evaluar el alineamiento, se tiende a evaluarlo aplicando los sistemas clasicos de evaluacion tales como PAM o BLOSUM lo que puede conllevar a alineamientos no suficientemente precisos. Asi, la mejora de estos sistemas de evaluacion mediante la incorporacion de informacion complementaria podria contribuir a la mejora del analisis de calidad y a la obtencion de herramientas de alineamiento mas eficientes. Finalmente, tambien es ampliamente conocido que las tecnicas clasicas de alineamientos de secuencias no proporcionan una calidad aceptable en el alineamiento cuando se trata de secuencias evolutivamente distantes. En estos casos la informacion obtenida de las secuencias podria ser insuficiente para alcanzar el alineamiento mas optimo.Por tanto, esta tesis esta orientada a tratar de dar solucion a los problemas previamente expuestos sobre las tecnicas de alineamiento multiple de secuencias. Estas soluciones estan basadas principalmente en sistemas inteligentes y avanzados que se han aplicado a los problemas de regresion, prediccion, clasificacion y optimizacion subyacentes a los MSAs. En concreto, hemos propuesto tres aportaciones a este campo considerando la necesidad de obtener alineamientos eficientes y precisos asi como la necesidad de mejora de los sistemas de evaluacion.La primera contribucion de esta tesis considera numerosas herramientas ampliamente conocidas de MSA para predecir cual de ellas proporcionaria un alineamiento mas preciso para un conjunto de secuencias que se quieren alinear. Especificamente, en esta seccion de la tesis, se estimara la calidad de cada herramienta de MSA analizada para alinear un conjunto determinado de secuencias, antes de que el alineamiento sea realizado. Este algoritmo esta basado en un modelo de Least-Squares Support Vector Machine (LS-SVM) e integra caracteristicas biologicas relevantes obtenidas de varias fuentes y bases de datos.El segundo aporte de esta tesis doctoral es una herramienta similar a la anterior pero con un proposito considerablemente diferente. En este caso se propondran una serie de modelos de regresion (procesos Gausianos, arboles de regresion, Bagging trees y LS-SVM) para disenar diversos sistemas de evaluacion de alineamientos. Estos sistemas de evaluacion tienen como objetivo integrar no solo la informacion que se extrae de los alineamientos sino tambien otras caracteristicas de las proteinas que han sido alineadas. De esta manera presentamos un sofisticado sistema de evaluacion capaz de detectar relaciones mas distantes entre secuencias y, por tanto, capaz de estimar de forma mas realista la precision de los alineamientos.Por ultimo, la tercera propuesta de esta tesis doctoral es una optimizacion de las tecnicas de alineamiento multiple de secuencia. Con esta aportacion se pretende mejorar la calidad de los alineamientos llevados a cabo por otras tecnicas. Este optimizador esta basado en un algoritmo genetico con una funcion de fitness multiobjetivo. Dicho algoritmo aplica operadores de crossover y de mutacion disenados por nuestro grupo de investigacion asi como tres objetivos diferentes, uno de los cuales esta basado en la conservacion de la estructura de las secuencias. Asi, la adiccion de informacion estructural nos permite obtener alineamientos mas precisos en los casos de secuencias menos relacionadas evolutivamente." @default.
- W94785903 created "2016-06-24" @default.
- W94785903 creator A5047036875 @default.
- W94785903 date "2014-01-01" @default.
- W94785903 modified "2023-09-23" @default.
- W94785903 title "Development of advanced computational systems for multiple sequence alignments by using heterogeneous biological information" @default.
- W94785903 cites W103650626 @default.
- W94785903 cites W11515763 @default.
- W94785903 cites W1527979595 @default.
- W94785903 cites W1539598433 @default.
- W94785903 cites W1564638059 @default.
- W94785903 cites W1567621547 @default.
- W94785903 cites W157482310 @default.
- W94785903 cites W1574945381 @default.
- W94785903 cites W1590240800 @default.
- W94785903 cites W1608057971 @default.
- W94785903 cites W1619226191 @default.
- W94785903 cites W1746819321 @default.
- W94785903 cites W1775447850 @default.
- W94785903 cites W1967627390 @default.
- W94785903 cites W1972978214 @default.
- W94785903 cites W1978014862 @default.
- W94785903 cites W1979147581 @default.
- W94785903 cites W1980913156 @default.
- W94785903 cites W1988929438 @default.
- W94785903 cites W1989034333 @default.
- W94785903 cites W1996681309 @default.
- W94785903 cites W2002180966 @default.
- W94785903 cites W2004178884 @default.
- W94785903 cites W2004228538 @default.
- W94785903 cites W2004575181 @default.
- W94785903 cites W2005313213 @default.
- W94785903 cites W2007668764 @default.
- W94785903 cites W2007924998 @default.
- W94785903 cites W2008708467 @default.
- W94785903 cites W2009310436 @default.
- W94785903 cites W2009702467 @default.
- W94785903 cites W2011289056 @default.
- W94785903 cites W2015642465 @default.
- W94785903 cites W2015915218 @default.
- W94785903 cites W2016060560 @default.
- W94785903 cites W2020541351 @default.
- W94785903 cites W2027788481 @default.
- W94785903 cites W2028624874 @default.
- W94785903 cites W2037589601 @default.
- W94785903 cites W2039878336 @default.
- W94785903 cites W2043764521 @default.
- W94785903 cites W2045821558 @default.
- W94785903 cites W2052831012 @default.
- W94785903 cites W2052852933 @default.
- W94785903 cites W2053238889 @default.
- W94785903 cites W2055043387 @default.
- W94785903 cites W2065001361 @default.
- W94785903 cites W2065921821 @default.
- W94785903 cites W2066593167 @default.
- W94785903 cites W2070637511 @default.
- W94785903 cites W2073234837 @default.
- W94785903 cites W2073589460 @default.
- W94785903 cites W2074231493 @default.
- W94785903 cites W2076048958 @default.
- W94785903 cites W2088156508 @default.
- W94785903 cites W2093931624 @default.
- W94785903 cites W2095095223 @default.
- W94785903 cites W2097059553 @default.
- W94785903 cites W2097706568 @default.
- W94785903 cites W2099111195 @default.
- W94785903 cites W2099331417 @default.
- W94785903 cites W2100086875 @default.
- W94785903 cites W2100945839 @default.
- W94785903 cites W2102885074 @default.
- W94785903 cites W2102941368 @default.
- W94785903 cites W2103130355 @default.
- W94785903 cites W2104192260 @default.
- W94785903 cites W2106770680 @default.
- W94785903 cites W2106882534 @default.
- W94785903 cites W2108508060 @default.
- W94785903 cites W2109581912 @default.
- W94785903 cites W2117484859 @default.
- W94785903 cites W2119362018 @default.
- W94785903 cites W2120141270 @default.
- W94785903 cites W2122097054 @default.
- W94785903 cites W2123838014 @default.
- W94785903 cites W2126103104 @default.
- W94785903 cites W2126105956 @default.
- W94785903 cites W2126466006 @default.
- W94785903 cites W2127122014 @default.
- W94785903 cites W2127322768 @default.
- W94785903 cites W2127688908 @default.
- W94785903 cites W2127774996 @default.
- W94785903 cites W2128442209 @default.
- W94785903 cites W2128935141 @default.
- W94785903 cites W2130060890 @default.
- W94785903 cites W2130479394 @default.
- W94785903 cites W2130940308 @default.
- W94785903 cites W2131253515 @default.
- W94785903 cites W2132926880 @default.
- W94785903 cites W2133990480 @default.
- W94785903 cites W2135966063 @default.
- W94785903 cites W2136570298 @default.
- W94785903 cites W2138270253 @default.