Matches in SemOpenAlex for { <https://semopenalex.org/work/W28171850> ?p ?o ?g. }
Showing items 1 to 86 of
86
with 100 items per page.
- W28171850 abstract "La genomique comparee est essentiellement une forme de fouille de donnees dans des grandes collections de relations n-aires. La croissance du nombre de genomes sequences cree un stress sur la genomique comparee qui croit, au pire geometriquement, avec la croissance en donnees de sequence. Aujourd'hui meme des laboratoires de taille modeste obtient, de facon routine, plusieurs genomes a la fois - et comme des grands consortia attend de pouvoir realiser des analyses tout-contre-tout dans le cadre de ses strategies multi-genomes. Afin d'adresser les besoins a tous niveaux il est necessaire de repenser les cadres algorithmiques et les technologies de stockage de donnees utilises pour la genomique comparee. Pour repondre a ces defis de mise a l'echelle, dans cette these nous developpons des methodes originales basees sur les technologies NoSQL et MapReduce. A partir d'une caracterisation des sorts de donnees utilises en genomique comparee et d'une etude des utilisations typiques, nous definissons un formalisme pour le Big Data en genomique, l'implementons dans la plateforme NoSQL Cassandra, et evaluons sa performance. Ensuite, a partir de deux analyses globales tres differentes en genomique comparee, nous definissons deux strategies pour adapter ces applications au paradigme MapReduce et derivons de nouveaux algorithmes. Pour le premier, l'identification d'evenements de fusion et de fission de genes au sein d'une phylogenie, nous reformulons le probleme sous forme d'un parcours en parallele borne qui evite la latence d'algorithmes de graphe. Pour le second, le clustering consensus utilise pour identifier des familles de proteines, nous definissons une procedure d'echantillonnage iterative qui converge rapidement vers le resultat global voulu. Pour chacun de ces deux algorithmes, nous l'implementons dans la plateforme MapReduce Hadoop, et evaluons leurs performances. Cette performance est competitive et passe a l'echelle beaucoup mieux que les algorithmes existants, mais exige un effort particulier (et futur) pour inventer les algorithmes specifiques." @default.
- W28171850 created "2016-06-24" @default.
- W28171850 creator A5055706541 @default.
- W28171850 date "2013-09-09" @default.
- W28171850 modified "2023-09-23" @default.
- W28171850 title "Adressing scaling challenges in comparative genomics" @default.
- W28171850 cites W1493893823 @default.
- W28171850 cites W1523231011 @default.
- W28171850 cites W1569993929 @default.
- W28171850 cites W1575350781 @default.
- W28171850 cites W1967421859 @default.
- W28171850 cites W1972924519 @default.
- W28171850 cites W1981420413 @default.
- W28171850 cites W1989382565 @default.
- W28171850 cites W1994458586 @default.
- W28171850 cites W2006776184 @default.
- W28171850 cites W2007850042 @default.
- W28171850 cites W2010505009 @default.
- W28171850 cites W2019724001 @default.
- W28171850 cites W2027378283 @default.
- W28171850 cites W2029888151 @default.
- W28171850 cites W2041908373 @default.
- W28171850 cites W2046526098 @default.
- W28171850 cites W2055043387 @default.
- W28171850 cites W2067471800 @default.
- W28171850 cites W2076761943 @default.
- W28171850 cites W2084568010 @default.
- W28171850 cites W2095556056 @default.
- W28171850 cites W2098595796 @default.
- W28171850 cites W2098935637 @default.
- W28171850 cites W2099052309 @default.
- W28171850 cites W2099762535 @default.
- W28171850 cites W2100830825 @default.
- W28171850 cites W2104045630 @default.
- W28171850 cites W2109701112 @default.
- W28171850 cites W2109722477 @default.
- W28171850 cites W2110086534 @default.
- W28171850 cites W2110173188 @default.
- W28171850 cites W2113004492 @default.
- W28171850 cites W2114303224 @default.
- W28171850 cites W2119180969 @default.
- W28171850 cites W2121564430 @default.
- W28171850 cites W2121761752 @default.
- W28171850 cites W2124166542 @default.
- W28171850 cites W2127164716 @default.
- W28171850 cites W2132131447 @default.
- W28171850 cites W2137441463 @default.
- W28171850 cites W2145268834 @default.
- W28171850 cites W2145477956 @default.
- W28171850 cites W2148088562 @default.
- W28171850 cites W2150934173 @default.
- W28171850 cites W2152563840 @default.
- W28171850 cites W2153091158 @default.
- W28171850 cites W2153185973 @default.
- W28171850 cites W2153704625 @default.
- W28171850 cites W2153977620 @default.
- W28171850 cites W2157651955 @default.
- W28171850 cites W2159847871 @default.
- W28171850 cites W2165428180 @default.
- W28171850 cites W2166358338 @default.
- W28171850 cites W2170616854 @default.
- W28171850 cites W2249539930 @default.
- W28171850 cites W2622710469 @default.
- W28171850 cites W2730238851 @default.
- W28171850 cites W3162744413 @default.
- W28171850 cites W564941281 @default.
- W28171850 cites W901556 @default.
- W28171850 hasPublicationYear "2013" @default.
- W28171850 type Work @default.
- W28171850 sameAs 28171850 @default.
- W28171850 citedByCount "0" @default.
- W28171850 crossrefType "dissertation" @default.
- W28171850 hasAuthorship W28171850A5055706541 @default.
- W28171850 hasConcept C138885662 @default.
- W28171850 hasConcept C15708023 @default.
- W28171850 hasConcept C17744445 @default.
- W28171850 hasConceptScore W28171850C138885662 @default.
- W28171850 hasConceptScore W28171850C15708023 @default.
- W28171850 hasConceptScore W28171850C17744445 @default.
- W28171850 hasLocation W281718501 @default.
- W28171850 hasOpenAccess W28171850 @default.
- W28171850 hasPrimaryLocation W281718501 @default.
- W28171850 isParatext "false" @default.
- W28171850 isRetracted "false" @default.
- W28171850 magId "28171850" @default.
- W28171850 workType "dissertation" @default.