Matches in SemOpenAlex for { <https://semopenalex.org/work/W65795896> ?p ?o ?g. }
Showing items 1 to 79 of
79
with 100 items per page.
- W65795896 abstract "L'objectif principal d'un SRI classique est de retrouver les documents dont le contenu est conforme a une requete donnee. Dans cette optique, les documents sont representes par un ensemble de mots-cles decrivant leurs contenus. La structure du document n'est pas prise en consideration ni au niveau de la requete, ni au niveau de la reponse pour retourner les parties pertinentes : la reponse a une requete reste le document tout entier. Aujourd'hui, l'utilisation de l'information apportee par la structure devient une necessite dans le domaine d'acces a l'information. Cette necessite provient d'un type de document qui est tres bien repandu sur Internet, utilise comme un standard d'echange sur le Web : le langage XML (eXtensible Markup Langage) qui est utilise comme format de donnees structurees sur le Web, et qui impose au SRI de retrouver des unites d'information qui ne sont pas necessairement le document entier. L'appariement document/requete doit alors etre realise d'une facon telle que les granules documentaires dont la structure presente de legeres differences avec la structure de la requete recoivent un score. Il peut egalement etre vu comme l'inverse de l'effort necessaire pour la construction incrementale d'un arbre a partir d'un autre. Grâce a la flexibilite apportee par la phase d'indexation, nous avons defini un algorithme base sur le principe de relaxation des requetes, qui permet de comparer les arbres requete et documents et de retourner les sous arbres potentiellement pertinents. Selon les sous arbres retournes a chaque document, nous avons defini une fonction de ressemblance entre la requete et le document. Cette fonction est une agregation du score provenant de la structure et celui provenant du contenu des documents XML traites. L'algorithme que nous proposons pour la comparaison d'arbres permet de localiser les sous arbres similaires a l'arbre representant la requete. Ce premier appariement permet de fournir des scores orientes structure dans une echelle hautement graduee. En effet, l'extension que nous appliquons sur les representations du document et de la requete et qui constituent le point de depart de notre algorithme de recherche augmentent la structure par des liens de descendance ponderes. L'algorithme de recherche de structures pertinentes est base sur les valeurs de ses liens. Les structures sont plus pertinentes que les fragments sont plus larges, plus ramifies et plus reels (si les poids des liens de descendance sont plus eleves). Le traitement du contenu est realise independamment de la structure. La separation entre les deux types d'appariement permet de mesurer l'impact de chacun. Nous nous sommes bases sur les modelisations arborescentes des documents XML. Cette modelisation permet de facon naturelle de traiter la structure et le contenu d'un document XML d'une maniere independante. L'objectif principal de notre methode est de combiner l'information portee par la structure et celle portee par le contenu. On distingue dans la litterature deux principes courants, la plupart des modeles de RI utilisent la propagation des scores : on propage le score d'un noeud pertinent a une requete (en terme de contenu) a ses ancetres. Les autres modeles se basent sur la propagation du contenu : au lieu de la propagation du score, on propage le contenu d'un noeud a un autre via les liens de descendance et on calcule son score independamment. Nous adoptons deux manieres pour propager le texte d'un noeud feuille a ces ancetres, la premiere se base sur la profondeur (le seul critere considere dans la litterature), la deuxieme se base sur la profondeur et la largeur (exprime en fonction du nombre de fils) d'un document XML. Nous nous sommes bases sur la separation entre le traitement du contenu et de la structure. Cette separation nous a permis de tirer profit des techniques de comparaison d'arbres pour le traitement de la structure, et des techniques de recherche d'information pour traiter le contenu. D'autre part, elle nous a ete benefique pour mesurer l'apport de chaque orientation de recherche. Par ailleurs, et dans des conditions reelles d'utilisation, la separation entre le contenu et la structure permet une utilisation plus liberee du systeme, en effet l'utilisateur pourra orienter sa recherche vers le contenu ou la structure selon son besoin en information. Le traitement separe du contenu et de la structure de chaque element XML engendre deux scores : un score pour le contenu et un score pour la structure. Leur combinaison en un score definitif permet de les ordonner selon leur pertinence potentielle. Nous avons developpe deux techniques pour la combinaison des scores : une technique basee sur une combinaison lineaire et une deuxieme technique basee sur les distributions des scores. L'evaluation de notre modele, grâce au prototype que nous avons developpe, montre l'interet de nos propositions" @default.
- W65795896 created "2016-06-24" @default.
- W65795896 creator A5004381085 @default.
- W65795896 date "2009-01-01" @default.
- W65795896 modified "2023-09-23" @default.
- W65795896 title "Une approche algébrique pour la recherche d'information structurée" @default.
- W65795896 cites W1482214997 @default.
- W65795896 cites W1497359846 @default.
- W65795896 cites W1541128204 @default.
- W65795896 cites W1565964072 @default.
- W65795896 cites W1573996261 @default.
- W65795896 cites W157864449 @default.
- W65795896 cites W1580172362 @default.
- W65795896 cites W1597493242 @default.
- W65795896 cites W1602236681 @default.
- W65795896 cites W1647671624 @default.
- W65795896 cites W1877797137 @default.
- W65795896 cites W1922703629 @default.
- W65795896 cites W1956559956 @default.
- W65795896 cites W1964836477 @default.
- W65795896 cites W19662613 @default.
- W65795896 cites W1975009259 @default.
- W65795896 cites W1979346010 @default.
- W65795896 cites W2000569744 @default.
- W65795896 cites W2007197665 @default.
- W65795896 cites W201067549 @default.
- W65795896 cites W2014415866 @default.
- W65795896 cites W2019976352 @default.
- W65795896 cites W2030487185 @default.
- W65795896 cites W2031746366 @default.
- W65795896 cites W2035582095 @default.
- W65795896 cites W2036699059 @default.
- W65795896 cites W2044746110 @default.
- W65795896 cites W2046983134 @default.
- W65795896 cites W2063545845 @default.
- W65795896 cites W2068632118 @default.
- W65795896 cites W2069870183 @default.
- W65795896 cites W2078875869 @default.
- W65795896 cites W2082729696 @default.
- W65795896 cites W2092488901 @default.
- W65795896 cites W2092604030 @default.
- W65795896 cites W2093390569 @default.
- W65795896 cites W2098162425 @default.
- W65795896 cites W2100280293 @default.
- W65795896 cites W2115603438 @default.
- W65795896 cites W2128396103 @default.
- W65795896 cites W2152593687 @default.
- W65795896 cites W2159080219 @default.
- W65795896 cites W2160545241 @default.
- W65795896 cites W2164547069 @default.
- W65795896 cites W2165612380 @default.
- W65795896 cites W2166282252 @default.
- W65795896 cites W2212118560 @default.
- W65795896 cites W2321470647 @default.
- W65795896 cites W33041674 @default.
- W65795896 cites W53956777 @default.
- W65795896 cites W72171902 @default.
- W65795896 cites W78772246 @default.
- W65795896 cites W1608493630 @default.
- W65795896 hasPublicationYear "2009" @default.
- W65795896 type Work @default.
- W65795896 sameAs 65795896 @default.
- W65795896 citedByCount "5" @default.
- W65795896 countsByYear W657958962016 @default.
- W65795896 crossrefType "dissertation" @default.
- W65795896 hasAuthorship W65795896A5004381085 @default.
- W65795896 hasConcept C138885662 @default.
- W65795896 hasConcept C15708023 @default.
- W65795896 hasConcept C17744445 @default.
- W65795896 hasConceptScore W65795896C138885662 @default.
- W65795896 hasConceptScore W65795896C15708023 @default.
- W65795896 hasConceptScore W65795896C17744445 @default.
- W65795896 hasLocation W657958961 @default.
- W65795896 hasOpenAccess W65795896 @default.
- W65795896 hasPrimaryLocation W657958961 @default.
- W65795896 isParatext "false" @default.
- W65795896 isRetracted "false" @default.
- W65795896 magId "65795896" @default.
- W65795896 workType "dissertation" @default.