Matches in SemOpenAlex for { <https://semopenalex.org/work/W52043909> ?p ?o ?g. }
Showing items 1 to 37 of
37
with 100 items per page.
- W52043909 abstract "Le developpement des systemes de gestion de contenu a profondement change la nature du Web : de plus en plus de documents sont crees automatiquement et leur mise en page reflete leur structure logique. Dans ce travail, nous montrons que l’information contenue dans la mise en page est suffisante pour inferer une structure semantiquement riche, ce qui ouvre la voie a de nombreuses applications. Le passage d’une information de mise en page a une structure semantique se heurte a deux principaux obstacles : l’heterogeneite des donnees et le caractere implicite de de la structure des documents Web. Nous decrivons un modele stochastique capable d’apprendre a transformer des documents semi-structures vers un schema defini a priori et presentons une instance particuliere de ce modele adaptee a la transformation de documents heterogenes HTML en XML. Finalement, nous decrivons plusieurs experiences sur des corpus XML et HTML reels." @default.
- W52043909 created "2016-06-24" @default.
- W52043909 creator A5013670630 @default.
- W52043909 creator A5027101473 @default.
- W52043909 creator A5056955528 @default.
- W52043909 creator A5086752907 @default.
- W52043909 date "2006-03-01" @default.
- W52043909 modified "2023-09-25" @default.
- W52043909 title "Modèle probabiliste pour l'extraction de structures dans les documents semi-structurés: Application aux documents Web" @default.
- W52043909 hasPublicationYear "2006" @default.
- W52043909 type Work @default.
- W52043909 sameAs 52043909 @default.
- W52043909 citedByCount "0" @default.
- W52043909 crossrefType "proceedings-article" @default.
- W52043909 hasAuthorship W52043909A5013670630 @default.
- W52043909 hasAuthorship W52043909A5027101473 @default.
- W52043909 hasAuthorship W52043909A5056955528 @default.
- W52043909 hasAuthorship W52043909A5086752907 @default.
- W52043909 hasConcept C41008148 @default.
- W52043909 hasConceptScore W52043909C41008148 @default.
- W52043909 hasLocation W520439091 @default.
- W52043909 hasOpenAccess W52043909 @default.
- W52043909 hasPrimaryLocation W520439091 @default.
- W52043909 hasRelatedWork W2093578348 @default.
- W52043909 hasRelatedWork W2130043461 @default.
- W52043909 hasRelatedWork W2350741829 @default.
- W52043909 hasRelatedWork W2358668433 @default.
- W52043909 hasRelatedWork W2376932109 @default.
- W52043909 hasRelatedWork W2382290278 @default.
- W52043909 hasRelatedWork W2390279801 @default.
- W52043909 hasRelatedWork W2748952813 @default.
- W52043909 hasRelatedWork W2899084033 @default.
- W52043909 hasRelatedWork W3004735627 @default.
- W52043909 isParatext "false" @default.
- W52043909 isRetracted "false" @default.
- W52043909 magId "52043909" @default.
- W52043909 workType "article" @default.