Matches in SemOpenAlex for { <https://semopenalex.org/work/W437521597> ?p ?o ?g. }
Showing items 1 to 38 of
38
with 100 items per page.
- W437521597 abstract "Nous etudions dans cette these les methodes de compression de donnees dans le cadre de leur utilisation pour le traitement de textes en langue naturelle. Nous nous interessons particulierement aux algorithmes utilisant les mots comme unite de base.Nous avons developpe des algorithmes qui permettent de diviser la taille originale du texte par un coefficient de l'ordre de 3,5 en conservant l'acces direct (via un index) au texte sous forme comprimee.L'ensemble des mots qui composent un texte (le lexique) n'est pas, (a priori) connu. Compresser efficacement un texte necessite donc de compresser egalement le lexique des mots qui le constitue. Dans ce but, nous avons mis au point une methode de representation des lexiques qui permet, en lui appliquant une compression a base de chaines de Markov, d'obtenir des taux de compression tres importants.Les premiers algorithmes dedies a la compression de textes en langue naturelle ont ete elabores dans le but d'archiver de volumineuses bases de donnees textuelles, pouvant atteindre plusieurs dizaines de gigaoctets, pour lesquelles la taille du lexique est tres inferieure a celle des donnees. Nos algorithmes peuvent s'appliquer aussi aux textes de taille usuelle (variant d'une cinquantaine de Ko a quelques Mo) pour lesquels la taille du lexique represente une part importante de celle du texte" @default.
- W437521597 created "2016-06-24" @default.
- W437521597 creator A5027851935 @default.
- W437521597 date "2000-01-01" @default.
- W437521597 modified "2023-09-26" @default.
- W437521597 title "Compression de textes en langue naturelle" @default.
- W437521597 hasPublicationYear "2000" @default.
- W437521597 type Work @default.
- W437521597 sameAs 437521597 @default.
- W437521597 citedByCount "0" @default.
- W437521597 crossrefType "report" @default.
- W437521597 hasAuthorship W437521597A5027851935 @default.
- W437521597 hasConcept C142362112 @default.
- W437521597 hasConcept C159985019 @default.
- W437521597 hasConcept C180016635 @default.
- W437521597 hasConcept C192562407 @default.
- W437521597 hasConceptScore W437521597C142362112 @default.
- W437521597 hasConceptScore W437521597C159985019 @default.
- W437521597 hasConceptScore W437521597C180016635 @default.
- W437521597 hasConceptScore W437521597C192562407 @default.
- W437521597 hasLocation W4375215971 @default.
- W437521597 hasLocation W4375215972 @default.
- W437521597 hasOpenAccess W437521597 @default.
- W437521597 hasPrimaryLocation W4375215971 @default.
- W437521597 hasRelatedWork W1531601525 @default.
- W437521597 hasRelatedWork W2748952813 @default.
- W437521597 hasRelatedWork W2758277628 @default.
- W437521597 hasRelatedWork W2899084033 @default.
- W437521597 hasRelatedWork W2935909890 @default.
- W437521597 hasRelatedWork W2948807893 @default.
- W437521597 hasRelatedWork W3173606202 @default.
- W437521597 hasRelatedWork W3183948672 @default.
- W437521597 hasRelatedWork W2778153218 @default.
- W437521597 hasRelatedWork W3110381201 @default.
- W437521597 isParatext "false" @default.
- W437521597 isRetracted "false" @default.
- W437521597 magId "437521597" @default.
- W437521597 workType "report" @default.