Matches in SemOpenAlex for { <https://semopenalex.org/work/W2129833406> ?p ?o ?g. }
Showing items 1 to 29 of
29
with 100 items per page.
- W2129833406 abstract "El objetivo de la integracion de informacion empresarial es ofrecer un acceso uniforme a multiples fuentes de datos, que deben ser tratados como una base de datos unica. Los wrappers web son modulos software que tienen como objetivo ofrecer una API para abstraer a los desarrolladores de los detalles requeridos para simular el comportamiento de una persona con los formularios y para transformar los resultados a datos estructurados. Un componente clave en un web wrapper es el extractor de informacion, que se usa para extraer y estructurar la informacion de los documentos web. Existen en la actualidad muchas tecnicas para aprender las reglas de extraccion de informacion, pero ninguna de ellas es aplicable universalmente. En esta tesis doctoral, nos centramos en las tecnicas no supervisadas para aprender estas reglas y los extractores de informacion basados en heuristicas que no utilizan reglas. Los problemas que estudiamos en esta tesis doctoral son la forma de reducir los costes de desarrollo de las tecnicas de extraccion de informacion, la forma de comparar estas tecnicas de una forma homogenea y como extraer informacion usando tecnicas de extraccion eficientes y efectivas. Actualmente, no existe ningun framework para ayudar a los ingenieros del software a disenar e implementar nuevas tecnicas de extraccion de informacion para sitios web semi-estructurados; ademas, las tecnicas no supervisadas existentes tienen diversos problemas que afectan a su aplicacion en la practica. En esta tesis doctoral presentamos una arquitectura de referencia acompanada de un framework para ayudar a los ingenieros del software a desarrollar nuevas tecnicas de extraccion de informacion para documentos semi-estructurados. Ademas, proponemos dos tecnicas no supervisadas para la extraccion de informacion que han demostrado ser muy efectivas y eficientes en la practica." @default.
- W2129833406 created "2016-06-24" @default.
- W2129833406 creator A5008514952 @default.
- W2129833406 date "2014-05-27" @default.
- W2129833406 modified "2023-09-24" @default.
- W2129833406 title "Enterprise Information Integration Unsupervised proposals for web information extraction" @default.
- W2129833406 hasPublicationYear "2014" @default.
- W2129833406 type Work @default.
- W2129833406 sameAs 2129833406 @default.
- W2129833406 citedByCount "0" @default.
- W2129833406 crossrefType "dissertation" @default.
- W2129833406 hasAuthorship W2129833406A5008514952 @default.
- W2129833406 hasConcept C138885662 @default.
- W2129833406 hasConcept C15708023 @default.
- W2129833406 hasConcept C205649164 @default.
- W2129833406 hasConcept C41008148 @default.
- W2129833406 hasConcept C58640448 @default.
- W2129833406 hasConceptScore W2129833406C138885662 @default.
- W2129833406 hasConceptScore W2129833406C15708023 @default.
- W2129833406 hasConceptScore W2129833406C205649164 @default.
- W2129833406 hasConceptScore W2129833406C41008148 @default.
- W2129833406 hasConceptScore W2129833406C58640448 @default.
- W2129833406 hasLocation W21298334061 @default.
- W2129833406 hasOpenAccess W2129833406 @default.
- W2129833406 hasPrimaryLocation W21298334061 @default.
- W2129833406 isParatext "false" @default.
- W2129833406 isRetracted "false" @default.
- W2129833406 magId "2129833406" @default.
- W2129833406 workType "dissertation" @default.