Matches in SemOpenAlex for { <https://semopenalex.org/work/W1569521592> ?p ?o ?g. }
- W1569521592 endingPage "350" @default.
- W1569521592 startingPage "1" @default.
- W1569521592 abstract "We describe basic concepts and software architectures for the integration of shallow and deep (linguistics-based, semantics-oriented) natural language processing (NLP) components. The main goal of this novel, hybrid integration paradigm is improving robustness of deep processing. After an introduction to constraint-based natural language parsing, we give an overview of typical shallow processing tasks. We introduce XML standoff markup as an additional abstraction layer that eases integration of NLP components, and propose the use of XSLT as a standardized and efficient transformation language for online NLP integration. In the main part of the thesis, we describe our contributions to three hybrid architecture frameworks that make use of these fundamentals. SProUT is a shallow system that uses elements of deep constraint-based processing, namely type hierarchy and typed feature structures. WHITEBOARD is the first hybrid architecture to integrate not only part-of-speech tagging, but also named entity recognition and topological parsing, with deep parsing. Finally, we present Heart of Gold, a middleware architecture that generalizes WHITEBOARD into various dimensions such as configurability, multilinguality and flexible processing strategies. We describe various applications that have been implemented using the hybrid frameworks such as structured named entity recognition, information extraction, creative document authoring support, deep question analysis, as well as evaluations. In WHITEBOARD, e.g., it could be shown that shallow pre-processing increases both coverage and efficiency of deep parsing by a factor of more than two. Heart of Gold not only forms the basis for applications that utilize semanticsoriented natural language analysis, but also constitutes a complex research instrument for experimenting with novel processing strategies combining deep and shallow methods, and eases replication and comparability of results. Diese Arbeit beschreibt Grundlagen und Software-Architekturen fur die Integration von flachen mit tiefen (linguistikbasierten und semantikorientierten) Verarbeitungskomponenten fur naturliche Sprache. Das Hauptziel dieses neuartigen, hybriden Integrationparadigmas ist die Verbesserung der Robustheit der tiefen Verarbeitung. Nach einer Einfuhrung in constraintbasierte Analyse naturlicher Sprache geben wir einen Uberblick uber typische Aufgaben flacher Sprachverarbeitungskomponenten. Wir fuhren XML Standoff-Markup als zusatzliche Abstraktionsebene ein, mit deren Hilfe sich Sprachverarbeitungskomponenten einfacher integrieren lassen. Ferner schlagen wir XSLT als standardisierte und effiziente Transformationssprache fur die Online-Integration vor. Im Hauptteil der Arbeit stellen wir unsere Beitrage zu drei hybriden Architekturen vor, welche auf den beschriebenen Grundlagen aufbauen. SProUT ist ein flaches System, das Elemente tiefer Verarbeitung wie Typhierarchie und getypte Merkmalsstrukturen nutzt. WHITEBOARD ist das erste System, welches nicht nur Part-of-speech-Tagging, sondern auch Eigennamenerkennung und flaches topologisches Parsing mit tiefer Verarbeitung kombiniert. Schlieslich wird Heart of Gold vorgestellt, eine Middleware-Architektur, welche WHITEBOARD hinsichtlich verschiedener Dimensionen wie Konfigurierbarkeit, Mehrsprachigkeit und Unterstutzung flexibler Verarbeitungsstrategien generalisiert. Wir beschreiben verschiedene, mit Hilfe der hybriden Architekturen implementierte Anwendungen wie strukturierte Eigennamenerkennung, Informationsextraktion, Kreativitatsunterstutzung bei der Dokumenterstellung, tiefe Frageanalyse, sowie Evaluationen. So konnte z.B. in WHITEBOARD gezeigt werden, dass durch flache Vorverarbeitung sowohl Abdeckung als auch Effizienz des tiefen Parsers mehr als verdoppelt werden. Heart of Gold bildet nicht nur Grundlage fur semantikorientierte Sprachanwendungen, sondern stellt auch eine wissenschaftliche Experimentierplattform fur weitere, neuartige Kombinationsstrategien dar, welche zudem die Replizierbarkeit und Vergleichbarkeit von Ergebnissen erleichtert." @default.
- W1569521592 created "2016-06-24" @default.
- W1569521592 creator A5010066502 @default.
- W1569521592 date "2006-01-01" @default.
- W1569521592 modified "2023-09-27" @default.
- W1569521592 title "Integrating deep and shallow natural language processing components : representations and hybrid architectures" @default.
- W1569521592 cites W10545031 @default.
- W1569521592 cites W13024833 @default.
- W1569521592 cites W144948969 @default.
- W1569521592 cites W1489594794 @default.
- W1569521592 cites W1491947308 @default.
- W1569521592 cites W1495324502 @default.
- W1569521592 cites W1498342057 @default.
- W1569521592 cites W1502193953 @default.
- W1569521592 cites W1504188396 @default.
- W1569521592 cites W1507541767 @default.
- W1569521592 cites W151117666 @default.
- W1569521592 cites W1513168562 @default.
- W1569521592 cites W1520330047 @default.
- W1569521592 cites W1525141163 @default.
- W1569521592 cites W1530370017 @default.
- W1569521592 cites W1535992660 @default.
- W1569521592 cites W1539395461 @default.
- W1569521592 cites W1542417898 @default.
- W1569521592 cites W1554541429 @default.
- W1569521592 cites W1556556941 @default.
- W1569521592 cites W1564275181 @default.
- W1569521592 cites W1580448320 @default.
- W1569521592 cites W1580609246 @default.
- W1569521592 cites W1586060904 @default.
- W1569521592 cites W1632114991 @default.
- W1569521592 cites W1633960017 @default.
- W1569521592 cites W1690636059 @default.
- W1569521592 cites W1751862190 @default.
- W1569521592 cites W1769373918 @default.
- W1569521592 cites W1792465007 @default.
- W1569521592 cites W1812636409 @default.
- W1569521592 cites W1860762366 @default.
- W1569521592 cites W1872577814 @default.
- W1569521592 cites W1946797560 @default.
- W1569521592 cites W1963684808 @default.
- W1569521592 cites W1972573551 @default.
- W1569521592 cites W1974199921 @default.
- W1569521592 cites W1988078800 @default.
- W1569521592 cites W1996150927 @default.
- W1569521592 cites W1999391519 @default.
- W1569521592 cites W2000665223 @default.
- W1569521592 cites W2001722583 @default.
- W1569521592 cites W2008112715 @default.
- W1569521592 cites W2021473852 @default.
- W1569521592 cites W2027040758 @default.
- W1569521592 cites W2038013119 @default.
- W1569521592 cites W2038248725 @default.
- W1569521592 cites W203959070 @default.
- W1569521592 cites W204004655 @default.
- W1569521592 cites W2040714828 @default.
- W1569521592 cites W2047226970 @default.
- W1569521592 cites W2050888181 @default.
- W1569521592 cites W2052080995 @default.
- W1569521592 cites W2052955739 @default.
- W1569521592 cites W2068882115 @default.
- W1569521592 cites W2071012241 @default.
- W1569521592 cites W2081687495 @default.
- W1569521592 cites W2084128293 @default.
- W1569521592 cites W2095589793 @default.
- W1569521592 cites W2095921564 @default.
- W1569521592 cites W2095955690 @default.
- W1569521592 cites W2096619464 @default.
- W1569521592 cites W2096998127 @default.
- W1569521592 cites W2097125878 @default.
- W1569521592 cites W2098921539 @default.
- W1569521592 cites W2103147879 @default.
- W1569521592 cites W2107298945 @default.
- W1569521592 cites W2107931351 @default.
- W1569521592 cites W2108455276 @default.
- W1569521592 cites W2112987020 @default.
- W1569521592 cites W2113994580 @default.
- W1569521592 cites W2115792525 @default.
- W1569521592 cites W2118916609 @default.
- W1569521592 cites W2121940249 @default.
- W1569521592 cites W2122554501 @default.
- W1569521592 cites W2123396057 @default.
- W1569521592 cites W2123550348 @default.
- W1569521592 cites W2135843243 @default.
- W1569521592 cites W2138635570 @default.
- W1569521592 cites W2139397478 @default.
- W1569521592 cites W2139410224 @default.
- W1569521592 cites W2140270230 @default.
- W1569521592 cites W2143745167 @default.
- W1569521592 cites W2147072563 @default.
- W1569521592 cites W2150945838 @default.
- W1569521592 cites W2152211274 @default.
- W1569521592 cites W2158495215 @default.
- W1569521592 cites W2158557178 @default.
- W1569521592 cites W2160697194 @default.
- W1569521592 cites W2161021345 @default.
- W1569521592 cites W2161160885 @default.
- W1569521592 cites W2163450644 @default.