OA Datenbank "Adjective-Adverb Interfaces in Romance"
OA Database "Adjective-Adverb Interfaces in Romance"
Wissenschaftsdisziplinen
Andere Geisteswissenschaften (40%); Sprach- und Literaturwissenschaften (60%)
Keywords
-
Corpus Linguistics,
Longterm Preservation,
Interactive Research Infrastructures,
Adjective and adverb,
Romance languages
Das Projekt Open Access Database Adjective-Adverb Interfaces in Romance soll von der Grazer Forschungsgruppe The Interfaces of Adjective and Adverb in Romance durchgeführt werden. Die Forschungsgruppe hat seit 2002 rund 40 Artikel und Bücher zu diesem Thema publiziert. Diese Publikationen waren streng korpusbasiert, wobei drei der Korpora schon über ein Suchinterface open access verfügbar sind, das erste seit 2005. Insofern steht das Projekt in einer Tradition korpusbasierter Linguistik, die von Anfang an darauf abgezielt hat, das wissenschaftliche Prinzip der Nachvollziehbarkeit der Analysen durch die scientific community konsequent zu gewährleisten. Hierfür ist der freie Zugang zu allen Daten unabdingbar. Durch Kooperation mit dem Zentrum für Informationsmodellierung (Austrian Centre for Digital Humanities, ZIM-ACDH) in Graz kann nun ein großer qualitativer Schritt nach vorne gemacht werden, insofern als das Taggen der Daten nach aktuellem Stand der linguistischen (verantwortlich: Martin Hummel) und informationstechnischen Forschung (verantwortlich: Johannes Stigler) aktualisiert bzw. neu erfolgen kann. Zu diesem Zweck wurden zwei Pilotkorpora im Rahmen einer Kooperation von Romanistik und ZIM-ACDH nach dem aktuellen Stand der wissenschaftlichen Fragestellungen getaggt und für erste Publikationen verwendet. Im Rahmen des Projekts soll zudem der offene Zugang zu den dahinterliegenden Forschungsdaten in XML/TEI P5 realisiert und Austauschformate nach Empfehlung des CLARIN ERIC angeboten werden, um optimale Nachnutzbarkeit durch die scientific community zu gewährleisten. Diese Prinzipien werden im Rahmen des Projekts auf mehrere, großenteils schon erstellte Datenbanken angewendet, wobei internationale Partner wie Adam Ledgeway (Cambridge) und Adrian Chircu (Cluj- Napoca) Daten zu Dialekten Italiens und zum Altrumänischen betragen werden. Auf diese Weise kann eine gemeinsame Plattform für Datenbanken erstellt werden, die nach Abschluss des Projekts große Teile der Romania abdeckt und in längerer Perspektive auf eine immer dichtere Abdeckung abzielt. Damit erhält die traditionelle Methodologie der historisch-vergleichenden Linguistik eine moderne Datengrundlage, die von der Forschungsgruppe in der Zukunft genutzt werden wird, etwa im Bereich der Nachwuchsförderung (bereits geplant: eine Habilitation, eine Dissertation), und möglichst auch von anderen LinguistInnen.
Das Projekt "Open-Access Database: Adjective-Adverb Interfaces in Romance" (2017-2020) war ein Kooperationsprojekt zwischen dem Institut für Romanistik (https://romanistik.uni-graz.at) und dem Zentrum für Informationsmodellierung (https://informationsmodellierung.uni-graz.at). Im Zuge des Projekts wurde das frei zugängige sprachwissenschaftliche Korpus "Open-Access Database: Adjective-Adverb Interfaces in Romance" (http://gams.uni-graz.at/context:aaif) erstellt, das mehrere Datensätze zusammenführt und neue Datensätze ergänzt, die mit gemeinsamen Tools analysiert werden können. Insgesamt wurden über 35.000 historische und aktuelle Belegstellen zu Adjektiven in adverbialen Funktionen in mehreren Sprachen (Französisch, Spanisch, Portugiesisch, süditalienische Varietäten, Rumänisch und Latein) systematisch ausgezeichnet. Dazu zählen Adjektivadverbien wie beispielsweise Fr. voler haut 'hoch fliegen' oder aller droit 'geradeaus gehen' und andere adverbiale Elementen wie Präpositionalphrasen des Typs Pt. de novo 'noch einmal' oder Sp. a ciegas 'blindlings'. Im Zuge des Projekts wurde ein Annotationsmodell weiterentwickelt, welches Kategorien wie Wortbildung, grammatikalische Verwendung und Bedeutungen umfasst. Für jede einzelne Belegstelle wurden sieben Kategorien sowie das Lemma des jeweiligen Adverbs händisch annotiert. Das fertige Korpus kann in einer Suchmaske durchsucht werden. Durch die Lemmatisierung werden unterschiedlichste Varianten innerhalb einer Sprache abgedeckt und können gleichzeitig durchsucht werden. Die Suchanfrage nach den annotierten Kategorien erlaubt eine sprachübergreifende Suche, z.B. nach bestimmten formalen Eigenschaften oder nach Bedeutungen. Für die sprachübergreifende Ausrichtung des Korpus kooperierte das Projekt mit internationalen Projektpartnern, speziell für süditalienische Varietäten, Portugiesisch, Rumänisch und Latein. Außerdem wurden drei bereits bestehende Datensätze des Französischen und Spanischen aktualisiert und an die neuen Annotationen angepasst. Jedes dieser einzelnen Korpora basiert auf dem gleichen Annotationsmodell, das somit sprachübergreifend anwendbar ist. In der Suchmaske kann entweder innerhalb eines Korpus oder in mehreren Korpora gleichzeitig nach Belegstellen gesucht werden. Die so zur Verfügung gestellten Forschungsdaten sind im Geisteswissenschaftlichen Asset Management System (GAMS) im Sinne der Langzeitarchivierung digitaler Ressourcen gesichert. So sind einzelne Subkorpora frei verfügbar und können inkl. der Annotationen in wiederverwendbaren Formaten (XML/TEI, XML/RDF oder Excel) heruntergeladen werden. Das Annotationsmodell ist als Ontologie des Web of Data formalisiert. Es erlaubt in Zukunft, die hoch strukturierten Daten mit anderen Datenquellen zu vernetzen und stellt die konzeptuelle Grundlage zur technischen Umsetzung der Suchmaske. Die Homepage der Datenbank enthält eine genaue und transparente Beschreibung der Metadaten und der Datenquellen, sowie des Annotationstools. Außerdem umfasst die Beschreibung der einzelnen Korpora eine Liste der darin enthaltenen Adverbien, nämlich eine Liste der Lemmata und der Anzahl der dazu registrierten Belege. Da die Datenbank offen ist für neue Datensätze/Unterkorpora, kann sie in Zukunft erweitert werden. Dazu wird das Annotationstool frei zur Verfügung gestellt. Dank der sprachübergreifenden Konzeption der Datenbank erlaubt dieses Tool weitere Forschungsarbeiten im Rahmen des Langzeit-Forschungsschwerpunkts "Adjektiv-Adverb Schnittstellen in romanischen Sprachen". Mehrere Publikationen basieren bereits auf den gewinnbringenden Daten. Das zunehmende Interesse der internationalen Forschungsgemeinschaft am Phänomen der Präpositionaladverbialen erhöht außerdem die Sichtbarkeit und Nutzung der Datenbank.
- Universität Graz - 100%
- Adrian Chircu, Babes-Bolyai University - Rumänien
- Adam Ledgeway, University of Cambridge - Vereinigtes Königreich
Research Output
- 6 Zitationen
- 8 Publikationen
- 1 Methoden & Materialien
- 2 Datasets & Models
- 2 Wissenschaftliche Auszeichnungen
- 3 Weitere Förderungen
-
2018
Titel Baseline elaboration and echo-sounding at the adjective adverb interface DOI 10.1515/cog-2016-0033 Typ Journal Article Autor Hummel M Journal Cognitive Linguistics Seiten 407-452 Link Publikation -
2020
Titel ADVERBIALS WITH ADJECTIVAL BASIS IN BRAZILIAN PORTUGUESE AND THEIR FREQUENCY IN SPOKEN AND WRITTEN LANGUAGE DOI 10.24193/subbphilo.2020.4.12 Typ Journal Article Autor Gerhalter K Journal Studia Universitatis Babe?-Bolyai Philologia Seiten 189-208 Link Publikation -
2018
Titel Compilation and Annotation of Adjective-Adverb Interfaces in Romance. Towards a multilingual Open Access Corpus DOI 10.15366/chimera2018.5.2.009 Typ Journal Article Autor Gerhalter K Journal CHIMERA: Romance Corpora and Linguistic Studies Seiten 305-311 Link Publikation -
2018
Titel Semantic Annotation in the Project "Open Access Database "Adjective-Adverb Interfaces' in Romance" Typ Conference Proceeding Abstract Autor Pollin C Konferenz Workshop on Annotation in Digital Humanities, CEUR Workshop Proceedings Seiten 41-46 Link Publikation -
2020
Titel An Annotated Corpus of Adjective-Adverb Interfaces in Romance Languages Typ Conference Proceeding Abstract Autor Gerhalter K Konferenz 12th Language Resources and Evaluation Conference (LREC 2020, Marseille) Seiten 946-950 Link Publikation -
2020
Titel Annotation Model: Criteria for Linguistic Categorization in the Database "Adjective-Adverb Interfaces in Romance" Typ Other Autor Gerhalter K Seiten 1-23 Link Publikation -
2021
Titel Annotation Model: Criteria for Linguistic Categorization in the Database "Adjective-Adverb Interfaces in Romance" DOI 10.5281/zenodo.4030345 Typ Other Autor Gerhalter K Link Publikation -
2017
Titel La structure “verbe?+?adjectif” DOI 10.1075/rro.16021.hum Typ Journal Article Autor Hummel M Journal Revue Romane Seiten 261-296 Link Publikation
-
2020
Titel Keynote Talk at the international conference "The problem of the adverb" Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2018
Titel Poster Award at the DHA2018 Conference Typ Poster/abstract prize Bekanntheitsgrad National (any country)
-
2020
Titel "Spring School LiSeH 2020 "Linked Data and the Semantic Web for Humanities research" CLARIAH-AT Funding Call 2020 (participation of project members Gerlinde Schneider and Christopher Pollin) Typ Research grant (including intramural programme) Förderbeginn 2020 -
2019
Titel Training Digital Scholars: Knowledge Exchange between V4 and Austria Visegrad Grant, Project ID #21820079 (Project Lead: Gabor Palko, ELTE Budapest), participant at the University of Graz: project member Gerlinde Schneider Typ Travel/small personal Förderbeginn 2019 -
2018
Titel Erasmus+ Staff Mobility for Training (participation of project members Christopher Pollin and Gerlinde Schneider at the "Summer School in Digital Humanities and IT", Borovets, Bulgaria, August 2018) Typ Travel/small personal Förderbeginn 2018