Projektdetail

Grant-DOI 10.55776/ORD66
Förderprogramm Open Research Data
Status beendet
Projektbeginn 15.09.2017
Projektende 14.10.2020
Bewilligungssumme 159.245 €
Projekt-Website

Wissenschaftsdisziplinen

Andere Geisteswissenschaften (40%); Sprach- und Literaturwissenschaften (60%)

Keywords

Corpus Linguistics, Longterm Preservation, Interactive Research Infrastructures, Adjective and adverb, Romance languages

Abstract

Endbericht

Das Projekt Open Access Database Adjective-Adverb Interfaces in Romance soll von der Grazer Forschungsgruppe The Interfaces of Adjective and Adverb in Romance durchgeführt werden. Die Forschungsgruppe hat seit 2002 rund 40 Artikel und Bücher zu diesem Thema publiziert. Diese Publikationen waren streng korpusbasiert, wobei drei der Korpora schon über ein Suchinterface open access verfügbar sind, das erste seit 2005. Insofern steht das Projekt in einer Tradition korpusbasierter Linguistik, die von Anfang an darauf abgezielt hat, das wissenschaftliche Prinzip der Nachvollziehbarkeit der Analysen durch die scientific community konsequent zu gewährleisten. Hierfür ist der freie Zugang zu allen Daten unabdingbar. Durch Kooperation mit dem Zentrum für Informationsmodellierung (Austrian Centre for Digital Humanities, ZIM-ACDH) in Graz kann nun ein großer qualitativer Schritt nach vorne gemacht werden, insofern als das Taggen der Daten nach aktuellem Stand der linguistischen (verantwortlich: Martin Hummel) und informationstechnischen Forschung (verantwortlich: Johannes Stigler) aktualisiert bzw. neu erfolgen kann. Zu diesem Zweck wurden zwei Pilotkorpora im Rahmen einer Kooperation von Romanistik und ZIM-ACDH nach dem aktuellen Stand der wissenschaftlichen Fragestellungen getaggt und für erste Publikationen verwendet. Im Rahmen des Projekts soll zudem der offene Zugang zu den dahinterliegenden Forschungsdaten in XML/TEI P5 realisiert und Austauschformate nach Empfehlung des CLARIN ERIC angeboten werden, um optimale Nachnutzbarkeit durch die scientific community zu gewährleisten. Diese Prinzipien werden im Rahmen des Projekts auf mehrere, großenteils schon erstellte Datenbanken angewendet, wobei internationale Partner wie Adam Ledgeway (Cambridge) und Adrian Chircu (Cluj- Napoca) Daten zu Dialekten Italiens und zum Altrumänischen betragen werden. Auf diese Weise kann eine gemeinsame Plattform für Datenbanken erstellt werden, die nach Abschluss des Projekts große Teile der Romania abdeckt und in längerer Perspektive auf eine immer dichtere Abdeckung abzielt. Damit erhält die traditionelle Methodologie der historisch-vergleichenden Linguistik eine moderne Datengrundlage, die von der Forschungsgruppe in der Zukunft genutzt werden wird, etwa im Bereich der Nachwuchsförderung (bereits geplant: eine Habilitation, eine Dissertation), und möglichst auch von anderen LinguistInnen.

Das Projekt "Open-Access Database: Adjective-Adverb Interfaces in Romance" (2017-2020) war ein Kooperationsprojekt zwischen dem Institut für Romanistik (https://romanistik.uni-graz.at) und dem Zentrum für Informationsmodellierung (https://informationsmodellierung.uni-graz.at). Im Zuge des Projekts wurde das frei zugängige sprachwissenschaftliche Korpus "Open-Access Database: Adjective-Adverb Interfaces in Romance" (http://gams.uni-graz.at/context:aaif) erstellt, das mehrere Datensätze zusammenführt und neue Datensätze ergänzt, die mit gemeinsamen Tools analysiert werden können. Insgesamt wurden über 35.000 historische und aktuelle Belegstellen zu Adjektiven in adverbialen Funktionen in mehreren Sprachen (Französisch, Spanisch, Portugiesisch, süditalienische Varietäten, Rumänisch und Latein) systematisch ausgezeichnet. Dazu zählen Adjektivadverbien wie beispielsweise Fr. voler haut 'hoch fliegen' oder aller droit 'geradeaus gehen' und andere adverbiale Elementen wie Präpositionalphrasen des Typs Pt. de novo 'noch einmal' oder Sp. a ciegas 'blindlings'. Im Zuge des Projekts wurde ein Annotationsmodell weiterentwickelt, welches Kategorien wie Wortbildung, grammatikalische Verwendung und Bedeutungen umfasst. Für jede einzelne Belegstelle wurden sieben Kategorien sowie das Lemma des jeweiligen Adverbs händisch annotiert. Das fertige Korpus kann in einer Suchmaske durchsucht werden. Durch die Lemmatisierung werden unterschiedlichste Varianten innerhalb einer Sprache abgedeckt und können gleichzeitig durchsucht werden. Die Suchanfrage nach den annotierten Kategorien erlaubt eine sprachübergreifende Suche, z.B. nach bestimmten formalen Eigenschaften oder nach Bedeutungen. Für die sprachübergreifende Ausrichtung des Korpus kooperierte das Projekt mit internationalen Projektpartnern, speziell für süditalienische Varietäten, Portugiesisch, Rumänisch und Latein. Außerdem wurden drei bereits bestehende Datensätze des Französischen und Spanischen aktualisiert und an die neuen Annotationen angepasst. Jedes dieser einzelnen Korpora basiert auf dem gleichen Annotationsmodell, das somit sprachübergreifend anwendbar ist. In der Suchmaske kann entweder innerhalb eines Korpus oder in mehreren Korpora gleichzeitig nach Belegstellen gesucht werden. Die so zur Verfügung gestellten Forschungsdaten sind im Geisteswissenschaftlichen Asset Management System (GAMS) im Sinne der Langzeitarchivierung digitaler Ressourcen gesichert. So sind einzelne Subkorpora frei verfügbar und können inkl. der Annotationen in wiederverwendbaren Formaten (XML/TEI, XML/RDF oder Excel) heruntergeladen werden. Das Annotationsmodell ist als Ontologie des Web of Data formalisiert. Es erlaubt in Zukunft, die hoch strukturierten Daten mit anderen Datenquellen zu vernetzen und stellt die konzeptuelle Grundlage zur technischen Umsetzung der Suchmaske. Die Homepage der Datenbank enthält eine genaue und transparente Beschreibung der Metadaten und der Datenquellen, sowie des Annotationstools. Außerdem umfasst die Beschreibung der einzelnen Korpora eine Liste der darin enthaltenen Adverbien, nämlich eine Liste der Lemmata und der Anzahl der dazu registrierten Belege. Da die Datenbank offen ist für neue Datensätze/Unterkorpora, kann sie in Zukunft erweitert werden. Dazu wird das Annotationstool frei zur Verfügung gestellt. Dank der sprachübergreifenden Konzeption der Datenbank erlaubt dieses Tool weitere Forschungsarbeiten im Rahmen des Langzeit-Forschungsschwerpunkts "Adjektiv-Adverb Schnittstellen in romanischen Sprachen". Mehrere Publikationen basieren bereits auf den gewinnbringenden Daten. Das zunehmende Interesse der internationalen Forschungsgemeinschaft am Phänomen der Präpositionaladverbialen erhöht außerdem die Sichtbarkeit und Nutzung der Datenbank.

Forschungsstätte(n)

Universität Graz - 100%

Internationale Projektbeteiligte

Adrian Chircu, Babes-Bolyai University - Rumänien
Adam Ledgeway, University of Cambridge - Vereinigtes Königreich

Research Output

6 Zitationen
8 Publikationen
1 Methoden & Materialien
2 Datasets & Models
2 Wissenschaftliche Auszeichnungen
3 Weitere Förderungen

Publikationen

Titel	Baseline elaboration and echo-sounding at the adjective adverb interface
DOI	10.1515/cog-2016-0033
Typ	Journal Article
Autor	Hummel M
Journal	Cognitive Linguistics
Seiten	407-452
Link	Publikation

Titel	ADVERBIALS WITH ADJECTIVAL BASIS IN BRAZILIAN PORTUGUESE AND THEIR FREQUENCY IN SPOKEN AND WRITTEN LANGUAGE
DOI	10.24193/subbphilo.2020.4.12
Typ	Journal Article
Autor	Gerhalter K
Journal	Studia Universitatis Babe?-Bolyai Philologia
Seiten	189-208
Link	Publikation

Titel	Compilation and Annotation of Adjective-Adverb Interfaces in Romance. Towards a multilingual Open Access Corpus
DOI	10.15366/chimera2018.5.2.009
Typ	Journal Article
Autor	Gerhalter K
Journal	CHIMERA: Romance Corpora and Linguistic Studies
Seiten	305-311
Link	Publikation

Titel	Semantic Annotation in the Project "Open Access Database "Adjective-Adverb Interfaces' in Romance"
Typ	Conference Proceeding Abstract
Autor	Pollin C
Konferenz	Workshop on Annotation in Digital Humanities, CEUR Workshop Proceedings
Seiten	41-46
Link	Publikation

Titel	An Annotated Corpus of Adjective-Adverb Interfaces in Romance Languages
Typ	Conference Proceeding Abstract
Autor	Gerhalter K
Konferenz	12th Language Resources and Evaluation Conference (LREC 2020, Marseille)
Seiten	946-950
Link	Publikation

Titel	Annotation Model: Criteria for Linguistic Categorization in the Database "Adjective-Adverb Interfaces in Romance"
Typ	Other
Autor	Gerhalter K
Seiten	1-23
Link	Publikation

Titel	Annotation Model: Criteria for Linguistic Categorization in the Database "Adjective-Adverb Interfaces in Romance"
DOI	10.5281/zenodo.4030345
Typ	Other
Autor	Gerhalter K
Link	Publikation

Titel	La structure “verbe?+?adjectif”
DOI	10.1075/rro.16021.hum
Typ	Journal Article
Autor	Hummel M
Journal	Revue Romane
Seiten	261-296
Link	Publikation

Methoden & Materialien

Öffentlich zugänglich
Titel	Open Access Database
Typ	Improvements to research infrastructure
Link	Link

Datasets & Models

Öffentlich zugänglich
Titel	Open Access Data Base "Adjective-adverb interfaces in Romance" (update 2021)
Typ	Database/Collection of data
Link	Link

Öffentlich zugänglich
Titel	Adjective-Adverb Interfaces in Romance - Open-Access Database
Typ	Database/Collection of data
Link	Link

Wissenschaftliche Auszeichnungen

Titel	Keynote Talk at the international conference "The problem of the adverb"
Typ	Personally asked as a key note speaker to a conference
Bekanntheitsgrad	Continental/International

Titel	Poster Award at the DHA2018 Conference
Typ	Poster/abstract prize
Bekanntheitsgrad	National (any country)

Weitere Förderungen

Titel	"Spring School LiSeH 2020 "Linked Data and the Semantic Web for Humanities research" CLARIAH-AT Funding Call 2020 (participation of project members Gerlinde Schneider and Christopher Pollin)
Typ	Research grant (including intramural programme)
Förderbeginn	2020

Titel	Training Digital Scholars: Knowledge Exchange between V4 and Austria Visegrad Grant, Project ID #21820079 (Project Lead: Gabor Palko, ELTE Budapest), participant at the University of Graz: project member Gerlinde Schneider
Typ	Travel/small personal
Förderbeginn	2019

Titel	Erasmus+ Staff Mobility for Training (participation of project members Christopher Pollin and Gerlinde Schneider at the "Summer School in Digital Humanities and IT", Borovets, Bulgaria, August 2018)
Typ	Travel/small personal
Förderbeginn	2018

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

OA Datenbank "Adjective-Adverb Interfaces in Romance"

OA Database "Adjective-Adverb Interfaces in Romance"

Wissenschaftsdisziplinen

Keywords

Research Output

Kontakt

Allgemeines

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

SOCIAL MEDIA

SCILOG

OA Datenbank "Adjective-Adverb Interfaces in Romance"

OA Database "Adjective-Adverb Interfaces in Romance"

Wissenschaftsdisziplinen

Keywords

Research Output