FAIRness für Life Science Daten in Österreich
FAIRness for Life Science Data in Austria
Wissenschaftsdisziplinen
Informatik (40%); Medizinisch-theoretische Wissenschaften, Pharmazie (60%)
Keywords
-
FAIR principles,
Life Science,
Open Data,
Transmembrane Transporter
Gerhard F. Ecker, Pharmacoinformatics Research Group, Dept. für Pharmazeutische Chemie, Universität Wien: gerhard.f.ecker@univie.ac.at; http://pharminfo.univie.ac.at Zusammenfassung Das Management sowie die Integration und Wiederverwendung von Forschungsdaten ist zentral für Innovation und Generierung von neuem Wissen. Obwohl zahlreiche Datenbanken wie z.B. ChEMBL, PubChem, UniProt, und die Protein Data Bank öffentlich verfügbar sind, enden die meisten mit öffentlichen Fördergeldern generierten Daten als pdf-Files im Supplement von Publikationen. Im Idealfall werden sie auch in universitären Repositories wie PHAIDRA oder auf der Website der Wissenschafter plaziert. Obwohl im Prinzip öffentlich, sind die Daten hier relativ verborgen und nicht zugänglich für automatische Abfragen. Um die Forderung nach Open Data zu forcieren, wurden kürzlich die FAIR Prinzipien vorgestellt: Findable, Accessible, Interoperabel, Reusable (auffindbar, verfügbar, integrierbar, wiederverwendbar). Diese 4 Grundprinzipien sollen als Grundlage dienen für Datenproduzenten und Verlage, um Tranparenz, Reproduzierbarkeit, und Wiederverwendbarkeit von Daten, Methoden, Algorithmen und Workflows zu garantieren. Im Rahmen dieses Projektes planen wir eine Pilotstudie für die Daten aus zwei Multipartner- Projekten im Bereich der Lebenswissenschaften mit dem Ziel, diese über PHAIDRA, dem Datendepository der Universität Wien, öffentlich zur Verfügung zu stellen. Hierbei handelt es sich um den SFB35 Transmembrantransporter in Gesundheit und Krankheit, und um MolTag Molekulare Drug Targets. Zur Erreichung dieses Zieles werden wir das Metadaten-Schema für PHAIDRA so adaptieren, dass die Daten möglichst gut den FAIR-Prinzipien folgen. Wir planen insbesondere: -) die Entwicklung von Standards zur Charakterisierung von Forschungsdaten aus den Lebenswissenschaften, um sie nach den FAIR Prinzipien zu kategorisieren -) die Entwicklung von Upload-Tools in PHAIDRA für Forschungsdatenaus den Lebenswissenschaften -) Implementierung von Mechanismen zur Sicherung der Datenqualität über Crowd Curation. Als Fernziel soll dieses Projekt Tools und Standards entwickeln, die es Wissenschaftern aus den Lebenswissenschaften ermöglichen, ihre Daten der wissenschaftlichen Community zur Verfügung zu stellen. Die Tools sollen es erlauben, die Daten so zu transformieren, dass sie den FAIR Prinzipien folgen und damit die Möglichkeit eröffnen, diese mit Large Scale integrierten Datenplattformen wie die Open PHACTS Discovery Platform zu verlinken.
Im Rahmen dieses Projekts haben wir ein Tool entwickelt, das es erlaubt, Datensätze aus dem Bereich der Lebenswissenschaften zu FAIRifizieren und sie über PHAIDRA, dem Forschungsdatenrepository der Universität Wien, verfügbar zu machen. Um dies zu ermöglichen habe wir das Metadaten Schema in PHAIDRA adaptiert, um Forschungsdaten FAIR (findable, accessible, integrateable, reusable) machen zu können. Auch wenn die Rohdaten selbst nicht vollständig FAIRifiziert werden können, so sind es zumindest die entsprechenden Metadaten. Zur Umsetzung dieses Open Research Data Pilots haben wir -) ein Set von standards entwickelt, die es erlauben, Life Science Daten gemäß den FAIR Prinzipien zu charakterisieren. Diese Charakterisierung ist Teil der Metadaten, die das digitale Objekt in PHAIDRA beschreiben -) ein Web-Interface entwickelt, das es erlaubt die Daten zu annotieren und in PHAIDRA archivieren, mit einem besonderen Fokus auf standardisierte Ontologien wie z.B. die Bioassay Ontology Das im Rahmen dieses Open Research Data Pilots entwickelte Tool erlaubt Wissenschafter*innen aus den Lebenswissenschaften, ihre Forschungsdaten standardisiert und FAIR der wissenschaftlichen Community zur Verfügung zu stellen. Dies erlaubt, dass die Forschungsdaten die in PHAIDRA archiviert werden den FAIR Prinzipien folgen und damit einfacher als bisher mit anderen Datenplattformen verknüpft werden können.
- Universität Wien - 100%
Research Output
- 1 Datasets & Models
- 1 Software
- 1 Wissenschaftliche Auszeichnungen
-
2019
Titel Talk at 14th International Conference on Open Repositories Typ Personally asked as a key note speaker to a conference DOI 10.5281/zenodo.3554174 Bekanntheitsgrad Continental/International