39. Diversity Workbench Workshop am IT-Zentrum der SNSB#
Thema: Einführung in DiversityDescriptions (DWB-DD); Schwerpunkt: Management von Merkmals- und Messdaten, Importe, Exporte, DWB-DD als Teil des GFBio Netzwerkes
Es wird das Management von wissenschaftlichen Daten im Bereich Bio- und Geodiversitätsforschung ohne direkten Sammlungsbezug behandelt. Dies betrifft Mess- und Merkmalsdaten, wie sie in ökologischen Projekten mit Prozessen im Labor anfallen, inklusive dem Management von strukturierten Beschreibungsdaten. Dabei werden Fragen der Interoperabiliät, des Datenaustauschs und der Standardisierung behandelt, besonders mit Bezug zur German Federation for Biological Data (GFBio). Die Teilnehmer werden angeleitet, mit der DWB-Applikation DiversityDescriptions in einer Trainingsdatenbank selbständig zu arbeiten. Verschiedene Vorträge und Demos verdeutlichen den vielfältigen und flexiblen Einsatz der Software.
An der Vorbereitung und Durchführung des Workshops beteiligtes Team
- aus München: Dagmar Triebel, Ariane Grunz, Eva Haiduk, Anton Link, Dieter Neubacher, Wolfgang Reichert, Stefan Seifert, Tanja Weibulat, Markus Weiss
- aus Bayreuth, Universität Bayreuth: Janno Harjes, Gerhard Rambold
- aus Göttingen, GWDG: Sven Bingert
- aus Stuttgart, Staatliches Museum für Naturkunde: Ingo Wendt
Der Workshop wird in Kooperation mit der German Federation for Biological Data (GFBio) veranstaltet.
Organisatorisches und Technisches#
- DWB Workshop: Beginn: 26. Oktober 2020, 11.00 Uhr, Ende: 27. Oktober 2020, 13.00 Uhr
- Dieser DWB Workshop wird an zwei aufeinanderfolgenden Tagen remote via ZOOM Konferenzsystem stattfinden. Alle Teilnehmer sollten sich bis zum 25. Oktober per email an Tanja Weibulat angemeldet haben und bekommen dann die ZOOM-Einladung kurz vor dem Meeting per email zugesandt.
- Es wird Vorträge und chat-Diskussionen, Live-Demos, Zeitfenster mit allgemeiner Diskussion und zwei Zeitfenster zum selbständigem Arbeiten in DiversityDescriptions (DWB-DD) geben.
- Wir unterscheiden dabei zwischen Teilnehmern, die das Modul DiversityDescriptions und seine Möglichkeiten nur kennenlernen wollen, und solchen, die auch an den praktischen Übungen teilnehmen und gemeinsam in DWB-DD arbeiten wollen. Aufgrund des Betreuungsaufwands beschränken wir den Übungsteil auf 20 angemeldete Personen. Der Übungsteil findet in den beiden Zeitfenstern "Selbständiges Arbeiten mit DWB-DD unter Anleitung" statt. Bitte vermerken Sie ihren Wunsch zur Teilnahme an diesem praktischen Teil bei der Anmeldung über Tanja Weibulat.
- Falls Sie mitarbeiten wollen, verwenden Sie Ihren eigenen LapTop oder PC:
- Betriebssystem ab MS Windows 7; .Net Framework 4.8 bitte vorab installieren! Mit dem aktuellsten MS Windows Update sollte .NET 4.8 bereits mitinstalliert sein.
- Falls Sie mitarbeiten wollen, unterstützen wir Sie bei der Installation von DWB-DD Clients: 23. Oktober 2020, 11.00 Uhr bis 15.00 Uhr
- Personen, die während des Workshops selbständig oder unter Anleitung mit DiversityDescriptions arbeiten möchten, wird dabei über ein Remote-HelpDesk (Anton Link, Tanja Weibulat) der Zugriff auf jeweils eine eigene DiversityDescriptions_Workshop Datenbank in der DWB Trainingsumgebung eingerichtet.
- Im Workshop verwendete DiversityDescriptions (DWB-DD) Client-Applikation
- DiversityDescriptions 4.3.0
- DWB-DD Benutzerhandbuch, Oktober 2020 als pdf (generiert aus CHM files)
- Trainingsdateien für Datenimporte in DiversityDescriptions stehen hier zum Download (zip-Datei) bereit.
Arbeitsprogramm#
26. Oktober 2020
- 11.00 Uhr Vortrag: Diversity Workbench – Einführung (D. Triebel)
- 11.15 Uhr Vortrag: DELTA, Konzept des RDMS DWB-DD und Einsatz in der universitären Lehre (Beispiel Biosystem Pflanzengallen) (J. Harjes, G. Rambold)
- 11.30 Uhr Live-Demo: Überblick über Grundfunktionen von DWB-DD, Beispiel Bayernflora-Heilpflanzen-Quiz u.a. (A. Link); siehe auch Introduction to DiversityDescriptions
- 12.15 Uhr Live-Demo: DWB-DD als RDMS für ARAMOB morphologisch-anatomische Daten von Vogelspinnen, DWB-DD Exporte zur Generierung von html-Seiten, xper3 Anbindung (I. Wendt)
- 12.30 Uhr ZOOM-Gruppenbild
- 12.35 Uhr Mittagspause
- 13.30 Uhr Live-Demo: Überblick über weitere Funktionen von DWB-DD, Import von ökologischen Daten aus tabulator-separierten Tabellen, Beispiel aus BEF-china Projekt (A. Link)
- 13.45 Uhr Selbständiges Arbeiten mit DWB-DD unter Anleitung: Konzept der DWB Trainingsumgebung, Anlegen von DD-Projekten und Deskriptoren für morphologisch-anatomische Beschreibungen von Organismen (A. Link)
- 15.00 Uhr Vortrag: RDMS DWB-DD: Management von Forschungsdesign-Daten, Descriptor Trees und Messdaten (J. Harjes, G. Rambold)
- 15.15 Uhr Kaffeepause
- 15.45 Uhr Live-Demo: DWB-DD als RDMS für LIAS, Extended Query (E. Haiduk)
- 16.00 Uhr Vortrag: DiversityNaviKey – Progressive Web App und Live-Demo: erste prototypische Version mit Zugriff auf DWB-DD-Daten und DWB-DD PostgreSQL-Cache-Datenbanken (A. Grunz)
- 16.30 Uhr Diskussion
- 17.00 Uhr Ende
27. Oktober 2020
- 9.00 Uhr Selbständiges Arbeiten mit DiversityDescriptions (DWB-DD) unter Anleitung, Organisation von Beschreibungen, verschiedene Beispiele und Funktionen
- 10.00 Uhr Live-Demo: Überblick über weitere Funktionen von DWB-DD, z.B. Kontrolle der Datenqualität (Maintenance, Kuration von Massendaten), Export von DELTA-, SDD- und EML-konformen Daten und Erstellung von Business-Graphiken (A. Link)
- 10.30 Uhr Kaffeepause
- 11.00 Uhr Live-Demo: DiversityProjects (DWB-DP) zur Projektverwaltung von DWB-DD (M. Weiss); siehe auch Übersichtsvideo (wmv) sowie weitere Videos
- 11.15 Uhr Live-Demo: GFBio Daten-Pipeline I inkl. GFBio Submission und Einbindung von DiversityProjects (T. Weibulat, W. Reichert); zum Datenimport via GFBio siehe Video
- 11.30 Uhr Vortrag GFBio Daten-Pipeline II: Publikation der DWB-DD-Datenpakete (SDD und EML), SNSB Landingpages und DataCite und Live-Demo am Beispiel DSMZbacdivedesc: SNSB Landingpage, DataCite und GFBio Datenportal (S. Seifert, T. Weibulat)
- 11.45 Uhr Vortrag: Diversity Workbench als GFBio Service (S. Bingert)
- 12.00 Uhr Diskussion und Feedback
- 12.30 Uhr Ende
Teilnehmer | Institut | Fachgebiet |
---|---|---|
Christian Beilschmidt | Universität Marburg | Informatik, GFBio VAT Tool |
Thure Dalsgaard | Centrum für Naturkunde (CeNak), Universität Hamburg | Entomologie |
Christoph Dreiser | Nationalpark Schwarzwald | Umweltmonitoring und Geodatenmanagement |
Eva Haiduk | SNSB IT Center | LIAS, Lichenologie |
Janno Harjes | Universität Bayreuth | Mykologie, molekulare Ökologie |
Felix Hentschel | Mineralogische Staatssammlung München, SNSB | Mineralogie |
Robert Huber | Universität Bremen | Informatik, GFBio Data Harvesting |
Malte Junge | Mineralogische Staatssammlung München, SNSB | Mineralogie |
Melanie Kaliwoda | Mineralogische Staatssammlung München, SNSB | Mineralogie |
Henrik Kusche | Centrum für Naturkunde (CeNak), Universität Hamburg | Sammlungsmanagement, Digitalisierung |
Damaris Margaritis | Nationalpark Schwarzwald | Ökologisches Monitoring und Artenschutz |
Thomas Martin | Universität Bayreuth | Forschungsdatenmanagement |
Peter Michalik | Universität Greifswald | Zoologie |
Marco Mraulag | Universität Bayreuth | Pflanzensystematik Angiospermen |
Jens Nieschulze | Universität Göttingen | Biometrie, GFBio Outreach |
Carla Novoa Sepúlveda | Botanische Staatssammlung München, SNSB | Sammlungsmanagement Botanik und Mykologie |
Florian Raub | Staatliches Museum für Naturkunde Karlsruhe | Zoologie, Biodiversitätsinformatik |
Vanessa Roden | Staatliche Naturwissenschaftliche Sammlungen Bayerns | Sammlungsassessment, Paläontologie |
Gertrud Rößner | Bayerische Staatssammlung für Paläontologie und Geologie | Paläontologie (fossile Säugetiere) |
Aliaksandra Rost | Mineralogische Staatssammlung München, SNSB | Mineralogie |
Camila Uribe-Holguin | Ludwig-Maximilians-Universität München | Botanik |
Julia Wellsow | Botanische Staatssammlung München, SNSB und SNSB IT Center | Botanik, Flora von Bayern |
Ingo Wendt | Staatliches Museum für Naturkunde Stuttgart | Zoologie |
Open-Access Datenprojekte in DiversityDescriptions#
- LIAS mit LIASlight
Weitere Information#
Zugangsdaten zu den DWB Trainingsdatenbanken (nach dem Workshop)#
- IP-Adresse: training.diversityworkbench.de
- Port: 5432
- SQL-Server authentification
- User: WORKSHOP
- Password: available on request
Trainingsdateien für Datenimporte in DiversityDescriptions stehen
hier zum Download (zip-Datei) bereit.
Diversity Workbench Entwickler Plattform#
- DWB Support und training materials
- Diversity Workbench Information Models
- Diversity Workbench Software
- DiversityMobile App on Windows Phone Store
- Empfehlungen für Software-Entwickler
- DWB User Manuals with DWB Video Tutorials in German
Diversity Workbench – empfohlen von der DFG und GFBio#
DFG RISources mit Diversity Workbench – Text DE
GFBio recommended research data management mit DWB in 10 questions
Dienste des SNSB IT Center in seiner Rolle als GFBio Datenzentrum, GBIF Data Publisher und CETAF Data Provider#
- Archivierung and Publikation von Bio- und Geodiversitätsforschungsdaten, siehe Portfolios der GFBio Data Centers und Profile des Data Center SNSB
- GFBio Datentransfer von GFBio Research Data Submission Tool zum DWB-Datenmanagement und -archivierung am SNSB IT Center
- Datenpublikation, e.g., via DataCite, GFBio Datenportal und GFBio VAT Tool
- DWB BioCASe Data pipelines und RDF services mit Übersicht über Sammlungs- und Verbreitungsdaten bereitgestellt über SNSB und publiziert über diverse Datenportale
Virtuelle Forschungsumgebungen und DWB Netzwerke, Diversity Mobile#
- DiversityMobile – Smartphone App (WindowsPhone) als Teil einer Forschungsumgebung (IBF)
- Flora von Bayern
- aus DWB Daten dynamisch erzeugte Verbreitungskarten für in Bayern vorkommende Farn- und Blütenpflanzen
- DWB Datenfluss Grafiken (Version 2015)
- DiversityMobile im Einsatz
- DWB Tabellen-Editor für TK25 Rasterdaten und Bayernflora-Editor im Einsatz
- DiversityGISeditor im Einsatz
- DiversityTaxonNames im Einsatz
GBOL Data Transfer Applications#
Literaturempfehlung zum Thema DiversityDescriptions, DELTA, SDD, EAV#
GFBio relevant standards, protocols and formats mit SDD, DELTA, EML und MOD-CO
GFBio type 3 data mit SDD und EML
DELTA (taxonomy) data format mit DELTA – DEscription Language for TAxonomy, Intkey, NaviKey und Open DELTA
Coleman, C., Lowry, J. & Macfarlane, T. 2010. DELTA for Beginners. An introduction into the taxonomy software package DELTA. – ZooKeys 45: 1–75. https://doi.org/10.3897/zookeys.45.263. download
Dallwitz, M. J. 1980. A General System for Coding Taxonomic Descriptions. – Taxon 29 (1): 41–46. https://doi.org/10.2307/1219595. JSTOR 1219595. S2CID 85981894. download
Diederich, J. 1997. Basic properties for biological databases: Character development and support. 25(10): 109-127. https://doi.org/10.1016/S0895-7177(97)00078-2. download
Hagedorn, G. 2008/2007. Structuring descriptive data of organisms – Requirement analysis and information models. – Dissertation, Universität Bayreuth. – 1–417. download
Hagedorn, G., Thiele, K., Morris, R., Heidorn, P.B. 2005. Structured Descriptive Data (SDD) w3c-xml-schema, Version 1.0. Biodiversity Information Standards (TDWG) http://www.tdwg.org/standards/116 (version 1.1 available)
Harjes, J., Link, A., Weibulat, T., Triebel, D. & Rambold, G. 2020. FAIR digital objects in environmental and life sciences should comprise workflow operation design data and method information for repeatability of study setups and reproducibility of results, Database, 2020 (Article ID baaa059), 1–20. – https://doi.org/10.1093/database/baaa059
Rambold, G., Elix, J. A., Heindl-Tenhunen, B., Köhler, T., Nash III, T. H., Neubacher, D., Reichert, W., Zedda, L. & Triebel, D. 2014. LIAS light – Towards the ten thousand species milestone. – MycoKeys 8 : 11–16. doi: 10.3897/mycokeys.8.6605 download.
Rambold, G., Yilmaz, P., Harjes, J., Link, A., Glöckner, F.O. & Triebel, D. 2018. MOD-CO schema – a conceptual schema for processing sample data in meta’omics research (version 1.0). http://mod-co.net/wiki/MOD-CO_Schema_Reference.
Rambold, G., Yilmaz, P., Harjes, J., Klaster, S., Sanz, V., Link, A., Glöckner, F. O., Triebel, D. 2019. Meta-omics data and collection objects (MOD-CO): A conceptual schema and data model for processing sample data in meta-omics research. – Database, 2019 (Article ID baz002), 1–13. – https://doi.org/10.1093/database/baz002
Rambold, G., Zedda, L., Coyle, J., Peršoh, D., Köhler, T., Triebel, D. 2016. Geographic heat maps of lichen traits derived by combining LIAS light description and GBIF occurrence data, provided on a new platform. – Biodiversity and Conservation 25(13): 2743–2751. (doi:10.1007/s10531-016-1199-2).
Triebel, D., Neubacher, D., Weiss, M., Heindl-Tenhunen, B., Nash. T. H. III & Rambold, G. 2010. Integrated biodiversity data networks for lichenology – data flows and challenges. – In Nash, T.H. III, Geiser, L., McCune, B., Triebel, D., Tomescu, A.M.F. & Sanders, W.B. (eds.), Biology of lichens – symbiosis, ecology, environmental monitoring, systematics and cyber applications. – Biblioth. Lichenol. 105: 47–56.
xper Software Wiki mit xper3 Collaborative descriptive data platform und xper2 Desktop software
Entity attribute value model (EAV), called also "open schema"
Literaturempfehlung allgemein#
ARPHA Writing tool under https://arpha.pensoft.net/ and http://arphahub.com/; import of species descriptions via XML/API?
FAIR Principles Special Issue 2019
DiSSCo Knowledge Base Dokumente
Dallmeier-Tiessen, S., Khodiyar, V., Murphy, F., Nurnberger, A., Raymond, L. & Whyte, A. 2017. Connecting Data Publication to the Research Workflow: A Preliminary Analysis, International Journal of Digital Curation (IJDC), Vol 12, No 1, 2017, doi.org/10.2218/ijdc.v12i1.533
Diepenbroek, M., Glöckner, F., Grobe, P., Güntsch, A., Huber, R., König-Ries, B., Kostadinov, I., Nieschulze, J., Seeger, B.; Tolksdorf, R., & Triebel, D. 2014. Towards an Integrated Biodiversity and Ecological Research Data Management and Archiving Platform: The German Federation for the Curation of Biological Data (GFBio). – In: Plödereder, E., Grunske, L., Schneider, E. & Ull, D. (eds): Informatik 2014 – Big Data Komplexität meistern. GI-Edition: Lecture Notes in Informatics (LNI) – Proceedings 232: 1711-1724. Köllen Verlag, Bonn.
Gehring, P. 2018. Viele Fronten. Forschungsdatenmanagement als Ermöglichungspolitik. Forschung & Lehre 9/2018: 754-756. – https://www.forschung-und-lehre.de/viele-fronten-985/
GBIF News 2018. Adding-sequence-based-identifiers-to-backbone-taxonomy-reveals-dark-taxa-fungi. – https://www.gbif.org/news/2LrgV5t3ZuGeU2WIymSEuk/adding-sequence-based-identifiers-to-backbone-taxonomy-reveals-dark-taxa-fungi
Gramelsberger, G. & Müller, M. 2018. Datengetriebene Forschung. Ein Beitrag aus wissenschaftlicher Perspektive. Forschung & Lehre 9/2018: 758-760. – https://www.wissenschaftsmanagement-online.de/beitrag/datengetriebene-forschung-ein-beitrag-aus-wissenschaftsreflexiver-perspektive-9347
Hodson, J. et al. 2018. FAIR Data Action Plan. Interim recommendations and actions from the European Commission Expert Group on FAIR data. – https://doi.org/10.5281/zenodo.1285290
Hodson, J. et al. 2018. Turning FAIR data into reality. Interim report of the European Commission Expert Group on FAIR data. – https://doi.org/10.5281/zenodo.1285272
Mons, B., Neylon, C., Velterop, J., Dumontier, M., Bonino da Silva Santos, L. O. & Wilkinson, M. D. 2017. Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud. Information Services & Use 37(1): 49-56. DOI: 10.3233/ISU-170824, (download)
Sansone, S.-A., McQuilton, P., Rocca-Serra, P., Gonzalez-Beltran, A., Izzo, M., Lister, A. & Thurston, M. 2018. FAIRsharing: working with and for the community to describe and link data standards, repositories and policies. BioRxiv. doi.org/10.1101/245183> (preprint, not been peer-reviewed)
Triebel, D., Hagedorn, G. & Rambold, G. 2012. An appraisal of megascience platforms for biodiversity information. – MycoKeys 5: 45–63. – doi:10.3897/mycokeys.5.4302 download
Triebel, D., Reichert, W., Bosert, S., Feulner, M., Osieko Okach, D., Slimani, A. & Rambold, G. 2018. A generic workflow for effective sampling of environmental vouchers with UUID assignment and image processing. – Database, 2018 (Article ID bax096), 1–10. – https://doi.org/10.1093/database/bax096
White, E. P., Baldridge, E., Brym, Z. T., Locey, K. J., McGlinn, D. J., Supp, S. R. 2013. Nine simple ways to make it easier to (re)use your data. – Ideas Ecol. Evol. 6(2): 1-10. doi:10.4033/iee.2013.6b.6.f. download.
Wilkinson, M. D. et al. 2016. The FAIR Guiding Principles for scientific data management and stewardship. – Sci. Data 3:160018 doi: 10.1038/sdata.2016.18. – (https://www.nature.com/articles/sdata201618). download
Siehe auch 32. und 34. DWB Workshop hier. Beide Workshops behandelten Themen zu DWB-DD.