Archiv der Kategorie: IT

H5P und der Datenschutz

24. Oktober 2022ITDatenschutz, Drupal, H5P, moodle, WordpressOliver Tacke

Ich bekomme immer wieder mal Fragen zum Thema H5P und Datenschutz. An dieser Stelle versuche ich nun, alles zu sammeln, was mir dazu in den Sinn kommt. Dann kann ich bei erneuten Fragen einfach auf diesen Beitrag verweisen.

Ein paar Dinge muss allerdings vorab anmerken:

Ich bin kein Jurist und gebe hier keine rechtliche Beratung!
Ich betrachte hier den Fall, dass ihr H5P selbst betreibt. Wenn ihr Dienste Dritter in Anspruch nimmst, um H5P zu betreiben (H5P.com, Lumi, apps.zum.de, itslearning, die Plattform deiner Schule oder Uni, usw.), dann erkundigt euch bitte dort. Ich habe keine besonderen Einblicke in eventuelle Änderungen und weiß nicht, welche Daten dort wie und wo durch wen verarbeitet werden. Ich möchte die jeweiligen Datenschutzerklärungen auch nicht auswendig lernen.
Dinge können sich ändern, dann stimmen zukünftig hier getroffene Aussagen nicht mehr. Ich erhebe auch keinen Anspruch auf Vollständigkeit. Irgendwas ist mir bestimmt durch die Lappen gegangen.
Wenn ich hier von H5P spreche, meine ich die Software H5P, wie ihr sie selbst bei euch installieren könnt. Einige Leute werfen das gerne mit der Firma H5P Group (ehemals Joubel) oder der Seite h5p.org oder h5p.com in einen Topf. Tut das bitte nicht.

Allgemein

H5P kann (aktuell nur nahezu) vollständig selbst ohne Kommunikation zu anderen Servern betrieben. Die H5P-eigene Dokumentation findet sich auf https://h5p.org/plugin-gdpr-compliance.

Daten unter Hoheit externer Dienste

Einige Inhaltstypen nehmen unter Umständen externe Dienste in Anspruch, die nicht unter der Kontrolle von H5P stehen.

YouTube, Panopto, in Kürze auch Vimeo

H5P-Inhaltstypen, die Video-Inhalte anzeigen können, erlauben es neben dem lokalen Bereitstellen von Videos, diese auch bei Drittanbietern unterzubringen. Aktuell sind das YouTube, Panopto und in Kürze auch Vimeo.

Videos werden dann über die Server und Schnittstellen der Drittanbieter in H5P-Inhalte eingebunden. Tracking, Setzen von Cookies, etc. durch Drittanbieter ist demnach möglich, wenn deren Dienste verwendet werden. Konsultiert bitte die Datenschutzerklärung der Dienste. Personenbezogene Daten jenseits der IP-Adresse der nutzenden Person, die nach EuGH-Urteil und BGH-Urteil als personenbezogenes Datum gilt, werden dabei nicht aktiv von H5P weitergegeben.

Web Speech API

Die H5P-Inhaltstyp Speak the Words (und damit auch Speak the Words Set) nutzt die standardisierte “Web Speech API” des Browsers zum Erkennen von Sprache. Die Implementierung dieser API, das heißt das eigentliche Erkennen der Sprache, liegt beim Browser. Das macht nicht H5P.

Chrome greift hierfür auf Google Cloud Services zurück. Ich gehe davon aus, dass Apple für Safari (unterstützt die Web Speech API erst seit Safari 14) auf cloudbasierte “Siri-Infrastruktur” zurückgreift und Microsoft für Edge auf cloudbasierte “Cortana-Infrastruktur”. Opera unterstützt die “Web Speech API” meines Wissens nicht. Firefox hat eine experimentelle Unterstützung, die allerdings in einem nicht ganz einfach zugänglichen Menü erst freigeschaltet werden muss, und dann nach meinem Kenntnisstand ebenfalls Google Cloud Services nutzt.

Twitter

Es existiert noch ein wegen API-Änderung nicht mehr funktionaler Inhaltstyp für Twitter, der es erlaubte, Tweets anzuzeigen. Dabei geht mindestens die IP-Adresse der Nutzenden an Twitter. Da der Inhaltstyp aber gar nicht mehr funktioniert, sollten die Abhängigkeiten demnächst entfernt werden und verschwinden dann mit dem nächsten Release der betreffenden Inhaltstypen. Sie können aber problemlos auch herausgepatched werden. Außerdem kann man kann den „TwitterUserFeed“-Inhaltstyp auch in den Einstellungen des jeweiligen Plugins sperren. Es gibt dann noch einen Umweg, wie man ihn als Autor einbinden könnte, aber den verschweige ich hier ;-)

Google Fonts

Einige H5P-Komponenten nutzen aktuell noch auf Google-Servern gehostete Fonts. Das gilt nach Urteil des Landesgerichts München als datenschutzunfreundlich, weil dort – genau, wie überall im Web, die IP-Adresse übertragen wird. Die Abhängigkeiten sind kürzlich entfernt worden, die Fonts werden dann selbst gehosted. Eine Veröffentlichung der Änderungen steht jedoch noch aus. Patchen wäre vorab problemlos möglich.

H5P OER Hub

Man kann als Plattformbetreiber*in den H5P OER Hub freischalten. Da ist optional. Damit können zum einen direkt im Editor H5P-Inhalte Dritter aus einem Pool von Inhalten genutzt werden. Zum anderen kann man damit Inhalte von der Plattform auf dem H5P OER Hub teilen. Die Daten werden in der Cloud-Infrastruktur von Amazon in Irland gespeichert und verarbeitet. Details, die nicht im verlinkten Dokument zu finden sind, müssten bitte bei H5P Group erfragt werden.

Als Plattformbetreiber*in muss man die Plattform beim H5P OER Hub registrieren. Dabei fallen die folgenden, unter Umständen personenbezogenen Daten an:

IP-Adresse des Servers zur Kommunikation
zufällig generierter Key als eindeutige ID im H5P OER Hub
Bezeichnung des „Publishers“ (also bei natürlichen Personen der Name und damit ein personenbezogenes Datum)
E-Mail-Adresse des „Publishers“ (also ein personenbezogenes Datum, wenn es sich beispielsweise nicht um eine Funktionsadresse handelt)
Beschreibung des „Publishers“ (optional)
Klarname einer Kontaktperson (optional)
Adresse einer Kontaktperson (optional)
Telefonnummer einer Kontaktperson (optional)

Beim Teilen von Inhalten werden folgende, unter Umständen personenbezogenen Daten übertragen:

IP-Adresse des Servers zur Kommunikation
der bei Registrierung generierte Schlüssel als eindeutige ID im H5P OER Hub
alle im Inhaltstyp gespeicherten Daten: Befinden sich darin personenbezogene Daten, weil der/die Autor*in diese angegeben hat, etwa in den Metadaten, werden auch diese übertragen. Das sollte aber auch im Sinne der Autor*innen sein.
zusätzliche einzugebende Metadaten: Titel, Sprache, Lizenz, Disziplin, Beschreibung, Schlagworte, Beschreibung, Icon, Screenshots (also alles wohl nicht personenbezogen)

Daten unter Hoheit der H5P-Integration (aka Plugin)

H5P legt auf dem Server, auf dem es installiert wurde, gegebenenfalls Daten ab, die personenbezogen sein können und um die man sich als Betreiber des Servers gegebenenfalls kümmern muss. Dies betrifft im Wesentlichen drei Dinge:

Speichern von Ergebnissen

Falls das Speichern von Ergebnissen aktiviert ist und Nutzer*innen auf der Plattform angemeldet sind, auf der H5P läuft, und falls der verwendete Inhaltstyp Ergebnisse übermittelt, dann können auf eurer Plattform (nicht irgendwo anders) die erzielten Ergebnisse und einige weitere Daten mit Bezug zur eingeloggten Person gespeichert werden. Der Umfang der gespeicherten Daten kann sich je nach Plattform unterscheiden – siehe unten.

Speichern des Zustands

Falls das Speichern des Zustands von H5P-Inhalten aktiviert ist und Nutzer*innen auf der Plattform angemeldet sind, auf der H5P läuft, und falls der verwendete Inhaltstyp den aktuellen Zustand übermittelt, dann kann dieser mit Bezug zur eingeloggten Person auf eurer Plattform gespeichert werden (nicht irgendwo anders), damit die Person eine Aufgabe später dort fortsetzen kann, wo sie verlassen wurde. Entsprechend enthalten solche Zustände insbesondere Antworten, die von Nutzer*innen gegeben wurden. Das könnten beispielsweise die in einem Lückentext eingetragenen Texte sein.

Anonymisierte Statistiken

Bei den offiziellen H5P-Plugins besteht die Möglichkeit, anonymisierte Statistiken an das H5P-Kernteam (Norwegen) zu senden, um ihnen Erkenntnisse über die H5P-Nutzung zukommen zu lassen (vgl. https://h5p.org/tracking-the-usage-of-h5p). Diese Daten sind zwar nicht personenbezogen, aber sei es drum. Die Option ist standardmäßig deaktiviert, und wird erst nach Zustimmung zur Nutzung des H5P-Hubs aktiv. Sie kann danach in den Einstellungen des H5P-Plugins wieder deaktiviert werden, ohne die Nutzung des H5P-Hubs zu beeinträchtigen

Übertragen werden im Falle des Falles:

Seitentyp: Lokal, Netzwerk, Internet,
Version des Plugins,
Anzahl der Autor*innen von H5P-Inhalten,
Informationen zu den verwendeten Inhaltstypen: Version, Anzahl, Anzahl der Ladeversuche im Editor, Anzahl der Fassungen, Anzahl der Uploads von Inhalten, Anzahl des Löschens von Inhalten, Anzahl der Einblicke in die Ergebnisse, Anzahl des Nutzens von Shortcodes,
Datum und IP-Adresse des Servers (nicht die IP-Adresse der Nutzenden),
zufällig generierter Key für die Plattform

Des weiteren kommen innerhalb von H5P noch kleinere Dinge zum Tragen, die aus der Perspektive Datenschutz wohl eher unbedeutend sind:

UUID im LocalStorage

Sind Nutzer*innen von Inhaltstypen nicht auf der Plattform angemeldet, wird eine zufällig generierte ID im LocalStorage des Browsers abgelegt, um Personen ggf. für pseudonymisierte Statistiken mittels xAPI-Schnittstelle wiedererkennen zu können. Man weiß dann, dass eine bestimmte Person eine Aufgabe bearbeitet hat, aber nichts über die Person. Das Speichern lässt sich in den Einstellungen nicht unterbinden, kann aber herausgepatched werden (ggf. mit Pull Request, um die Änderung dauerhaft zu ermöglichen).

Wichtig ist hier zu wissen: H5P selbst nutzt diese ID nicht weiter. Sie kommt nur zum Tragen, wenn ihr selbst die xAPI-Schnittstelle nutzt, um detailliertere Informationen über die Nutzer*innen zu sammeln.

Erfassen von Ereignissen

H5P loggt einige administrative Ereignisse in der lokalen Datenbank mit, namentlich das Installieren und Aktualisieren von Bibliotheken sowie das Erstellen und Aktualisieren von Inhalten, betrifft also Admins und Autor*innen, nicht aber Lernende (Nutzer-ID, Zeitpunkt des Ereignisses, Ereignistyp, Art der Änderung, ggf. ID des Inhalts, ggf. Titel des Inhalts, Name der H5P-Bibliothek, Version der H5P-Bibliothek).

Die Einträge werden nach 30 Tagen automatisch gelöscht. Das Erfassen von Ereignissen lässt sich meines Wissens standardmäßig nicht deaktivieren, kann aber herausgepatched werden (ggf. mit Pull Request, um die Änderung dauerhaft zu ermöglichen).

Einstellungen im LocalStorage

Vereinzelt speichert H5P Vorlieben von Nutzer*innen im LocalStorage des Browsers, z. B. die bevorzugte Videoqualität als String oder ob der Tutorial-Wizard von H5P.InteractiveVideo bereits gesehen wurde als boolesche Werte.

H5P-Inhalte im LocalStorage

Autor*innen können H5P-Inhalte kopieren und an anderer Stelle wieder einfügen. Das Kopieren läuft über den LocalStorage des eigenen Browsers, betrifft aber keine personenbezogenen Daten – es sei denn, ein Autor/eine Autorin hat Informationen über sich angegeben, etwa in den Metadaten. Sollte der Browser also von mehreren Personen genutzt werden …

Cookies

H5P selbst setzt meines Wissens keinerlei Cookies im Browser.

H5P-Plugin für WordPress

Das H5P-Plugin für WordPress unterstützt die von WordPress eingeführte “DSGVO-Schnittstelle”, über die Datenschutzanfragen abgewickelt werden können (Daten herausgeben, Daten exportieren, Daten löschen).

Speichern von Ergebnissen

Ist das Speichern von Ergebnissen aktiviert (Menü Einstellungen -> H5P -> Benutzer-Ergebnisse: Ergebnisse für angemeldete Benutzer protokollieren), und ist ein/e Nutzer*in in WordPress angemeldet, und unterstützt ein H5P-Inhaltstyp diese Funktion, dann werden typischerweise beim Anwählen des “Überprüfen”-Buttons, bei einigen Inhaltstypen wie Interactive Video oder Interactive Book auch erst beim Anwählen eines “Einsenden”-Buttons, Ergebnisse an die Plattform gesendet. Diese werden in der Datenbank gespeichert und umfassen:

WordPress-Nutzer-ID: Numerischer Wert, der dem/der angemeldeten Nutzer*in von WordPress zugewiesen wurde und über den die Ergebnisse einer Person zugeordnet werden können
ID des H5P-Inhalts: Numerischer Wert, der die Verbindung zum absolvierten H5P-Inhalt herstellt
Punktzahl: Numerischer Wert, der die erreichte Punktzahl festhält
Maximal mögliche Punktzahl: Numerischer Wert, der die maximal erreichbare Punktzahl festhält
Zeitpunkt des Startens des H5P-Inhalts: Numerischer Wert (Zeitstempel), der festhält, wann die Person den H5P-Inhalt aufgerufen hat.
Zeitpunkt des Absolvierens des H5P-Inhalts: Numerischer Wert (Zeitstempel), der festhält, wann das Ergebnis übertragen wurde.
benötigte Zeit: Numerischer Wert, der angibt, wie lange die Bearbeitung der Aufgabe in Sekunden dauerte.

Die H5P-Integration für WordPress legt keine Historie an. Wiederholt ein/e Nutzer*in eine Aufgabe und übersendet dadurch ein weiteres Ergebnis, werden dadurch bestehende Einträge in der Datenbank überschrieben.

Einsicht in diese Daten haben:

Personen, die über Zugriff auf die entsprechenden Datenbanktabellen verfügen (ggf. auch über weitere Plugins, die Zugriff auf die H5P-Daten ermöglichen)
Nutzer*innen der WordPress-Plattform, die das Recht zum Bearbeiten des absolvierten Inhalts haben (WordPress-Capability edit_h5p_contents für eigens erstellte H5P-Inhalte bzw. edit_others_h5p_contents für von anderen erstellte H5P-Inhalte). Diese Nutzer*innen können sich zu einem bestimmten H5P-Inhalt eine Übersicht aller für diesen Inhalt übersandten Ergebnisse anzeigen lassen und sehen somit jeweils:
- Nutzernamen der Person
- Erreichte Punktzahl
- Maximal mögliche Punktzahl
- Datum und Uhrzeit des Öffnens des Inhalts
- Datum und Uhrzeit des Übersenden der Ergebnisse
- Benötigt Zeit als Timecode.
Nutzer*innen der WordPress-Plattform, die das Recht haben, ihre eigenen Ergebnisse einzusehen (WordPress-Capability view_h5p_results). Diese Nutzer*innen können sich im H5P-Menü (H5P-Inhalt -> Meine Ergebnisse) eine Übersicht über alle von ihnen übersandten Ergebnisse anzeigen lassen und sehen somit jeweils:
- Titel des H5P-Inhalts
- Erreichte Punktzahl
- Maximal mögliche Punktzahl
- Datum und Uhrzeit des Öffnens des Inhalts
- Datum und Uhrzeit des Übersenden der Ergebnisse
- Benötigt Zeit als Timecode.

Speichern des Zustands

Ist das Speichern von Ergebnissen aktiviert (Menü Einstellungen -> H5P -> Inhalt statisch speichern: Angemeldeten Benutzern erlauben, Aufgaben wieder aufzunehmen), und ist ein/e Nutzer*in in WordPress angemeldet, und unterstützt ein H5P-Inhaltstyp diese Funktion, dann wird zu definierten Ereignissen der aktuelle Zustand des H5P-Inhalts abgerufen und in der Datenbank der Plattform gespeichert.

Einsicht in diese Daten haben:

Personen, die über Zugriff auf die entsprechenden Datenbanktabellen verfügen (ggf. auch über weitere Plugins, die Zugriff auf die H5P-Daten ermöglichen)
Nutzer*innen der WordPress-Plattform, wenn sie auf der Plattform angemeldet sind und einen von ihnen zuvor bearbeiteten H5P-Inhalt wieder aufrufen

Anonymisierte Statistiken

Das Versenden anonymisierter Statistiken kann jederzeit deaktiviert werden, ist wegen des Fehlens eines Personenbezugs aber datenschutzrechtlich wohl eher unbedenklich.

Offizielles H5P-Plugin für moodle

Das H5P-Plugin für moodle unterstützt dessen entsprechende Mechaniken.

Speichern von Ergebnissen

Ist ein/e Nutzer*in in moodle angemeldet, und unterstützt ein H5P-Inhaltstyp diese Funktion, dann werden typischerweise beim Anwählen des “Überprüfen”-Buttons, bei einigen Inhaltstypen wie Interactive Video oder Interactive Book auch erst beim Anwählen eines “Einsenden”-Buttons, Ergebnisse an die Plattform gesendet. Diese werden in der Datenbank gespeichert und umfassen:

User-ID: Numerischer Wert, der dem/der angemeldeten Nutzer*in von moodle zugewiesen wurde und über den die Ergebnisse einer Person zugeordnet werden können
ID des H5P-Inhalts: Numerischer Wert, der die Verbindung zum absolvierten H5P-Inhalt herstellt
Eltern-ID des H5P-Inhalts: H5P-Inhalte können Unterinhalte umfassen, z. B. können im H5P-Inhaltstyp Column mehrere andere H5P-Unterinhalte gebündelt werden. Die Eltern-ID entspräche im Beispiel der ID des Column-Inhalts.
Interaktionstyp: Speichert den xAPI-Typ der Interaktion, um das passende Schema für das Reporting auszuwählen: true-false, choice, fill-in, long-fill-in, matching, performance, sequencing, likert, numeric, other
Beschreibung: Typischerweise die Aufgabenbeschreibung einer H5P-Aufgabe oder deren Bezeichnung
Erwartete Antworten: Bei einigen H5P-Inhaltstypen ist es möglich, ein Schema für eine richtige Antwort anzugeben, etwa die erwarteten Texte für Lücken eines Lückentextes oder die Indizes der richtigen Antwortmöglichkeiten eines Multiple-Choice-Quiz.
Tatsächliche Antworten: Die von dem/der Nutzer*in gegebenen Antworten, etwa die in einen Lückentext eingetragenen Texte oder die Indizes der ausgewählten Antwortmöglichkeiten eines Multiple-Choice-Quiz.
Zusätzliches: Gegebenenfalls Zusatzinformationen, die zum korrekten Anzeigen des Reportings relevant sind, etwa die Beschriftungen der Antwortmöglichkeiten eines Multiple-Choice-Quiz oder Informationen zum Ignorieren von Groß-/Kleinschreibung
Punktzahl: Numerischer Wert, der die erreichte Punktzahl festhält
Maximal mögliche Punktzahl: Numerischer Wert, der die maximal erreichbare Punktzahl festhält

Diese Ergebnisse werden von H5P gespeichert und dazu verwenden, um die von den Nutzer*innen gegebenen Antworten in einem Reporting darzustellen. Sie sind aber nur zusätzliche Daten zu dem, was moodle ohnehin im eigenen Gradebook speichert, beispielsweise Zeitstempel, moodle-eigene Bewertungen, usw.

Entsprechend werden bedingt durch die Fähigkeiten des moodle-Gradebooks auch die Punktbewertungen früherer Versuche speicherbar. Diese Historie ergibt sich aber nicht durch das H5P-Plugin, sondern durch moodle selbst.

Die Einsicht in diese Daten ergibt sich durch die Rechtevergabe in die Einsicht des Gradebooks von moodle und unterliegt nicht dem H5P-Plugin.

Speichern des Zustands

Ist das Speichern von Ergebnissen aktiviert, und ist ein/e Nutzer*in in moodle angemeldet, und unterstützt ein H5P-Inhaltstyp diese Funktion, dann wird zu definierten Ereignissen der aktuelle Zustand des H5P-Inhalts abgerufen und in der Datenbank der Plattform gespeichert.

Einsicht in diese Daten haben:

Personen, die über Zugriff auf die entsprechenden Datenbanktabellen verfügen (ggf. auch über weitere Plugins, die Zugriff auf die H5P-Daten ermöglichen)
Nutzer*innen der moodle-Plattform, wenn sie auf der Plattform angemeldet sind und einen von ihnen zuvor bearbeiteten H5P-Inhalt wieder aufrufen

Anonymisierte Statistiken

Das Versenden anonymisierter Statistiken kann jederzeit deaktiviert werden, ist wegen des Fehlens eines Personenbezugs aber datenschutzrechtlich wohl eher unbedenklich.

Inoffizielle H5P-Integration im moodle-Kern

Speichern von Ergebnissen

User-ID: Numerischer Wert, der dem/der angemeldeten Nutzer*in von moodle zugewiesen wurde und über den die Ergebnisse einer Person zugeordnet werden können
ID des H5P-Inhalts: Numerischer Wert, der die Verbindung zum absolvierten H5P-Inhalt herstellt
Eltern-ID des H5P-Inhalts: H5P-Inhalte können Unterinhalte umfassen, z. B. können im H5P-Inhaltstyp Column mehrere andere H5P-Unterinhalte gebündelt werden. Die Eltern-ID entspräche im Beispiel der ID des Column-Inhalts.
Interaktionstyp: Speichert den xAPI-Typ der Interaktion, um das passende Schema für das Reporting auszuwählen: true-false, choice, fill-in, long-fill-in, matching, performance, sequencing, likert, numeric, other
Beschreibung: Typischerweise die Aufgabenbeschreibung einer H5P-Aufgabe oder deren Bezeichnung
Erwartete Antworten: Bei einigen H5P-Inhaltstypen ist es möglich, ein Schema für eine richtige Antwort anzugeben, etwa die erwarteten Texte für Lücken eines Lückentextes oder die Indizes der richtigen Antwortmöglichkeiten eines Multiple-Choice-Quiz.
Tatsächliche Antworten: Die von dem/der Nutzer*in gegebenen Antworten, etwa die in einen Lückentext eingetragenen Texte oder die Indizes der ausgewählten Antwortmöglichkeiten eines Multiple-Choice-Quiz.
Zusätzliches: Gegebenenfalls Zusatzinformationen, die zum korrekten Anzeigen des Reportings relevant sind, etwa die Beschriftungen der Antwortmöglichkeiten eines Multiple-Choice-Quiz oder Informationen zum Ignorieren von Groß-/Kleinschreibung
Punktzahl: Numerischer Wert, der die erreichte Punktzahl festhält
Maximal mögliche Punktzahl: Numerischer Wert, der die maximal erreichbare Punktzahl festhält

Die Einsicht in diese Daten ergibt sich durch die Rechtevergabe in die Einsicht des Gradebooks von moodle und unterliegt nicht der H5P-Integration.

Speichern des Zustands

Die inoffizielle H5P-Integration im moodle-Kern verfügt Stand Oktober 2022 nicht über die Möglichkeit des Speicherns von Zuständen.

Anonymisierte Statistiken

Eventuell versendet moodle anonymisierte Statistiken, dies wäre jedoch außerhalb des Einflussbereichs von H5P.

H5P-Plugin für Drupal

Speichern von Ergebnissen

Ohne weitere Plugins erlaubt das H5P-Plugin für Drupal das Speichern der Ergebnisse nicht.

Speichern des Zustands

Ist das Speichern von Ergebnissen aktiviert, und ist ein/e Nutzer*in in Drupal angemeldet, und unterstützt ein H5P-Inhaltstyp diese Funktion, dann wird zu definierten Ereignissen der aktuelle Zustand des H5P-Inhalts abgerufen und in der Datenbank der Plattform gespeichert.

Einsicht in diese Daten haben:

Personen, die über Zugriff auf die entsprechenden Datenbanktabellen verfügen (ggf. auch über weitere Plugins, die Zugriff auf die H5P-Daten ermöglichen)
Nutzer*innen der moodle-Plattform, wenn sie auf der Plattform angemeldet sind und einen von ihnen zuvor bearbeiteten H5P-Inhalt wieder aufrufen

Anonymisierte Statistiken

Das Versenden anonymisierter Statistiken kann jederzeit deaktiviert werden, ist wegen des Fehlens eines Personenbezugs aber datenschutzrechtlich wohl eher unbedenklich.

Please consider reading this

21. November 2021ITH5P, LifeOliver Tacke

Dear H5P community,

as you’re probably aware of, I spend quite a bit of my free time doing things related to H5P – fix bugs, add features, create content types, host sessions at BarCamps, upload videos to YouTube, answer questions on the H5P forum, etc. I am pretty present. That probably is where my problem begins …

Total strangers write me emails and sometimes even phone me asking for help with installing or patching H5P in my spare time, asking if I could write them new functions or content types for free to solve their specific problems, asking to consult them with H5P related business issues pro bono, or asking to run a crowdfunding campaign to raise money for them, so they can pay me to create the code that they need. True stories. I am not making them up.

I know that this is part of being a member of an open source community. That’s totally fine! It wouldn’t even be a problem if it was just a small request from time to time that reaches me, but it has been getting out of hand lately. I receive about a dozen requests per week asking if I could „just quickly answer this H5P related question“ – that often cannot be answered that quickly. But even if it could: It’s simply getting out of hand.

I love H5P, I like the community aspect and the openness, and if you describe your issue on the official community forum, I will gladly help you out there when I have some free time to kill and feel like answering questions. But please, be aware that I am not Bruce Wayne who’s all settled and who can be Gotham’s savior all night long.

Please stop contacting me directly if you need help with H5P and expect it as some kind of favor if we don’t know each other in some way beyond you following me on Twitter or just having said hello to me at some event or something like that. It’s not just you who is asking, it’s a lot of people and I can’t handle it anymore.

Thanks!

Machste mal meine Hausaufgaben, bitte?

19. Februar 2021IT, PolitikBeratung, BMBF, Konsultation, OER, TechnikOliver Tacke

Erinnert ihr euch an 2017? Da fanden in Deutschland Bundestagswahlen statt. Die neu gewählte Bundesregierung hat sich danach ins Hausaufgabenheft (Koalitionsvertrag) geschrieben, eine OER-Strategie entwickeln zu wollen. Was in der Zwischenzeit bis heute geschah, weiß ich nicht. Aber der Abgabeschluss naht. Im September wird neu gewählt, und dann gucken im Wahlkampf wieder alle auf das, was aus dem Koalitionsvertrag tatsächlich umgesetzt wurde und bemängeln Fehlendes. Das ist lästig.

Nachdem nun offenbar die für das Bundesministerium für Bildung und Forschung (BMBF) wichtigeren Dinge bearbeitet worden sind, scheint die Zeit für das Thema OER gekommen zu sein. Kürzlich bin ich unverhofft von ihnen angeschrieben worden. Ich bin, wie andere auch, eingeladen worden, bei der Entwicklung der OER-Strategie für Deutschland mitzuwirken. Viele Informationen dazu habe ich nicht bekommen, aber dann später bei der Open Knowledge Foundation ein paar Details gefunden.

Konkret habe ich ein paar Thesen und Fragen zu OER aus dem Feld „Technik“ bekommen, andere zu den Bereichen „Mensch“ und „Gesellschaft“. Wie die Thesen entstanden sind, weiß ich leider nicht. Ich habe jedenfalls wunschgemäß eine Antwort verfasst und dem BMBF zukommen lassen — nur falls sich jemand fragt: unentgeltlich. Daraus sollen neue Thesen extrahiert werden, um sie Mitte April themenfeldübergreifend zu diskutieren. Ich bin durchaus gespannt, denn ich habe das Gefühl, man müsste eigentlich wieder einen Schritt zurück gehen und die irgendwann einmal aufgestellten Thesen überprüfen.

Damit ihr meine Skepsis besser versteht, habe ich euch die mir überlassenen Thesen und Fragen und meine Antworten hier bereitgestellt. Wer mag, darf natürlich auch gerne in der aktuellen Episode von Bildung-Alt-Entfernen Anjas und meinen Gedanken dazu lauschen oder auch denen von Markus Deimann und Christian Friedrich.

Übergeordnete Fragen

Welche technische Infrastruktur ist notwendig um OER in der Breite im Bildungsbereich verfügbar und nutzbar zu machen? Wie kann diese von Beginn an nachhaltig ausgestaltet werden und so Vorbildwirkung entfalten?

Teil 1

These: Die Etablierung von OER benötigt entsprechend der zuvorderst digitalen Natur der Materialien eine technische Infrastruktur, die die Speicherung, den Zugang und die Verteilung für die Anwendenden mit einer möglichst geringen technologischen Hürde ermöglicht. Daher soll ein flächendeckender Ausbau von angemessener technischer Infrastruktur befördert werden.
Frage: Ist ein zentrales Repositorium sinnvoll? Vs. Referatorium vs. Länderlösungen?

Bevor ich konkret auf die Frage eingehe, schicke ich einige Gedanken zu den angeführten Thesen vorweg.

Die Leitfrage danach, welche technische Infrastruktur notwendig sei, um OER in der Breite im Bildungsbereich verfügbar und nutzbar zu machen, kann nicht sinnvoll lediglich aus technischer Sicht beantwortet werden. Wir betrachten ein sozio-technisches System. Auf dessen Makroebene spielen sozio-kulturelle und politisch-rechtliche Aspekte meiner Ansicht nach eine weitaus gewichtigere Rolle als die Technik.

Zu den sozio-kulturellen Gesichtspunkten zählt etwa eine mangelnde Kultur des Teilens, die Deimann und Bastiaens (2010: 11) vor gut zehn Jahren als Hürde für die Verbreitung von OER an Hochschulen ausgemacht haben. Auf Grundlage persönlicher Gespräche jüngerer Zeit mit Personen auch aus verschiedenen Bildungsbereichen wage ich die Hypothese aufzustellen, die Einschätzung habe noch heute Bestand und erstrecke sich auch auf Schulen, Volkshochschulen oder die außerschulische Weiterbildung.

Beim Blick auf politisch-rechtliche Aspekte denke ich vor allem an das aus der Zeit gefallene Urheberrecht. Es hat überhaupt erst den Anstoß zum Entstehen der OER-Bewegung gegeben, die sich über formale Aus- und Weiterbildung hinaus erstreckt und nicht lediglich Schulen und Hochschulen betrifft. Auf nationaler Ebene trägt der jüngst bekannt gewordene Regierungsentwurf für die Umsetzung der EU-Urheberrechtsrichtlinie meiner Meinung nach nicht zu einer Verbesserung der Situation bei. Es steht im Gegenteil zu befürchten, dass die Vorgaben auf der Mikroebene des sozio-technischen Systems bei den Individuen die Furcht vor einem ungewollten Rechtsbruch verstärken. Dadurch würde sich die Bereitschaft zum offenen Teilen von Material eher noch verringern.

Kurzum: Der technischen Infrastruktur kommt eine bedeutsame unterstützende Funktion zu. Sie kann einen umfassenden und nachhaltigen Einsatz von OER ermöglichen. Sie allein kann aber ohne eine Beseitigung der politisch-rechtlichen und sozio-kulturellen Hürden den Einsatz von OER nicht etablieren. Technik ist selten ein gutes Mittel zum Lösen sozialer Probleme. Entsprechend wenig hilfreich sind daher vermutlich meine von den wichtigeren Einflussgrößen entkoppelten Antworten auf die vorliegenden Fragen.

Meine Antwort auf die übergeordnete Frage danach, wie die technische Infrastruktur von Beginn an nachhaltig ausgestaltet werden könne, lautet daher: Nicht durch die hier vorgesehene, von den anderen Thematiken losgelöste Betrachtung von Technik.

Eine weiteres, aus meiner Sicht bedenkliches und verkürztes Verständnis der Problematik vermute ich mit Blick auf die Wortwahl der These, dass die Etablierung von OER technische „Unterstützung bei der Speicherung, beim Zugang und bei der Verteilung“ erfordere. Diese These ist gewiss nicht falsch, aber unvollständig, wenn nicht mehr als das Verwalten digitaler Materialien darunter verstanden wird. Es fehlte in diesem Fall die Perspektive der „Open Educational Practices“ (OEP).

Hinter OEP verbirgt sich die Hoffnung, OER nicht lediglich als kostenlose Quelle von didaktisch aufbereiteten Inhalten zu begreifen, sondern über den Umgang mit denselben die bestehende Lehr-Lernpraxis zu verändern. Angestrebt ist beispielsweise eine seit langem diskutierte, aber kaum zu erkennende Abkehr von starren Lehrplänen und -zielen, die den Anforderungen des 21. Jahrhunderts nicht gerecht würden. Desweiteren sei eine verstärkte Zuwendung zu kollaborativen und diskursiven Methoden erforderlich (vgl. im Detail etwa Ehlers 2011 oder Mayrberger/Hofhues 2013).

Als Konsequenz lässt sich daraus ableiten, dass eine technische Infrastruktur für OER nicht nur mit Blick auf Speicherung, Zugang und Verteilung von Material zu gestalten wäre, sondern darüber hinaus auch Themen wie Kollaboration beim Erstellen von oder Unterstützung bei der Arbeit mit den Materialien berücksichtigt werden müssen. Im Zuge einer OER-Technik-Strategie ist eine Fokussierung auf Architekturoptionen für Repositorien daher ausdrücklich unzureichend.

Losgelöst von der oben skizzierten Problematik steht nun die Frage im Raum, ob ein zentrales Repositorium sinnvoll sei, ein Referatorium (mutmaßlich angelehnt an Dürkop 2017) oder einzelne Länderlösungen. In dieser Frage werden meiner Ansicht nach zwei unterschiedliche Ebenen auf unzulässige Weise vermischt.

Die erste Ebene beherbergt die Aspekte der Organisation bzw. der politischen und finanziellen Verantwortung und des Zugangs: zentrales Repositorium (beim Bund) oder einzelne, nur von Angehörigen der Länder zugänglichen Lösungen. Ich kann die Ursachen nicht einschätzen, die zu zahlreichen voneinander losgelösten Repositorien in verschiedenen Bundesländern geführt haben. Ich vermute verwaltungsrechtliche Rahmenbedingungen, „Bereichsdenken“ und auch das Ansinnen, wie auch immer gearteten lokalen Bedürfnissen innerhalb der Bundesländer besser gerecht werden zu können. Mit Blick auf die bereits angedeuteten Ziele von OEP ist diese Segmentierung aber vielfach Ausdruck des Gegenteils dessen, was erreicht werden soll. Zugang zu den Repositorien haben mitunter lediglich registrierte Lehrende der jeweiligen Bundesländer. Das ist kein offener Zugang, wie er in der Vision von OER angestrebt wird. Statt länderübergreifender Kollaboration und Nutzung von Synergieeffekten werden Abschottung und Ressourcenverschwendung vorgelebt. Das sind definitiv keine offenen Praktiken. Letztlich führt mit Blick auf die offene Lizenzierung von OER der an Landesgrenzen endende Zugang die Idee der Offenheit ad absurdum. Fun fact: Es werden hier technische Schranken eingeführt, um das rechtlich Erlaubte einzuschränken statt wie so oft andersherum rechtliche Schranken zu etablieren, die das technisch Mögliche begrenzen sollen.

Die zweite Ebene der Frage nach zentralem Repositorium, Referatorium oder Länderlösungen ist eine technische, und sie kann meines Erachtens zügig beantwortet werden: Eine zentrale Lösung ist in der IT oft keine gute Idee schon allein aus Gründen der IT-Sicherheit. Für Nutzer:innen ist es aus technischer Sicht zudem unerheblich, ob sie Materialien von einem Server aus Berlin, München oder vielleicht auch Oslo beziehen oder Material dort teilen – ob die von ihnen verwendete Software zur Kollaboration aus Baden-Württemberg kommt oder vielleicht aus Tokyo. Bei entsprechender Vernetzung, ggf. Replikation von Inhalten, Verwendung von Standards, die den Austausch ermöglichen und bei zusammengesetzten Werken idealerweise noch Zugriffsmöglichkeit auf die Quelldateien erlauben, sehe ich keinen Grund für eine zentrale oder lokale Lösung. Ich kann in Hinblick auf die Architektur die Idee eines Referatoriums begrüßen. Ich weise aber explizit nochmals darauf hin, dass der OER-Gedanke nicht bloß für formale Aus- und Weiterbildung von Belang ist und das Referatorium auch Quellen außerhalb von staatlichen Einrichtungen in Betracht ziehen sollte.

Teil 2

These: Open-Source-Technologien können dazu beitragen, dass Bildungsmaterialien unabhängig von spezifischen, proprietären Softwarelösungen sind.
Frage: Wie kann die Nutzung von Open-Source-Software im gesamten Erstellungsprozess von OER gefördert werden? Ist es überhaupt nötig? Um welche Art Software sollte es sich handeln?

Ich bin nicht sicher, ob der Kern dieser Fragen in den Bereich der Technik fällt. Zuvorderst scheint es sich mir um eine normative Frage zu handeln: Sollte offene Software gegenüber geschlossener Software bevorzugt werden?

Vordergründig bieten nicht-quelloffene, aber kostenfrei nutzbare Plattformen bereits genügend Möglichkeiten, um Inhalte zu finden, zu erstellen, zu bearbeiten und mit anderen zu teilen. Softwaregigant Google etwa lädt dazu ein, seine Texte mit GoogleDocs zu verfassen und anderen zur Verfügung zu stellen. Aus einer utilitaristischen Sicht liegt es nicht auf der Hand, weshalb man stattdessen zu quelloffenen Alternativen greifen sollte. Die Software funktioniert gut, bietet kaum praktische Zugangshürden und wird schon von vielen anderen genutzt. Geht es einzig um die Zweckorientierung, so ist die Parole „Offen ist, was Zugang schafft“ (Muuß-Merholz 2017) durchweg nachvollziehbar.

Der Quelltext für Google Docs ist allerdings nicht offen verfügbar. Niemand außer Google kann eine gleichwertige Instanz aufsetzen. Sollte Google irgendwann den Dienst einstellen wie bei Google Plus, Google Music, Google Reader und vielen weiteren geschehen, muss man hoffen, dass beim Exportieren in die Dateiformate anderer Programme nicht zu viele Details der Inhalte verloren gehen. Nachhaltigkeit kann auf diese Weise nicht sichergestellt werden. Dass die Daten zudem unter der Kontrolle Fremder stehen und sich Datenschutzfragen auftun, sei der Vollständigkeit halber erwähnt, aber nicht weiter ausgeführt. Dass die Überlegungen auch Software wie beispielsweise Zoom für Videokonferenzen oder Microsoft Teams als Kollaborationsplattform betrifft, sei ebenso bloß genannt.

Es bedürfte zunächst einer politischen bzw. gesellschaftlichen Entscheidung, ob utilitaristische Argumente wie „sofort verfügbar“ und „sogar kostenlos betrieben“ einen höheren Stellenwert erhalten sollen als Techniksouveränität. Dafür sollte gegebenenfalls zunächst analysiert werden, inwiefern Techniksouveränität besteht und ob man sie anstreben sollte (vgl. dazu ausführlich Edler et al. 2020).

Auf EU-Ebene scheint allerdings bereits eine Marschrichtung vorgegeben worden zu sein. Im Oktober 2020 beschwor Ursula von der Leyen in ihrer Rolle als Präsidentin der Europäischen Kommission bezüglich der europäischen IT-Infrastruktur „Europas digitale Souveränität“ (von der Leyen 2020). Daraus ließe sich zumindest ableiten, eine technische OER-Infrastruktur in Deutschland sollte unter europäischer Hoheit stehen. Ein zwingendes Votum für offene Software ergibt sich daraus jedoch nicht.

Betrachtet man weiterhin aber die von von offener Bildung und offener Software geteilten Werthaltungen, liegt die Bevorzugung offener Software nahe. Es ergäbe sich mindestens ein ästhetisch rundes Gesamtbild, und im besten Fall könnte offene Software als Vehikel von Werten innerhalb von Gemeinschaften auch dabei helfen, diese in die Bildungswelt zu tragen (vgl. Coleman/Hill 2005). Ich denke dabei vor allem an Kollaboration – auch bei der Gestaltung der Software, die nicht bloß Aufgabe von Software-Entwickler:innen ist bzw. sein sollte.

Sei Open-Source-Software also gesetzt. Wie ihre Nutzung im Erstellungsprozess von OER für welche Art von Software gefördert werden könnte, hängt stark vom Erstellungsprozess ab – bzw. von den Erstellungsprozessen, denn es gibt nicht den einen. Trotz einiger Überschneidungen unterscheiden sich etwa das Vorgehen und die Anforderungen beim Erstellen eines Arbeitsblattes für den Einsatz im schulischen Klassenraum erheblich von denen der Erstellung eines Onlinekurses im Web, der der beruflichen Weiterbildung dienen soll. Ich sehe mich nicht imstande, die Frage ohne Präzisierung des Erstellungsprozesses zu beantworten. Es scheint mir aber so, als liefere Müller (2019) in seiner Betrachtung von Chancen und Herausforderungen staatlich finanzierter, frei verfügbarer Bildungsmaterialien am Beispiel der Plattform ndla.no in Norwegen einige Teilantworten, die der Diskussion nützlich sein könnten.

Teil 3

These: Die Etablierung von OER benötigt einen globalen bzw. mindestens nationalen, einheitlichen Metadatenstandard, um Interoperabilität und Medienformattransferierung zu gewährleisten. Gleichzeitig wird eine einfach zu bedienende, quelloffene Technologie zur Erstellung, Bearbeitung und Vernetzung von OER benötigt.
Frage: Wie kann eine Standardisierung im föderalen Bildungssystem Deutschlands technisch und politisch gelingen?

Ich bin auf dem Feld der Metadaten nicht sonderlich bewandert und glaube nicht, dass ich die Frage beantworten kann. Ich kann lediglich die Gedanken teilen, die mir diesbezüglich durch den Kopf gehen.

Ich kann nicht überblicken, welche Rolle Metadaten für OER spielen. Sie scheinen relevant zu sein, um „OER auszutauschen, zu finden, zu beschaffen und sie auf einer breiten Basis zugänglich zu machen“ (vgl. Ziedord/Derr/Neumann 2013). Eine Unterstützung bei diesen Prozessen ist wünschenswert. Dass beispielsweise Treffer in Suchmaschinen durch Rückgriff auf Metadaten wie Namen von Verfasser:innen oder Fachzuordnungen verbessert werden können, halte ich für unbestritten. Ich bin mir allerdings nicht sicher, wie stark heutige Suchmaschinen tatsächlich davon abhängig sind und ob sie nicht auch ohne besondere Berücksichtigung von Metadaten bereits ausreichend gute Ergebnisse liefern könnten.

Die These, zu der ich Stellung nehme, spricht allerdings ausdrücklich von Metadaten als Notwendigkeit zur „Etablierung“ von OER. Das einzige schlüssige Argument, das mir diesbezüglich in den Sinn kommt, ist die klare Angabe von Urheberrechtsinformationen – um ungewollte Urheberrechtsverletzungen bei der Weiterverwendung von Inhalten vermeiden zu können. Wie bereits länglich ausgeführt, ließe sich diese Furcht und damit ein Hemmnis für die Verwendung von OER auch an der juristischen Wurzel des Urheberrechts packen statt über Technik Symptome bekämpfen zu wollen.

Comic. Panel 1: There are 14 competing standards. Panel 2: 14? Ridiculous! We need to develop one that covers everyone's use cases. Panel 3: There are 15 competing standards.

Comic „Standards“ von „xkcd“ unter der Lizenz CC BY-NC 2.5

Lasse ich diese Bedenken außer acht und folge der These der Notwendigkeit eines Metadatenstandards, hielte ich es für den falschen Weg, einen neuen Standard kreieren zu wollen (vgl. xkcd o. J.). Bei der Auswahl existierender Standards, scheint mir die Expertise von Bibliothekspersonal bedeutsamer zu sein als die von Techniker:innen. Der Zweck sollte im Vordergrund stehen, nicht möglichst einfache technische Umsetzbarkeit.
Wie diese Standardisierung technisch gelingen kann, lässt sich wohl erst sagen, wenn die gewünschten Metadatenstandards bekannt sind.

Quellen

Coleman, E. G./B. Hill (2005): The Social Production of Ethics in Debian and Free Software Communities: Anthropological Lessons for Vocational Ethics, in: S. Koch (Hrsg.), Free/Open Software Development, Hershey, USA: Idea Group Publishing, S. 273–295.
Deimann, M./T. Bastiaens (2010): Potenziale und Hemmnisse freier digitaler Bildungsressourcen–eine Delphi-Studie, in: Zeitschrift für E-learning, Jg. 5, Nr. 3, S. 7–18, https://www.researchgate.net/profile/Markus_Deimann2/publication/259784331_Potenziale_und_Hemmnisse_freier_digitaler_Bildungsressourcen_-_eine_Delphi_Studie/links/542127ca0cf241a65a1e64a9.pdf.
Dürkop, A. (2017): Konzept OER Referatorium, in: TUHH, [online] https://tubdok.tub.tuhh.de/handle/11420/1973 [16.02.2021].
Edler, J, et al. (2020): Technologiesouveränität. Von der Forderung zum Konzept, in: Fraunhofer, [online] http://publica.fraunhofer.de/dokumente/N-593501.html [16.02.2021].
Ehlers, U. D. (2011): Extending the territory: From open educational resources to open educational practices, in: Journal of Open, Flexible, and Distance Learning, Jg. 15, Nr. 2, S. 1–10, https://www.learntechlib.org/p/147891.
Leyen, U. von der (2020): Einleitende Bemerkungen von Präsidentin von der Leyen auf der gemeinsamen Pressekonferenz mit Präsident Michel im Anschluss an die außerordentliche Tagung des Europäischen Rates vom 2. Oktober 2020, in: Europäische Kommission, [online] https://ec.europa.eu/commission/presscorner/detail/de/statement_20_1815 [16.02.2021].
Mayrberger, K./S. Hofhues (2013): Akademische Lehre braucht mehr „Open Educational Practices“ für den Umgang mit „Open Educational Resources“ – ein Plädoyer, in: Zeitschrift für Hochschulentwicklung ZFHE, Jg. 8, Nr. 4, S. 56–68, https://doi.org/10.3217/zfhe-8-04/07.
Muuß-Merholz, J. (2017): Offen ist, was Zugang schafft! Oder: Warum Google Docs für OER wichtiger als Libre Office ist, in: OER Info, [online] https://open-educational-resources.de/offen-ist-was-zugang-schafft-oder-warum-google-docs-fuer-oer-wichtiger-als-libre-office-ist [16.02.2021].
Müller, F. (2019): Chancen und Herausforderungen staatlich finanzierter, frei verfügbarer Bildungsmaterialien (OER) am Beispiel der Plattform ndla.no in Norwegen. Ein Weg zu mehr Inklusion, Hamburg, Deutschland: Verlag ZLL21 e.V., http://nbn-resolving.de/urn:nbn:de:0111-pedocs-169937.
xkcd (o. J.): Standards, in: xkcd, [online] https://xkcd.com/927 [16.02.2021].
Ziedord, F. et al. (2013): Metadaten für Open Educational Resources (OER). Eine Handreichung für die öffentliche Hand, erstellt von der Technischen Informationsbibliothek (TIB), in: Technischen Informationsbibliothek, [online] https://www.pedocs.de/volltexte/2013/8024/pdf [16.02.2021].