xMOOC im Selbstversuch: rechnergestützte Datenanalyse

Da ich gerade ein bisschen mit einer kleinen statistischen Auswertunug zu tun habe, habe ich mir als Hilfsmittel PSPP und R auf meinem Rechner installiert. Für das, was ich vorhabe, reicht PSPP eigentlich vollkommen aus, andererseits befriedigt R meinen Spieltrieb eher.

Von Bastian Greshake habe ich auf Twitter den Tipp bekommen, dass gerade ein passender Kurs auf Coursera gestartet ist: Computing for Data Analysis. Der dreht sich um die rechnergestützte Datenanalyse speziell mit R. Da nutze ich doch die Gelegenheit, um etwas zu lernen und gleichzeitig mal einen xMOOC auszuprobieren, zu denen Plattformen gerade wie Pilze aus dem Boden sprießen: neben Coursera etwa edX vom MIT oder Udacity unter Federführung von Sebastian Thrun.

Mein erster Eindruck

Der Kurs läuft vier Wochen lang, veranschlagt werden als Aufwand laut Kursbeschreibung drei bis fünf Stunden pro Woche. Klingt durchaus machbar. Vom Kursleiter werden verschiedene Unterlagen bereitgestellt: Videos, Dokumente, Quizzes, die es zu absolvieren gilt, ein Forum zum Austauschen, usw.

Interessant für viele TeilnehmerInnen ist wohl zunächst der Lehrplan (syllabus). Dort ist aufgelistet, was das Ziel des Kurses ist und welche Leistungen erbracht werden müssen, um schließlich ein Zertifikat zu bekommen. Welche Vorkenntnisse erwartet werden, bleibt leider offen. Das könnte sich für einige TeilnehmerInnen rächen, wie sich gleich zeigen wird. Schauen wir doch mal…

Die Videos

Für die erste Woche werden rund zwei Stunden an Lernvideos bereitgestellt. Wenn man einkalkuliert, dass man Passagen mehrfach anschaut oder die Filme zwischendurch stoppt, um sich Notizen zu machen, dann geht von den eingeplanten drei bis fünf Stunden pro Woche schon einiges an Zeit drauf. Wo bleibt denn dann der Raum, um sich mit der Programmierumgebung vertraut zu machen – geschweige denn die Sprache R auszuprobieren? Das scheint mir doch sehr knapp kalkuliert zu sein. Wann dann noch in den Büchern geschmökert werden soll, die empfohlen wurden, ist mir ein Rätsel.

Die Videos an sich sind leider nicht der Rede Wert. Der Kursleiter präsentiert eigentlich nichts als vertonte hässliche Textwüsten-Folien, wie man sie oft aus Präsenzvorlesungen kennt. Das übliche Dilemma: Der Inhalt der Folien lenkt vom gesprochenen Wort und macht es schwierig, beidem zu folgen. Die Schaubilder allein enthalten aber zu wenig Informationen, um als Skript zum Selbststudium durchgehen zu können. Garr Reynolds nennt so etwas Folienumente bzw. slideuments. Das Potenzial von Videos wird in meinen Augen komplett verschenkt. Ich wäre jedenfalls mit einem erklärenden Text besser bedient gewesen.

Neben der für mich unbefriedigenden Gestaltung finde ich die Videos didaktisch überhaupt nicht durchdacht. Zielgruppe sind keine Informatiker, sondern Leute, die mit Unterstützung des Computers statistische Probleme lösen wollen. Sie bekommen gleich zu Beginn aber erst einmal das abstrakte Konzept von Datentypen um die Ohren gehauen. Nicht einmal ein paar veranschaulichende Grafiken findet der Zuschauer, obwohl mir da spontan das eine oder andere eingefallen wäre. An anderen Stellen hätte es sich einfach angeboten, an Statistikvorkenntnisse anzuknüpfen und Bezüge herzustellen. Leider nein. Weiter geht es holterdipolter, Funktionen werden querbeet benannt, angerissen und abgehakt. Auch das erinnert mich an so manche Präsenzvorlesung, die ich früher besucht (und schnell auch nicht mehr besucht) habe. Natürlich reicht so ein Vortrag allein nicht. Jeder muss selbst lernen und sich mit den Inhalten auseinandersetzen – nur erschließt sich mir der Nutzen der Videos dabei überhaupt nicht. Nicht-Programmierer dürften heillos überfordert sein, und wer schon programmieren kann, der ist mit den offiziellen Unterlagen zu R wohl besser bedient. Gleich vorarbeiten könnte so jemand übrigens nicht, da die Unterlagen nur Woche für Woche freigeschaltet werden. Gerade bei einer so heterogenen Zusammensetzung der KursteilnehmerInnen scheint es mir wichtig zu sein, die vorausgesetzten Kenntnisse klar zu benennen. Nur so weiß jeder, worauf er sich einlässt.

Vermutlich wäre es für Neueinsteiger in die Programmierung geschickter gewesen, kleine Probleme zu formulieren und dann zu zeigen, wie sie in R bewältigt werden können – und die Leute dann auf Entdeckungsreise zu schicken, um selbst andere etwas schwierigere Probleme zu lösen. Hinterher hätte man kurz aufzeigen können, wie von den Einzelfällen abstrahiert werden kann.

Das Forum

Hier passiert etwas. Hier werden Fragen gestellt, hier wird gemeinsam gerätselt, hier geben sich die Lernenden gegenseitig Hilfestellung. Was in Begleitforen zu Präsenzveranstaltungen oft schleppend funktioniert, klappt hier vermutlich schlicht aufgrund der großen Masse von TeilnehmerInnen bestens. Es findet sich doch irgendjemand, der Lust zum Antworten hat, was wieder andere anspornt und ihnen zeigt, dass die Plattform kein toter Briefkasten ist.

Im Forum werden auch Zusatzaufgaben von Kursbetreuern zur Verfügung gestellt – offenbar wollen die Leute also tatsächlich mehr praktisch tun. Auch schön: Es handelt sich wohl um echte meteorologische Daten. Ist doch nett, wenn man nicht mit fiktiven Beispielen hantieren muss. Bei manchen Fragen helfen die Kursbetreuer auch weiter.

Die Quizzes

Abgeschlossen wird die Einheit mit einem Multiple-Choice-Test. Der beginnt tatsächlich mit einer Faktenfrage nach der Universität, an der R entwickelt wurde… Es sind durchaus auch etwas kniffeligere Fragen dabei, aber sie gehen meiner Meinung nach vollkommen an der Zielstellung des Kurses vorbei. Alles dreht sich um Datentypen. Manche Dinge wurden zudem gar nicht behandelt, etwa die mögliche Typenumwandlung beim “:“-Operator. Unerfahrene dürften dazu ganz schön rätseln, warum ihre Antwort falsch ist. Etwas Erfahrenere finden die Funktion, mit der sich Variablen auf bestimmte Typen prüfen lassen, lernen aber kaum etwas über die praktische Auswertung von Daten mit dem Computer.

Es gibt zusätzlich noch so etwas wie eine Programmierhausaufgabe: Es wird eine Tabelle mit Daten zur Verfügung gestellt (im CSV-Format) und als Ausgangspunkt für einige Auswertungen herangezogen. Geprüft wird das ebenfalls über einen Multiple-Choice-Test. Die erste Frage lautet tatsächlich, welche Bezeichnungen in der Spaltenüberschrift stehen!? Zweite Frage: Was steht in den ersten beiden Zeilen!?!? Lösen kann man alle Fragen übrigens in Windeseile auch ganz ohne Programmierkenntnisse. Klar, man betrügt sich selbst, wenn man das nicht als Gelegenheit nutzt, um die Antworten mit R herauszutüfteln. Die Punkte bekommt man aber so oder so zugeschrieben. Was das für das Zertifikat heißt, das es am Ende des Kurses geben soll, darf sich jeder selbst ausrechnen. Auch ganz ohne R.

Fazit

Ich finde es toll, dass mit dem Format der xMOOCs experimentiert wird, dass ProfessorInnen die Mühe auf sich nehmen, dass vielen Menschen damit kostenfreie Lerngelegenheiten angeboten werden. Von der Umsetzung bin ich zumindest bei diesem Kurs jedoch bisher alles andere als angetan. Ich kann die Skepsis von Ellen Trude teilen und Rolf Schulmeister zustimmen, der als Undercover Student in MOOCs unterwegs war.

Irritiert bin ich besonders, weil der Kursleiter Professor an der Johns Hopkins Bloomberg School of Public Health lehrt, die in den USA wohl überaus renommiert ist. Dort wird in der Lehre wohl auch nur mit Wasser gekocht. Mal abwarten, was die nächsten Wochen bringen.

3 thoughts on “xMOOC im Selbstversuch: rechnergestützte Datenanalyse

  1. Pingback: MOOC again

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert