Studierende produzieren verwertbare Daten für Wissenschaftler

Home » Studierende produzieren verwertbare Daten für Wissenschaftler

Das Field Museum in Chicago hatte ein Problem: Seine zoologischen, geologischen, botanischen und anderen wissenschaftlichen Sammlungen enthielten ungefähr 40 Millionen Objekte, von denen viele nicht katalogisiert waren. Allein die botanische Pflanzensammlung enthielt mehr als 3,5 Millionen Exemplare und hatte das Potenzial, zum Verständnis des globalen Klimawandels beizutragen, so Matt von Konrat, Leiter der Sammlung. Aber ohne Digitalisierung und Analyse wurde die Sammlung zu wenig für Forschungszwecke genutzt, die Wissenschaft und Gesellschaft helfen könnten.

Auch die Roosevelt University in Chicago hatte ein Problem. Viele der begabten Mathematikstudenten waren begierig darauf, praktische Erfahrungen zu sammeln, die sie mit Technologiewerkzeugen vertraut machen und sie auf Karrieren in der Industrie vorbereiten könnten. Aber viele der Studenten hatten Jobs oder familiäre Verpflichtungen, was laut Melanie Pivarski, Mathematikprofessorin an der Universität, die Suche nach Praktikums- und Reisemöglichkeiten schwierig machte.

In einem Versuch, sein Problem zu lösen, rief Von Konrat Pivarski an und fragte, ob ihr internes Statistik- und mathematisches Modellierungs-„Gehirn“, wie er die Studenten nannte, helfen könnte. Pivarski erwog die Möglichkeit, dass seine Hilfe auch zur Lösung ihres Problems beitragen könnte, und sagte ja.

Hochschul- und Universitätsleiter posaunen oft über die Vorteile von Bachelor-Forschungsprogrammen – und das aus gutem Grund. Viele dieser Führer sagen dass Studenten in solchen Programmen reale Erfahrungen in Datenerfassung, Technologiewerkzeugen, Forschungsmethoden und Analyse sammeln und gleichzeitig Mentoring-Beziehungen entwickeln, ihre Perspektive auf das Scheitern ändern und übertragbare Fähigkeiten entwickeln. Andere bemerken dass Bachelor-Forscher Fähigkeiten in den Bereichen Kommunikation, Problemlösung, Projektmanagement, Budgetierung und Verfassen von Vorschlägen erwerben. Diese Punkte sind gültig, lassen jedoch häufig die Erwähnung von Begünstigten außerhalb der Studenten aus.

Ein neuer lernen über die Zusammenarbeit von Konrat und Pivarski, veröffentlicht im Juni in Forschungsideen und -ergebnisse betont, dass auch Wissenschaftler von der Bachelor-Forschung profitieren können. Die von Studenten generierten Datensätze, die ihre Partnerschaft hervorbrachte, waren zuverlässig und sehr hilfreich für die Forscher des Museums.

„Wir könnten niemals so viel erreichen wie einzelne Forscher“, sagte von Konrat über die Hilfe, die sein Team von Studenten und anderen Gemeindemitgliedern erhielt. „Dadurch konnten wir unseren gesamten Dokumentations- und Entdeckungsprozess erheblich beschleunigen.“

„Obwohl die Studenten unsere wissenschaftlichen Interaktionen über den Computer durchführten“, sagte Pivarski über die Zusammenarbeit, „war es wirklich klar [to them] Das sind echte Daten, die von einem echten Ort kommen, und sie werden dazu beitragen, die Wissenschaft voranzubringen.“

Hier ist der Hintergrund: Unter Verwendung der heutigen Technologie-Tools machte Von Konrat eine schnelle Arbeit, um digitalisierte Bilder der Leberblümchen-Exemplare des Museums aufzunehmen. Leberblümchen sind kleine, kompakte, moosartige Pflanzen, die in warmen, feuchten Regionen der Welt wachsen. Laut Von Konrat sind sie Nachkommen der frühesten Pflanzen, die vor 100 Millionen Jahren den Übergang vom Wasser zum Land vollzogen haben. Da sie winzig sind – etwa so groß wie eine Wimper – sind sie ökologisch empfindlich und helfen daher, Wissenschaftler über den Klimawandel zu informieren.

Aber von Konrats Bemühungen führten zu Zehntausenden von Bildern. (Hätte er fortgefahren, hätte er vielleicht Hunderttausende von Bildern gehabt.) Die Analyse der Bilder würde jedoch viel mehr Zeit und Mühe kosten. Die riesige Anzahl von Bildern hatte einen Engpass geschaffen. Unerschrocken richtete er im Field Museum einen Kiosk ein, um Hilfe von Museumsbesuchern zu sammeln.

„Ich hätte nicht gedacht, dass sich die Leute für Leberblümchen begeistern würden“, sagte von Konrat und räumte ein, dass ihr Name „nicht der attraktivste“ sei. „Aber die Leute wollen wirklich etwas zur Wissenschaft beitragen.“

Ein Besucher am Museumskiosk sah ein Bild eines botanischen Exemplars auf einem Bildschirm und wurde gebeten, es zu messen. Jedes Bild wurde mehreren Besuchern gezeigt, was zu vielen Messungen führte. Beispielsweise kann ein einzelnes Leberblümchenbild 80 verschiedene Messungen von 80 verschiedenen Gästen enthalten. Von Konrat war sich darüber im Klaren, dass die Gäste unterschiedlich erfolgreich darin sein würden, die Messanweisungen zu verstehen – oder sogar zu befolgen. Das bedeutete, dass einige, wenn auch nicht alle Messungen genau waren. Er musste herausfinden, wie er ungenaue Messungen aus seinem Datensatz eliminieren konnte.

Er wandte sich an Pivarski. Könnten sie und ihre Bachelor-Studenten in den Fächern Mathematik, Versicherungsmathematik, Datenanalyse und Informatik in ihrer Klasse Industrielle Anwendungen der Mathematik schlechte Einträge aus seinem Crowdsourcing-Datensatz herausfiltern? Die Forscher des Feldmuseums könnten den Datensatz nur dann für ihre Forschung verwenden, wenn er von hoher Qualität ist. Pivarski begrüßte die Herausforderung, insbesondere während der Isolation der Pandemie.

„Alle waren auf Zoom und … auf seltsame Weise hat es uns wirklich zusammengebracht“, sagte Pivarski. „Wir wollten es in einen veröffentlichungsfähigen Zustand bringen und nicht nur in den Zustand eines Studenten-Forschungstags, wie es in den vergangenen Jahren der Fall war.“ Pivarski wusste nicht sofort, wie sie auf von Konrats Frage antworten sollte, was ihre Schüler zu motivieren schien.

„Ihre Arbeit hat eine gewisse Wesentlichkeit“, sagte sie, wenn die Lehrerin die Antwort nicht von vornherein weiß. „Es ist eine schöne Sache, die Sie in einem Calc I-Kurs nicht wirklich haben können.“

Pivarskis Studenten schrieben ihre eigenen Programme in Powershell (einem Programm zur Aufgabenautomatisierung und Konfigurationsverwaltung), Python (einer Programmiersprache) und Excel (einer Tabellenkalkulation), um die Daten zu überprüfen und zu bereinigen. Ihr automatisierter Prozess umfasste mehrere Phasen des Ausschlusses von Ausreißern, genau wie von Konrat es gewollt hatte. Am Ende stellten sie fest, dass 40 Prozent der Crowdsourcing-Daten verworfen werden mussten. Das bedeutete, dass 60 Prozent der Daten valide und nutzbar waren.

„Sie können sich vorstellen, dass das 60 Prozent weniger sind, als wir tun müssen“, sagte von Konrat. „Wir können es tatsächlich für unsere Forschung nutzen.“

Die Studenten, berichtete Pivarski, trugen nicht nur zu authentischer Forschung bei, sondern dachten auch intensiv über die Welt der Natur und Karrieremöglichkeiten nach.

„Es ist eine Sache, wenn sie den Namen einer Pflanze online googeln“, sagte Pivarski. „Sie würden sagen: ‚Nun, das sieht ganz anders aus als diese [images of actual samples provided by Field Museum researchers].’“ Ihre dämmernde Erkenntnis, dass Pflanzen in der Natur in unterschiedlichen Varianten vorkommen, war greifbar.

„Sie waren auch sehr neugierig darauf, wie die Proben gesammelt wurden, und auf die Aufregung internationaler Reisen, um biologische Proben zu erhalten“, sagte Pivarski.

In regelmäßigen Zoom-Calls mit den Forschern stellten sie Fragen zur Arbeit und zum Leben der Wissenschaftler.

„Es ist wirklich eine Erfahrung, in einem Praktikum zu sein, ohne den ganzen Sommer für ein Praktikum oder Reisen aufwenden zu müssen“, sagte Pivarski über die Gelegenheit, die der Kurs Studenten bot, deren Arbeits- und Familienpläne normalerweise diese Erfahrungen nicht berücksichtigen würden. „Das hat eine Gerechtigkeitsdimension. Jeder kann es tun.“