Nationale und internationale freie Daten im Internet finden und für das Desk-Research nutzen / Online
Lernziele
- Freie Datenquellen im Internet finden und auf ihre maschinelle Nutzbarkeit für ihre Aufgabenstellungen in der Marktforschung beurteilen können,
- die wesentlichen Strukturen relevanter Datenformate verstehen,
- nachvollziehen können, wie sich offene Daten aus verschiedenen Quellen zusammenführen lassen und
- verstehen, wie durch die Zusammenführung von Daten informatorischer Mehrwert entsteht,
- die Einsatzmöglichkeiten von ChatGPT im Kontext freier Daten kennenlernen,
- den Nutzen von allgemeinen, aber auch spezifischen R-Packages bei der Verwendung von webbasierten Daten einschätzen können,
- die Möglichkeiten von Reporting und Kommunikation der Ergebnisse mit R überblicken,
- verstehen, wie sich R im Zusammenspiel mit ChatGPT bei der Verwendung offener Daten effizienter nutzen lässt.
Für wen gedacht?
Das Seminar richtet sich an Marktforscher/innen,
- die sich einen Überblick über den aktuellen Stand von Open-Data verschaffen wollen und freie Daten für ihre Arbeit benötigen,
- die wissen wollen, wie sich ein effizienter und reproduzierbarer Workflow in der Nutzung offener Daten aufbauen lässt,
Kenntnisse in R und RStudio sind nützlich, aber nicht erforderlich. Ebenso wäre ein eigener ChatGPT-Account hilfreich.
Seminarbeschreibung
Daten sind der Rohstoff unserer Zeit. Mit Hilfe von Künstlicher Intelligenz sowie leistungsstarken Open Source Tools wie R lassen sich diese Daten finden, analysieren und im Marktforschungsalltag nutzen.
Obwohl die Menge hochwertiger und freier Daten über das Internet nahezu exponentiell wächst, bleibt es eine Herausforderung, diese für Marktforschungszwecke zu finden und im produktiven Prozess reproduzierbar verwenden zu können.
Dieses Seminar gibt Ihnen einen Überblick über offene Daten und ihre wesentlichen Fundstellen im Internet. Gemeinsam werden Wege erkundet, wie sich freie Daten für die Marktforschung nutzen lassen. Auch wird beispielhaft gezeigt, wie die leistungsstarke freie Software R das Mittel der Wahl ist, wenn es um das effiziente und reproduzierbare Heben der Datenschätze geht. Im Zusammenspiel mit den aktuellen LLMs (Large Language Models) wie ChatGPT eröffnen sich dabei ganz neue Möglichkeiten.
Hintergrund: Bislang gibt es keine umfassenden Suchmaschinen für freie Daten. Die Übersichtsportale von Institutionen und Organisationen erleichtern das schnelle Auffinden nur begrenzt. Es ist sehr aufwändig, sich einen guten Überblick zu verschaffen und auf dem Laufenden zu bleiben. Allein das EU-Open-Data-Portal führt über 1,2 Millionen freie Datensätze aus 36 europäischen Ländern auf, kategorisiert nach 13 Themenbereichen. Hat man erst einmal offene Daten für die eigene Fragestellung gefunden, überraschen die Vielfalt der Datenformate und die inhaltlichen Strukturen der Dateien. So liegen die Datensätze des EU-Portals in über 40 verschiedenen Formaten vor.
Viele offene Daten lassen sich mit den gängigen Office-Software-Produkten nur schwer verarbeiten. Hier kommen R, aber auch Python und KI-basierte Tools ins Spiel. Die Open Research Data Task Force der University of Warwick (UK) benannte 2017 daher treffend die beiden größten Herausforderungen für die Nutzung von offenen Daten: 1. die Daten zu finden, 2. ohne großen Aufwand zu nutzen. KI kann bei beiden Herausforderungen ein wertvolles Hilfsmittel sein.
Methoden
Kurze Vorträge des Referenten, selbständiges Arbeiten allein oder auch in Kleingruppen in Breakout-Sessions zum Erkunden von Open-Data-Portalen. Für jede/n Teilnehmer/in gibt es eine persönliche RStudio-Cloud-Arbeitsumgebung.
In dieser Arbeitsumgebung sind u. a. interaktive HTML-Dokumente mit Beschreibungen und Links zu Datenportalen enthalten, außerdem Fachliteratur wie The State of Open Data. Histories and Horizons‘ und R-Templates für die eigene Erprobung.
Programm
Vormittags: Das expandierende Universum freier Daten im Internet
- Einführung in das Thema freie Daten/Open Data
- politische und rechtliche Hintergründe
- umfassender Überblick über große Data-Provider
- national - international - global: u.a. nationale Statistikämter, Eurostat, EZB, OECD, WHO, IMF
- geführte Touren auf ausgewählten Provider-Portalen
- Unterstützung durch ChatGPT beim Finden, Strukturieren und Präsentieren offener Daten
- eigenes Erkunden von Open-Data-Quellen mit Blick auf spezifische Aufgabenstellungen
Nachmittags: Open-Data effizient nutzen durch automatisierbare Prozesse mit R, unterstützt von ChatGPT. Anhand von Beispielen werden folgende Aspekte aufgezeigt:
- der Import von Daten unterschiedlichen Typs
- die automatisierte Datengewinnung durch Webscraping
- das Umwandeln von PDF-Tabellen in maschinenlesbare Daten
- die Aufbereitung und Weiterverarbeitung von Daten, u. a. Neubenennung von Variablen/Umgang mit fehlenden Werten/Typumwandlungen/Aggregationen und Berechnungen/Visualisierungen/Fusion von Daten
- der Export aufbereiteter Daten in Office-Dokumente oder Datenbanken
- die Kommunikation von Ergebnissen als interaktive HTML-Dateien
- jeweils begleitet von eigenen Schritten mit R-Templates
Modalitäten
Seminarmodalitäten
Anmeldung
Bitte melden Sie Ihre Teilnahme möglichst bis 6 Wochen vor Seminarbeginn über das jeweilige Anmeldeformular auf der BVM-Website an. Wenn Sie sich per Brief oder Fax anmelden möchten, wenden Sie sich bitte an die BVM-Geschäftsstelle. Nach der Anmeldung erhalten Sie eine Anmeldebestätigung.
Gebühren
Die Teilnahmegebühren beinhalten digitale Seminarunterlagen, Tagungsgetränke, Snacks und Mittagessen an allen Präsenz-Seminartagen. Die Gebühren der einzelnen Seminare entnehmen Sie bitte den Veranstaltungsbeschreibungen. Die Teilnahmegebühr wird sofort nach Rechnungsstellung ohne Abzüge fällig. Die Kosten für Anreise und Übernachtung tragen die Teilnehmer/innen selbst.
Veranstaltungsorte
Finden Seminare nicht online statt, werden sie entweder im NH Collection oder in der BVM-Geschäftsstelle durchgeführt.
Die entsprechenden Informationen dazu erhalten Sie mit der Anmeldebestätigung.
NH Collection Berlin-Mitte am Checkpoint Charlie
Leipziger Straße 106-111
10117 Berlin
Tel.: +49 30 203760
E-Mail: nhberlinmitte@nh-hotels.com
BVM-Bundesgeschäftsstelle
Friedrichstr. 187
10117 Berlin
Tel.: +49 30 9203128-34
E-Mail: seminar-anmeldung@bvm.org
Zimmerreservierung
Empfehlungen und Informationen zu Abrufkontingenten erhalten Sie mit der Bestätigung, dass das Seminar stattfindet. Das NH Collection Berlin-Mitte am Checkpoint Charlie und das MotelOne am Leipziger Platz sind fußläufig zu den Veranstaltungsorten erreichbar. Die Reservierung und Übernachtungskosten übernehmen die Teilnehmer/innen selbst.
Teilnehmer
Die Teilnehmeranzahl pro Seminar beträgt mindestens 6 Personen.
Rabatt für Frühbucher
Für Seminare, die bis zu den jeweiligen Stichtagen im Frühjahr und Herbst gebucht werden, wird folgender Rabatt gewährt:
a) 100,- Euro für Ein-Tagesseminare
b) 200,- Euro für Zwei- und Mehrtagesseminare
Rücktritt
Eine Stornierung der Seminarteilnahme ist schriftlich (per Post, Fax oder E-Mail) vorzunehmen. Bei Stornierung bis spätestens 31 Tage vor Beginn eines gebuchten Seminars, wird die Teilnahmegebühr in voller Höhe zurückerstattet. Bis 21 Tage vor Seminarbeginn wird eine Bearbeitungsgebühr in Höhe von 120 Euro erhoben. Danach werden die Teilnahmegebühren in voller Höhe fällig. Ohne zusätzliche Kosten kann ein/e Ersatzteilnehmer/in genannt werden. Ermäßigte Teilnahmegebühren können Ersatzteilnehmer/innen jedoch nur bei bestehender BVM-Mitgliedschaft in Anspruch nehmen.
Absage durch den BVM
Haben sich bis 10 Tage vor Beginn eines Präsenz-Seminars bzw. 7 Tage vor Beginn eines Online-Seminars weniger als 6 Teilnehmer angemeldet, kann der BVM die Veranstaltung absagen. Dies gilt auch für den Fall, dass durch die kurzfristige Absage der Seminarleitung ein Ersatz ohne Verlegung des Seminars nicht gefunden werden kann. In diesem Fall werden die Teilnahmegebühren in voller Höhe zurückerstattet. Stornogebühren des BVM fallen nicht an.
Stornierungskosten für vorgenommene Reisebuchungen bei Ausfall eines Seminars können vom BVM nicht übernommen werden. Der BVM behält sich vor, Änderungen im Seminarprogramm vorzunehmen und bei Absage der Seminarleitung für Ersatz zu sorgen.
Das aktuelle Seminarprogramm finden Sie stets auf der BVM-Website.
Allgemeine Datenschutzhinweise
Die für die Buchung von BVM-Seminaren elektronisch erfassten Daten werden nach der Veranstaltung nicht weiterverwendet, wenn Sie nicht eingewilligt haben, über das BVM-Seminarangebot oder Verbandsservices informiert zu werden. Weitere Informationen finden sie in der Datenschutzerklärung des BVM.
Datenschutzhinweis zur technischen Durchführung von Online-Seminaren
Für die Durchführung von Videokonferenzen setzt der BVM Berufsverband Deutscher Markt- und Sozialforscher e.V. (Verantwortlicher) einen Dienst des Auftragsverarbeiters Zoom Video Communications, Inc. (55 Almaden Blvd, Suite 600, San Jose, Kalifornien (95113), USA - nachfolgend „Zoom“) ein. Die entsprechenden Verträge (Auftragsverarbeitungsvereinbarung und Standard-Datenschutz-Klauseln) wurden abgeschlossen. Zudem wurden die Datenschutzeinstellungen so gesetzt, dass die Meetingdaten grundsätzlich über europäische Server verarbeitet werden. Weitere Informationen zur Verarbeitung Ihrer Daten und Ihren Rechten finden auf der Website von Zoom. Werden Daten außerhalb der Europäischen Union und des europäischen Wirtschaftsraums und in ein Land, welches kein angemessenes Datenschutzniveau bietet übertragen, bestehen gewisse Risiken. Bei einer Übertragung der Daten in die USA (derzeit ein Land ohne angemessenes Datenschutzniveau) besteht die Gefahr, dass Ihre Daten von amerikanischen Behörden zu Kontroll- und Überwachungszwecken verarbeitet werden können, ohne dass Ihnen möglicherweise Rechtsbehelfsmöglichkeiten zustehen.
Urheberrechte/Nutzung der Seminarunterlagen
Jegliche Inhalte des Seminars dürfen nur für eigene und interne Markt- und Sozialforschungszwecke der Teilnehmenden und des Arbeitgebers der Seminarteilnehmer/innen genutzt werden. Sie dürfen nicht für Werbung verwendet und ohne Zustimmung des BVM nicht an Dritte – auch nicht in Form eigener Lehr- und Weiterbildungsveranstaltungen, an denen Dritte teilnehmen können – weitergegeben werden.
Die den Teilnehmenden überlassenen Seminarunterlagen, sei es in papierener oder elektronischer Form, dürfen nur für interne Zwecke des Arbeitgebers des Teilnehmenden (z.B. interne, auf die Mitarbeiter des Arbeitgebers beschränkte Weiterbildungs- und Lehrveranstaltungen) vervielfältigt und verbreitet werden. Ein Zugänglichmachen im Internet oder in und mit Hilfe anderer Medien ist nicht gestattet.
Gerichtsstand ist Berlin.
Stand: August 2020