Data Science Cup 2017

Die Grundlage für den diesjährigen Data Science Cup bildet der Datenbestand des Mehrspieler-Online-Rollenspiels „EVE Online“. Die Besonderheit von "EVE Online" ist sein „sandbox“ Charakter. Dabei definieren die Entwickler lediglich das Universum und überlassen es den Spielern die Geschehnisse innerhalb dieses Universums frei zu gestalten. Das bedeutet auch, dass bis auf wenige Ausnahmen, sämtliche Gegenstände und Items von Spielern hergestellt und gehandelt werden. Dazu existiert neben umfassenden Möglichkeiten für Rohstoffabbau und Produktion auch ein großer, gebotsbasierter Markt mit ca. 700 Millionen Transaktionen im Jahr. Diese Besonderheiten machen "EVE Online" zu einer virtuellen Ökonomie, die bereits in Fachzeitschriften wie der Financial Times und dem Wall Street Journal diskutiert wurde.

Die Datenbasis beinhaltet Marktdaten in täglicher Granularität über einen Zeitraum von ca. vier Jahren. Diese Daten umfassen Kauf- und Verkaufsgebote, tatsächliche Verkäufe sowie Minimal-, Maximal- und Durchschnittspreise für mehrere tausend Items in hunderten Produktgruppen und verschiedenen Marktsegmenten. Ergänzt werden diese Informationen durch regionale Metadaten und beschreibende Attribute der Gegenstände.

Bewerbungsschluss war der 28. April 2017.


Aufgabenstellung

Es gibt vier Aufgabenbereiche, die unterschiedliche Aspekte der Daten adressieren.
Ein wichtiger Hinweis: Die detaillierte Aufgabenstellung und Hinweise zur Bewertung finden Sie hier. Die Aufgabenbereiche (Kurzfassung) sind:

Aufgabe 1: Vorhersage Absatzzahlen

Gegeben sind jeweils die Top 5 der umsatzstärksten Items aus den Marktgruppen Ships, Ship Equipment, Ammunition & Charges und Manufacture & Research. Für jedes dieser 20 Items sollen auf verschiedenen zeitlichen Granularitäten und Horizonten Verkaufszahlen prognostiziert werden. Basierend auf historischen Daten auf Tagesgranularität bis zum 23.12.2015 sind dies: tägliche Verkäufe für die Tage vom 24.12.15 bis 01.01.16, wöchentliche Verkäufe für den Januar 2016, sowie die monatlichen Verkaufszahlen für Januar, Februar und März 2016. In Summe sind 16 (9+4+3) Prognosewerte pro Item zu berechnen.

Aufgabe 2: Vorhersage Preisentwicklung

Gegeben sind 3 Indizes, die verschiedene Teilmärkte abdecken. Diese Indizes liegen als Views vor und enthalten jeweils eine Zeitreihe für den durchschnittlichen Preis des Index auf Tagesgranularität. Basierend auf historischen Daten bis zum 23.12.2015 sind folgende Prognosen für den Preis zu berechnen: tägliche Werte für die Tage vom 24.12.15 bis 01.01.16, wöchentliche Werte für den Januar 2016, sowie monatliche Werte für Januar, Februar und März 2016. In Summe sind 16 (9+4+3) Prognosewerte pro Index zu berechnen.

Die 3 Indizes sind wie folgt definiert:

  • Consumer Price Index (CPI): Ammunition, Consumer Products, Drones, Implants, Skills, Tech I Modules, Tech I ships, Tech II modules, Tech II ships
  • Mineral Price Index (MPI): Ore, Minerals
  • Secondary Producer Price Index (SPPI): Blueprints, Advanced Capital Components, Standard Capital Components, R.A.M., Advanced Components, Rigs

Aufgabe 3: Vorhersage Marktanteile

Gegeben sind drei Marktsegmente mit dazugehörigen Produktgruppen. Für jede Produktgruppe liegen die Umsätze auf monatlicher Granularität vor (A3_queries.sql). Ziel dieser Aufgabe ist es, den prozentualen Anteil jeder Produktgruppe am Umsatz des jeweiligen Marktsegments vorherzusagen. Basierend auf historischen Daten bis zum 23.12.2015 sind die monatlichen Markanteile für jede Produktgruppe für das erste Quartal 2016 zu prognostizieren.

Aufgabe 4: Optimaler Verkaufsplan

Gegeben ist ein Warenbestand mit verschiedenen Items in unterschiedlichen Stückzahlen. Ziel dieser Aufgabe ist es, eine Menge von Verkaufsgeboten so zu definieren, dass der gesamte Verkaufserlös maximiert wird. Ein Verkaufsgebot wird definiert durch einen Ort (stationsid), ein Datum, ein Item, die zu verkaufende Stückzahl und einen Stückpreis. Es dürfen beliebig viele Verkaufsgebote an beliebig vielen Orten eingestellt werden. Verkaufsgebote sind nur an dem Tag und in der Station gültig für die sie definiert wurden. Verkäufe in anderen Stationen werden durch Angebote in regional nahegelegenen Stationen nicht beeinflusst. Gebote sind auch an durch Spieler einnehmbaren Stationen möglich (stationid beginnt mit 61…, siehe PDF „Lies Mich“) und werden regulär bewertet. Da es keine effiziente Möglichkeit gibt, den Teilnehmern Rückmeldungen zu eventuellen Restbeständen zu geben, verfallen nicht verkaufte Einheiten und stehen für weitere Verkaufsgebote nicht mehr zur Verfügung. Die aufsummierte Stückzahl eines Items über alle Verkaufsgebote darf nicht höher als der Warenbestand des Items sein, d.h. zum Monatsbeginn ist der gesamte Warenbestand gegeben und es kommen keine weiteren Stückzahlen hinzu, Leerverkäufe sind nicht erlaubt. Der zeitliche Rahmen für alle Verkäufe ist der Januar 2016. Als Datengrundlage stehen die Stückzahlen und durchschnittlichen Preise aller Kauf- und Verkaufsgebote sowie der tatsächlichen Verkäufe pro Tag, Item und Station/System bis zum 23.12.2015 zur Verfügung.

Download vollständige Aufgabenstellung der Aufgaben 1 bis 4 (PDF-Dokument)
Download Data Science Cup – Lies mich Datei (PDF-Dokument)


Ergänzende Informationen zur Lösung der Aufgaben

Regeln für die Nutzung zusätzlicher Datenquellen:

  • Externe Daten dürfen genutzt werden, sofern sie keinen unmittelbaren Bezug zum Markt von EVE online haben. Marktdaten zu Angebot und Nachfrage, Preisen etc., die über die EVE Community bereitgestellt werden, dürfen nicht verwendet werden.
  • Falls externe Daten genutzt werden, muss beschrieben werden, was diese enthalten, woher sie stammen und wie sie in die Lösung eingehen.

Download Datenbasis

Zugang zur Datenbasis, ScoreSheet und zu einer Dokumenten-/ Dateisammlung:

Zugang

Passwort: data4ever


Bewertung der Aufgaben / Ermittlung des Gewinners

In jedem Aufgabenbereich werden Punkte vergeben, die dann zu einer Gesamtwertung summiert werden. Detaillierte Hinweise, wie die jeweiligen Aufgaben bewertet werden, finden Sie in der Aufgabenstellung (siehe PDF vollständige Aufgabenstellung). Die Lösungen werden mittels einer Score Sheet-Vorlage eingereicht. Die Einreichung mit der höchsten Gesamtwertung gewinnt den Data Science Cup. Die Bewertung der Ergebnisse wird durch das ScaDS Dresden/Leipzig vorgenommen.

Empfehlen Sie diese Seite weiter:

Seite druckenDiese Seite drucken

Data Science Cup

Mit freundlicher Unterstützung des ScaDS Dresden/Leipzig - Competence Center for Scalable Data Services and Solutions“

Aufgabenstellung

vollständige Aufgabenstellung der Aufgaben 1 bis 4 (PDF-Dokument)
Download

Data Science Cup – Lies mich Datei (PDF-Dokument)
Download

Kontakt

Ihr Ansprechpartner bei fachlichen Fragen: Dr.-Ing. Martin Hahmann

Ihre Ansprechpartnerin in der Geschäftsstelle: Ulrike Großmann
Tel.: +49 30 499 074 13