Guten Tag,
da ich Freitag meinen Antrag abgeben muss, würd ich ihn gerne nochmal von anderen anschaun lassen.
Einen "griffigen" Titel wie ihn die IHK will muss ich noch finden
Ich bedanke mich bereits jetzt für Hinweise, Kritik und Vorschläge.
Ist:
Die Redakteure der ******* veröffentlichen ihre Nachrichtenartikel meist auf verschiedenen Onlineportalen. Diese Portale werden jeweils separat von Google Analytics überwacht. Um die Statistiken zu ihren Veröffentlichungen einzusehen, müssen die Mitarbeiter deshalb für jedes einzelne Portal auf dem ihr Artikel ausgespielt worden ist, die Google Analytics Seite aufrufen. Dort dann anschließend die Aufrufzahlen manuell suchen und zusammenfassen, um einen Überblick zu erhalten . Dieser Vorgang ist nicht nur sehr aufwändig, sondern kostet je nach Anzahl der Artikel und Portale unnötig viel Zeit. Außerdem ist es nur schwer möglich verschiedene Artikel zu vergleichen um etwa die Erfolgreichsten herauszufinden.
Soll:
Um das Sammeln der Daten und das Zusammenfassen dieser zu automatisieren, wird eine Serveranwendung entwickelt, die in regelmäßigen Abständen, abhängig vom Alter des Artikels, Aufrufzahlen von Google Analytics, über die API Schnittstelle von Google, bezieht. Diese werden zusammengefasst, da Informationen immer nur für jeweils ein Portal vorliegen, aufbereitet und anschließend für die spätere Verwendung in einer Datenbank ablegt. Die Informationen werden dann im internen System bei der bereits bestehenden Übersicht der Artikel angezeigt, um so für Redakteure zugänglich zu sein. Die Anwendung wird automatisch, alle 15 Minuten von einem Scheduling Task des Systems angestoßen.
Detail:
Die von mir in der Projektarbeit zu entwickelnde Anwendung hat folgende Aufgaben:
Authentifizierung mit Google Servern über OAuth 2.0
Beziehen der jeweils relevanten Daten über HTTP Anfragen an die Google Schnittstelle
Zusammenfassen und aufbereiten der Informationen zu Artikeln
Ablegen der Daten in Datenbank
Um die Daten zugänglich zu machen ist noch die Anzeige im internen System notwendig.
Die Frequenz in welcher die Daten abgeholt werden, hängt vom Alter des Artikels ab. Daten zu neuen Artikeln werden innerhalb der ersten sechs Stunden alle 15 Minuten bezogen. Nach drei Tagen werden diese nur noch stündlich abgefragt. Diese Spanne verlängert sich immer weiter bis die Daten nach einem Monat nur noch einmal täglich bezogen werden.
Umsetzung:
Die verwendeten Technologien sind Java für die Implementierung der Logik und der Anfragen an die API. Als Datenbank zum ablegen der aufbereiteten Daten dient eine MySQL Datenbank.
Außerdem wird JSP verwendet um diese in einer graphischen Anzeige darzustellen. Die Anwendung läuft auf einem Debian Server.
Projektablauf mit zeitlicher Gliederung:
Tätigkeit
Zeitaufwand in Stunden
Einarbeitung in Projektthema
8
Planung
11
Umsetzung
Datenbank erstellen
2
Programmlogik
9
Authentifizierung über Oauth2.0
3
Beziehen der Daten
7
Daten aufbereiten und speichern
10
Anzeige auf Oberfläche
2
Testen
7
Dokumentation
11
Gesamt
70
Geplante Dokumentation:
Die zu erstellende Dokumentation enthält folgende Punkte:
Vorwort
Einführung in Aufgabenstellung
Lastenheft
Pflichtenheft
Projektumsetzung
Datenbank
Authentifizierung
Programmlogik
Datenverarbeitung
Daten beziehen
Aufbereitung der Daten
Graphische Darstellung
Test
Fazit
Zukunft des Projektes
Anhänge
Kurze Erläuterung betrieblicher Fachbegriffe / Abkürzungen:
Begriff
Erläuterung
OAuth 2.0
Google Analytics
API
Scheduling Task