Bugfixing BR Crawler für neue Architektur
Created by: pidoubleyou
Bugs in BR-Crawler für neue Architektur:
-
Als Datum/Zeit wird teilweise die Ausstrahlung der Wiederholung verwendet. Beispielsendungen Unser Land, Wir in Bayern -
Sendungen ohne Datum/Zeit: möglicherweise Einzelbeiträge aus Sendungen wie z.B. Frankenschau, Gut zu Wissen -
Sendungen mit falscher Thema/Titel-Zuordnung: vermutlich sind das alles Einzelbeiträge aus Sendungen wie z.B. Frankenschau, Gut zu Wissen -
Untertitel sind vtt-Dateien, MV-Client erwartet aber ttml -
Geo-Kennzeichnungen fehlen -
Videos für viele Einträg nicht mehr verfügbar. Könnte vermutlich durch Filterung auf Verfügbarkeit des Videos in der Query gelöst werden. -
Crawler berücksichtigt Konfiguration zu Subpages, Zeiträumen usw. nicht. Dauer des Suchlaufs kann somit nicht durch Konfigurationsanpassung beeinflusst werden. -
Todo in BrClipDetailsDeserializer (Zeile 285) prüfen und ggf. erledigen => vermutlich geht es um die fehlende Geo-Erkennung -
BR_API_URL aus Config entfernen -
Refactoring des Crawlers: der Code hat sehr viele Sonar-Warnings, sehr lange Methoden und kaum Tests