Zwischenzeitlich sind die weiteren Features verfügbar: 

Zum einen der Filter:
Aus den vorhandenen Daten der vergangenen 24h werden die 7 meist-kommentierten Keywords ausgewählt und hier als Filter angeboten. Im Anschluss werden nur noch die Artikel aus den vergangenen 7 Tagen angezeigt, die dieses Keyword enthalten.

Zum anderen 4 Sortier-Strategien für die Artikel:

  • "Jetzt" sortiert nach der Anzahl der Kommentare innerhalb des letzten Stundenzeitraums
  • "Heute" sortiert nach der Anzahl der Kommentar seit Mitternacht
  • "Gesamt" sortiert nach Gesamtanzahl der Kommentare auf die Artikel
  • "Datum" entspricht der Reihenfolge der Artikel, wie sie auch in den 7-Tage-News erscheinen

In allen Fällen werden bis zu 10 Artikel angzeigt.

Probleme der Praxis

Leider hat sich gezeigt, dass die Liste der 7-Tage-News der Auswertung dann doch immer mal wieder Steine in den Weg wirft:

Hierfür gibt es (nach aktuellem Stand) zwei Gründe:

  1. eingestreute plus-Artikel
    Immer mal wieder werden plus-Artikel in die 7-Tage-News eingestreut. Diese bekommen zwar ein in die Liste passendes Veröffentlichungsdatum. Wenn man sich den Artikel dann aber ansieht, stellt man fest, dass dieser deutlich früher veröffentlicht wurde -- teilweise sogar Jahre früher. Entsprechend hat dieser Artikel bereits etliche Kommentare aufgesammelt. Da der Algorithmus das Delta der Kommentar-Zahlen zwischen zwei Abfragen betrachtet, kommt es zwangsläufig zu einem Peak in den Kommentarzahlen.
    Diese Ausreißer werden zwischenzeitlich berücksichtigt: Die Artikel werden erkannt und ignoriert.

  2. verspätet eingestellte Artikel
    Teilweise tauchen Artikel erst etliche Stunden nach ihrer ursprünglichen Veröffentlichung in den 7-Tage-News auf. Sie sind dort dann auch mit dem korrekten Zeitstempel einsortiert, sammeln in diesen Stunden aber dennoch bereits Kommentare auf, die dann zu diesen Peaks führen. Erkennbar sind sie nur an der Differenz zwischen Veröffentlichungszeitstempel und erstem Auftreten in den 7-Tage-News.
    Für diese Ausreißer gibt es noch keine optimale Lösung, daher Bitte einstweilen nicht wundern, dass diese Peaks das Bild stören.

Es hat eine Weile gedauert, aber nun gibt es ein neues Feature auf heisemining.de: Das Heisebarometer!

 

Grundidee war es, einen aktuellen Überblick über die Aktivität in den Artikel-Foren auf heise.de zu bekommen: Zu welchen Artikeln wird gerade intensiv diskutiert? Welche Themen (= Keywords) trenden gerade? Wo ging es im Laufe der Woche heiß her?

Dazu ruft nun ein Script ein Mal pro Stunde die 7-Tage-Seite des Heise-Newsticker ab und analysiert die gefundenen Artikel. In dieser Analyse enthalten: Die im Artikel verwendente Keywords sowie die Differenz der Kommentarzahlen zur vorhergehen Stunde. Auf diese Weise ergibt sich ein schöner Überblick, auf welchen Themen das Heise-Forum aktuell am diskutieren ist.

Die Darstellung startet mit der Übersicht der Kommentare pro Keyword, gewichtet nach ihren Häufigkeiten der letzten 24h. Die Linien haben ein Mouse-Over und zeigen dann das zugehörige Keyword. Insgesamt werden die 15 meistverwendeten Keywords visualisiert und in der Legende -- die als Mouse-Over verschwindet -- den Farben zugeordnet.

 

Es folgt eine Ansicht, wie sie so ähnlich auch schon auf heisemining.de (--> der Analyse im Archiv des Heise-Newstickers) zu finden ist:

Als Anhaltspunkt für die Gesamtaktivität in den Foren werden im zweiten Chart die pro Stunde eintreffenden Kommentare über alle Artikel-Foren hinweg dargestellt. Diese Grafik kann ganz hilfreich sein, die Aktivität in einzelnen, konkreten Foren besser einzuordnen.

 

Schließlich wird für ausgewählte Artikel der Kommentar-Verlauf ausgewertet und dargestellt:

Die Balken geben wieder die Anzahl der Kommentare pro Stunde wieder, wobei auf der x-Achse insgesamt 7 Tage aufgetragen sind; entsprechend der Dauer, die ein Artikel auch auf heise.de in der 7-Tage-Ansicht zu finden ist. Neben dem Veröffentlichungszeitpunkt des Artikels und einem Link, der direkt auf die Artikel-Seite bei Heise führt, werden 3 Werte für die Forenaktivität ausgerechnet:

  • "Jetzt" entspricht der Anzahl der Kommentar aus dem letzten 1h-Zeitraum.
  • "Heute" summiert die Kommentare aus den vergangenen 24h auf.
  • "gesamt" entspricht der Gesamt-Anzahl der Kommentare, so wie sie auch auf der Newsticker-Seite zu finden ist.

Dargestellt werden (zur Zeit) die Charts für insgesamt 10 Artikel mit den größsten "Jetzt"-Werten; sortiert in absteigender Reihenfolge.
Teilweise kann es in den Charts zu negativen Werten kommen. Dies sind dann Zeitpunkte, zu denen die Moderatoren aktiv geworden sind und Kommentare oder gar ganze Threads besperrt haben. In der Folge wird die Gesamtzahl der Kommentare kleiner und führt in der Differenz zu einem negativen Wert.

 

Für die Zukunft sind verschiedene Features bereits geplant:

  • Umschaltung der Sortierung nach "Heute" und "gesamt", statt nur nach "Jetzt".
  • Filterung der Artikel nach Trending Keywords
  • Vielleicht noch die eine oder andere Optimierung der Darstellungen