Dieser Beitrag greift einen zunächst schon vor einer Woche publizierten und an dieser Stelle nunmehr übernommenen Eintrag von einer Woche auf und führt diesen an dieser Stelle unter diesem Arbeitstitel weiter fort:
Eine Chronologie wird zu einem Spiegel der Zeit-Geschichte(n)
Warum machen wir das Ganze?
Es liegen jetzt ca. 9000 Beiträge bzw. Einträge auf dieser SPIP-Seite von daybyday.press vor.
Ursprünglich wurde diese Seite unter dem Namen daybyday.info veröffentlicht.
Mit der Änderung in .press sollte signalisiert werden, dass es hier nicht allein um eine Sammlung von Informationen geht, sondern um eine Plattform mit elektronischen Einträgen, die den nationalen wie auch internationalen Standards einer presserechtlich verantwortbaren Publikation genügen.
Damit grenzt sich diese Publikation von anderen reizvollen Möglichkeiten ab, wie sie etwas ein elektronisch geführtes Tagebuch anbieten würde. Auch wenn es gelegentlich den Duktus eines solchen Formats hat, sind in all diesen ganzen Einträgen - außer bei den Zitaten – nur wenige Sätze geschrieben worden, in denen das Wort „ich“ vorkommt.
[Dieses wäre zum Beispiel ein interessanter Prompt, der besagt: „Nenne alle Texte und Stellen, in denen das Wort „ich“ vorkommt. Bilde aus diesen Fundstellen zwei Gruppen: Texte mit Zitaten Dritter, in denen ein „ich“ vorkommt und Texte des Autors, in denen das Wort „ich“ vorkommt.“]
Eine Entscheidung, die mit den Einträgen seit 2026 revidiert wurde, wonach seit Beginn dieses Jahres Einträge nach dem Muster WS_JJJJ-MM-TT zugelassen werden.
Dabei war die Entscheidung für das jeweils zur Darstellung gebrachte Thema auch schon zuvor eine durchaus subjektive, da diese immer auch an dem eigenen persönlichen Erleben des Autors anknüpfte.
Mittel und Wege des komprimierten Einblicks und Überblicks
Das Interessante an dem seit einigen Monaten mit hochkompetenten Freunden aufgenommenen Versuch ist es, sich einen Überblick überall diese Einträge zu verschaffen, sie zeitlich und vor allem die aromatisch zu gliedern und dadurch
– auf der einen Seite Transparenz herzustellen
– und auf der anderen Seite Verbindungen zwischen diesen einzelnen Beiträgen herzustellen.
Schon bisher war es möglich, sich einen solchen Überblick zu verschaffen. Dafür war an dem Kopf der Seite ein Suchfenster eingebaut, über das man mit den üblichen Methoden herausfinden konnte, ob es Texte zu einem bestimmten in dem Suchfenster eingetragenen Stichwort gibt. Was leider nicht möglich war, oder nicht mehr möglich ist, dass diese Suchworte dann an den jeweiligen Fundorten mit einer gelben Fläche unterlegt werden oder wurden.
Dieses Verfahren wurde vereinzelt von den LeserInnen, vor allem aber im Rahmen der Redaktion der Texte eingesetzt, um zu zeigen, dass das aktuell angesprochene Thema bereits zu einem früheren Zeitpunkt Gegenstand der Darstellung war.
Nachdem sich aber herausgestellt hat, dass nunmehr von allen bedeutenden KI-Crawlern all diese bislang verfassten Seiten zur weltweiten Nutzung aufgespürt und instrumentalisiert worden sind, stellte sich die Frage, ob sich damit nicht auch neue Möglichkeiten ergeben könnten, diese so angesammelten Textcluster – klassisch Konvolute genannt – mit Hilfe ebendieser Techniken auch neu analysieren lassen.
Die Versuche waren dazu überraschend erfolgreich und sind bereits an verschiedenen Stellen sowohl öffentlich als auch intern dokumentiert. Das machte Mut, hier weiter voranzugehen.
Es wurden mit den unterschiedlichsten auf dem Markt angebotenen Systemen eine Reihe von Versuchen gestartet und systematisch ausgewertet. Die von den unterschiedlichen Firmen bereitgestellten Tools waren von unterschiedlicher, aber insgesamt durchaus beeindruckender Effizienz. Es wurde alsbald deutlich, dass es mit dem Einsatz dieser Systeme möglich sein könnte, das bisher nur nach Tagen geordnete Konvolut nun auch nach anderen Kriterien zu ordnen und zu präsentieren - oder zumindest eine Basis dafür zu schaffen, dass mit diesem Vorgehen eine höhere Transparenz über diese bisherigen Eintragungen hergestellt werden kann.
Dabei wurden im Verlauf dieser Versuche nicht nur kostenfreie, sondern auch kostenpflichtige Systeme zum Einsatz gebracht. Aber selbst dann stellte sich heraus, dass auch diese nicht wirklich zielführend dafür eingesetzt werden konnten, um das gesamte hier zusammengestellte Material einer systematischen Auswertung zuzuführen.
Zitat Marco: „Ich bin sehr beeindruckt davon, was jetzt gerade passiert, und doch glaube ich, dass wir bislang nur an der Oberfläche kratzen. Ich bin überrascht, wie simpel es eigentlich ist, zu einem solchen Quantensprung zu kommen, wie schnell diese relativ dummen Modelle extrem hilfreich sein können.“
Was das bisherige Vorgehen gezeigt hat: Dass es selbst aus dem in der Gesamtheit eingespielten Material möglich ist, dieses nicht nur zu transkodieren, sondern in Form einer Vektordatenbank zu organisieren, zu strukturieren und daraus eine Schritt-für-Schritt-Check-/ und To-do-Liste zu erstellen.
Das Besondere aber, was darüber hinausweist: Dass Themen und Zusammenhänge aufgezeigt werden, die man bisher so noch gar nicht auf dem Schirm hatte, oder die sich sogar erst durch den Einsatz dieser Werkzeuge neu entdecken lassen. Wohl wissend, dass dies auch dazu führen kann, auf falsche Fährten gelockt zu werden, die bei der Erschließung des Materials nicht hilfreich, sondern eher verwirrend sein können.
Bestehende Grenzen und die Entdeckung anderer Möglichkeiten
Wenn sich also trotz all der beeindruckenden Möglichkeiten die bisher kommerziellen Systeme nicht wirklich in dem hier gewollten Sinne umfassend einsetzen lassen, so stellt sich die Frage, ob es hier mit den Möglichkeiten von
– Open Source- und
– On-premise- Anwendungen.
nicht vielversprechende Alternativen gibt, deren Erprobung sich zumindest anbieten würden: Also weg von den nur cloudbasierten Datenbanken und hin zu simpleren Modellen, die sich dennoch – oder gerade deswegen - als performante Alternativen anbieten. Selbst dann, wenn diese nicht so schnell wären und bisher von den großen kommerziellen Anbietern noch nicht ausreichend ‚gewürdigt‘ werden.
Aus den bisherigen für eine solche Vektor-Prozession angelegten Themenvielzahl wurden für den Beginn zwei Schwerpunkte definiert, zu denen auch schon Aussagen vorliegen
– Orientierung an geografischen Parametern
– Orientierung an den klassischen Parametern einer Voll-Redaktion.
Es gibt zwei Möglichkeiten, entweder modellhaft zu einem dieser Schwerpunkte ein Arbeitsmodell anzulegen, oder zunächst einmal das Konvolut zu entschlacken, zum Beispiel von allen angekündigten, aber nicht kommentierten Veranstaltungen – Stichwort „No-Show“ - zu befreien.
Genauso, wie in der bisher publizierten Version das jeweilige Datum des Eintrags die Referenz ausmacht, wäre es durchaus möglich, auch den jeweiligen Bezugsort des Geschehens als den Ordnungsrahmen aufzuziehen. Hierzu wurden diese ersten Überlegungen skizziert:
Das gilt natürlich für alle in diesen Texten selbst erwähnten Orte. Aber es wäre noch viel spannender, darüber hinaus herauszufinden, ob auch aus den jeweiligen thematischen Zusammenhängen geografische Bezüge abgeleitet werden könnten. Eine dritte Gruppe von Beiträgen würde sich dadurch anordnen lassen, da in diesen immer ein gewisser Reisezeitraum abgebildet wird. Und: Ein weiteres Kriterium wäre die Frage, ob die jeweils benannten oder ausanalysierten Orte an dem Tag der Beschreibung vom Autor selbst besucht, oder von diesem jeweils nur benannt wurden. Daraus wiederum könnte abgeleitet werden, in welchen Regionen die thematischen Schwerpunkte der Beiträge verankert sind, einerseits, beziehungsweise, welche dieser Regionen/Orte aufgrund persönlicher Erfahrungen erwähnt, oder in besonderer Weise berücksichtigt wurden.
Über den zweiten hier angesprochenen thematischen Vektor in der Phalanx eines Themenkataloges einer klassischen Zeitungsredaktion wurde ebenfalls ein erstes Arbeitspapier vorgelegt:
Die Frage ist und bleibt, mit welchem möglichst simplen Tool es gelingen könnte, diese zeitlichen, geografischen oder editorischen Dimensionen aufzuschließen. Und ob dieses mit zunächst zehn und dann hundert, dann aber tausend oder schließlich zehntausend Artikeln gelingt.
[wird fortgesetzt]