Startseite > Kalender-Artikel > DbD: SPIP-Code meets AI

DbD: SPIP-Code meets AI

Freitag 13. März 2026, von Dr. Wolf Siegert

AUCH DIESER BEITRAG KANN DERZEIT NICHT UNTER EINSATZ ALLER BEREITGESTELLTER QUELLEN UND ZITATE VORGETRAGEN WERDEN, DA DIESE SEITE - UND SEI ES WEGEN IHRES GROSSEN ZUSPRUCHS - ZEITWEISE GAR NICHT MEHR AUFGERUFEN WERDEN KONNTE UND DAHER AUF DEN REINEN HTML5-CODE REDUZIERT WERDEN MUSSTE.

Dieser Beitrag greift einen schon vor einer Woche publizierten und an dieser Stelle nunmehr übernommenen Eintrag nochmals auf und führt diesen hier unter diesem Arbeitstitel weiter fort:

Eine Chronologie wird zu einem Spiegel der Zeit-Geschichte(n)

Warum machen wir das Ganze?

Es liegen jetzt ca. 9000 Beiträge bzw. Einträge auf dieser SPIP-Seite von daybyday.press vor.
Ursprünglich wurde diese Seite unter dem Namen daybyday.info veröffentlicht.
Mit der Änderung in .press sollte signalisiert werden, dass es hier nicht allein um eine Sammlung von Informationen geht, sondern um eine Plattform mit elektronischen Einträgen, die den nationalen wie auch internationalen Standards einer presserechtlich verantwortbaren Publikation genügen sollen.

Damit grenzt sich diese Publikation von anderen reizvollen Möglichkeiten ab, wie sie etwas ein elektronisch geführtes Tagebuch anbieten würde. Auch wenn es gelegentlich den Duktus eines solchen Formats hat, sind in all diesen ganzen Einträgen - außer bei den Zitaten – nur wenige Sätze geschrieben worden, in denen das Wort „ich“ vorkommt. [1]

Eine Entscheidung, die mit den Einträgen seit 2026 revidiert wurde, wonach seit Beginn dieses Jahres Einträge nach dem Muster WS_JJJJ-MM-TT zugelassen werden. Dabei war die Entscheidung für das jeweils zur Darstellung gebrachte Thema auch schon zuvor eine durchaus subjektive, da diese immer auch an dem eigenen persönlichen Erleben des Autors anknüpfte.

Mittel und Wege des komprimierten Einblicks und Überblicks

Das Interessante an dem seit einigen Monaten mit hochkompetenten Freunden aufgenommenen Versuch ist es, sich einen Überblick über all diese Einträge zu verschaffen, sie zeitlich und vor allem aber auch thematisch zu gliedern und dadurch
  auf der einen Seite Transparenz herzustellen
  und auf der anderen Seite Verbindungen zwischen diesen einzelnen Beiträgen herzustellen.

Schon bisher war es möglich, sich einen solchen Überblick zu verschaffen. Dafür war an dem Kopf der Seite ein Suchfenster eingebaut, über das man mit den üblichen Such-Wort-Methoden herausfinden konnte, ob es Texte zu einem bestimmten in dem Suchfenster eingetragenen Stichwort gibt. Was leider nicht möglich war, oder nicht mehr möglich ist, dass diese Suchworte dann an den jeweiligen Fundorten mit einer gelben Fläche unterlegt werden oder wurden [2]

Dieses Verfahren wurde vereinzelt von den LeserInnen, vor allem aber im Rahmen der Redaktion der Texte eingesetzt, um zu zeigen, dass das aktuell angesprochene Thema bereits zu einem früheren Zeitpunkt Gegenstand der Darstellung war.

Bewährt hat sich auch die Möglichkeit, möglichst schnell und wenigen Klicks durch die Gesamtzahl der Jahre und innerhalb dieser der einzelnen Monate navigieren zu können.

Mit der Koppelung dieser beiden, der text- und der zeitbasierten Suche, war es möglich, unkompliziert und zielgerichtet zu früher verfassten Beiträgen zu gelangen.

Nachdem sich aber herausgestellt hat, dass nunmehr von allen bedeutenden KI-Crawlern all diese bislang verfassten Seiten zur weltweiten Nutzung aufgespürt und instrumentalisiert worden sind, stellte sich die Frage, ob sich damit nicht auch neue Möglichkeiten ergeben könnten, diese so angesammelten Textcluster – klassisch Konvolute genannt – mit Hilfe ebendieser Techniken neu analysieren zu lassen.

Erste dazu Versuche waren überraschend erfolgreich und sind bereits an verschiedenen Stellen sowohl öffentlich als auch intern dokumentiert. Das machte Mut, hier weiter voranzugehen.

Es wurden mit den unterschiedlichsten auf dem Markt angebotenen Systemen eine ganze Reihe von Versuchen gestartet und systematisch ausgewertet. Die von den unterschiedlichen Firmen bereitgestellten Tools waren von unterschiedlicher, aber insgesamt durchaus beeindruckender Effizienz.

Es wurde alsbald deutlich, dass es mit dem Einsatz dieser Systeme möglich sein könnte, das bisher nur nach Tagen geordnete Konvolut nun auch nach anderen Kriterien zu ordnen und zu präsentieren wären - oder dass sie zumindest eine Basis dafür zu schaffen, dass mit diesem Vorgehen eine höhere Transparenz über diese bisherigen Eintragungen hergestellt werden kann.

Welcher Zweck ’heiligt’ welche Mittel?

Dabei wurden im Verlauf dieser Versuche nicht nur kostenfreie, sondern auch kostenpflichtige Systeme zum Einsatz gebracht. Aber selbst dann stellte sich heraus, dass selbst kostenpflichtige Tools nicht wirklich zielführend dafür eingesetzt werden konnten, um das gesamte hier zusammengestellte Material einer systematischen Auswertung zuzuführen.

Zitat Marco S.: „Ich bin sehr beeindruckt davon, was jetzt gerade passiert, und doch glaube ich, dass wir bislang nur an der Oberfläche kratzen. Ich bin überrascht, wie simpel es eigentlich ist, zu einem solchen Quantensprung zu kommen, wie schnell diese relativ dummen Modelle extrem hilfreich sein können.“

Was das bisherige Vorgehen gezeigt hat: Dass es aus dem in der Gesamtheit eingespielten Material möglich sein könnte, dieses nicht nur zu transkodieren, sondern in Form einer Vektordatenbank zu organisieren, und zu strukturieren.

Das Besondere aber, was bei einem solchen Vorgehen darüber hinausweist: Dass Themen und Zusammenhänge aufgezeigt werden, die man bisher so noch gar nicht auf dem Schirm hatte, oder die sich sogar erst durch den Einsatz dieser Werkzeuge neu entdecken lassen. Wohl wissend, dass dies zwar dazu führen kann, auf falsche Fährten gelockt zu werden, die bei der Erschließung des Materials nicht hilfreich, sondern eher verwirrend sein können, dass aber in allen Fällen das hier vorgestellte Material durch die Authentizität der Quellen und/oder der eigenen Autorenschaft ausgewiesen ist.

Bestehende Grenzen und die Entdeckung anderer Möglichkeiten

Wenn sich also trotz all der beeindruckenden Möglichkeiten die bisher kommerziellen Systeme nicht wirklich in dem hier gewollten Sinne umfassend einsetzen lassen, so stellt sich die Frage, ob es hier mit den Möglichkeiten des Einsatzes von
  Open Source- und
  On-premise- Anwendungen.
nicht vielversprechende Alternativen gibt, deren Erprobung sich zumindest anbieten würden: Also weg von den nur cloudbasierten Datenbanken und hin zu simpleren Modellen, die sich dennoch – oder gerade deswegen - als performante Alternativen anbieten. Selbst dann, wenn diese nicht so schnell wären und bisher von den großen kommerziellen Anbietern noch nicht ausreichend ‚gewürdigt‘ werden.

Dass das keine reine Zukunftsmusik bleiben muss, haben bisher mehrere Entwicklungen hinreichend gezeigt; heute noch - und nur - in der Cloud, ein halbes Jahr danach schon als Beta- oder gar Vollversion auf dem Laptop.

Aus den bisherigen für eine solche Vektor-Prozession angelegten Themenvielzahl wurden für den Beginn zwei Schwerpunkte definiert, zu denen schon viele Aussagen und Bezüge vorliegen
  Orientierung an geografischen Parametern
  Orientierung an den klassischen Parametern einer Voll-Redaktion.

Es gibt zwei Möglichkeiten: Entweder modellhaft zu einem dieser Schwerpunkte ein Arbeitsmodell anzulegen, oder zunächst einmal das Konvolut zu entschlacken - zum Beispiel von allen angekündigten, aber nicht kommentierten Veranstaltungen, Stichwort „No-Show“, zu befreien.

Genauso, wie in der bisher publizierten Version das jeweilige Datum des Eintrags die Referenz ausmacht, wäre es durchaus möglich, auch den jeweiligen Bezugsort des Geschehens als den Ordnungsrahmen aufzuziehen. [3]. Das gilt für alle in diesen Texten selbst erwähnten Orte. Aber es wäre noch viel spannender, darüber hinaus herauszufinden, ob auch aus den jeweiligen thematischen Zusammenhängen geografische Bezüge abgeleitet werden könnten?

Eine dritte Gruppe von Beiträgen würde sich dadurch anordnen lassen, dass in diesen immer ein gewisser Reisezeitraum abgebildet wird. Und: Ein weiteres Kriterium wäre die Frage, ob die jeweils benannten oder aus-analysierten Orte an dem Tag der Beschreibung vom Autor selbst besucht, oder von diesem jeweils nur benannt wurden. Daraus wiederum könnte abgeleitet werden, in welchen Regionen die thematischen Schwerpunkte der Beiträge verankert sind, oder welche dieser Regionen/Orte aufgrund persönlicher Erfahrungen erwähnt, oder in besonderer Weise berücksichtigt wurden.

Über den zweiten hier angesprochenen thematischen Vektor in der Phalanx eines Themenkatalogs einer klassischen Zeitungsredaktion wurde ebenfalls ein erstes Arbeitspapier vorgelegt:

DbD: Monitoring & Meaningful Datamining

Die Frage ist und bleibt, mit welchem möglichst simplen Tool es gelingen könnte, diese zeitlichen, geografischen oder editorischen Dimensionen aufzuschließen. Und ob dieses mit zunächst zehn und dann hundert, dann aber tausend oder schließlich zehntausend Artikeln gelingt.

Authentische Intelligenz

Die Dauerausstellung im Heinz Nixdorf Museumsforum ist mit dem Titel überschrieben: The World at your Finger Tipps. History of the Internet. Und als die erste Einträge in dieser. Plattform erschienen, waren gerade erst die ersten digitalen Brockhaus Companions erschienen.. Nach mehr als gut 20 Jahren tagtäglicher Einträge in dieser Plattform hat sich die Welt nicht nur um diese herum, sondern auch technisch in dieser massgeblich geändert. Dennoch ist bis zu diesem Zeitpunkt das Erscheinungsbild eines Monatskalenders als prägendes, ja ikonisches Element dieser Darstellung erhalten geblieben. Und - soweit zu sehen - auch bislang nach wie vor einzigartig:

Mit der zweiten Attacke auf eben diese Plattform war es aktuell notwendig, alle darin eingebundenen optischen und akustischen Elemente auszuschliessen. Und nur noch reinen HTML Code zu verwenden, um überhaupt noch die bisherige Arbeit in eingeschränktem Maße weiterführen zu können.

Dass es überhaupt möglich war, in einem vergleichsweise so langen Zeitraum ein in sich konsistentes Bild zu erhalten, zu bewahren und weiter zu pflegen, ist erstaunlich. Die aktuellen Angriffe auf das System erfordern aber dennoch ein radikales Umdenken.

So wird voraussichtlich zweierlei passieren: Die jetzt hier zur Darstellung gebrachten Möglichkeiten, werden ausschließlich unter Einsatz der unter HTML 5 programmierbaren Zugänge weiterhin zur Verfügung gestellt werden. Und gleichzeitig und darüber hinaus wird das optische Element durch eine erweiterte Aufarbeitung der thematischen Möglichkeiten ergänzt werden. Wir nennen das hier einfach mal "Wolfs Wide Web". Gemeint ist damit folgendes:

In Zukunft könnte es möglich sein, einen virtuellen Wolf Siegert wie eine im Netz verfügbare KI anzusprechen, um von diesem zu erfahren, was er an einem bestimmten Tag und / oder zu einem bestimmten Thema in den vergangenen gut 20 Jahren zu sagen gehabt hatte. Damit leistet eine solche Plattform für die Zukunft genau das, was auch bisherige LMMs anbieten können: Die Zusammenfassung von auf Datenträgern subsumierten. Einträgen. Und ihre Aufgliederung? Nach bestimmten, durch Fragen definierten Auswahlkriterien.


Während dieser Text noch in Arbeit ist, treffen Reaktionen von den EDV-’Altvorderen’ ein und verweisen auf Expertensysteme, die sie schon vor mehr als einer Generation in Verwendung hatten, wie den VP-Expert von Paperback Software:

Die weitere Kommentierung und Einbindung dieser Screenshots steht noch aus:

https://copilot.microsoft.com/shares/5NAJEooYzBohoiiyaPWEQ


[1Dieses wäre ein interessanter Prompt, der besagt: „Nenne alle Texte und Stellen, in denen das Wort „ich“ vorkommt. Bilde aus diesen Fundstellen zwei Gruppen: Texte mit Zitaten Dritter, in denen ein „ich“ vorkommt und Texte des Autors, in denen das Wort „ich“ vorkommt.“

[2Womit bereits eines der ’to-do’s für die nächste Auflage ins Lastenheft eingetragen wäre.

[3Hierzu wurden diese ersten Überlegungen skizziert:

DbD: Geografische-Themen-Such-Vorschläge