Über den Ideenatlas

Der Ideenatlas ist primär eine Kurations-Engine für Fragen. Er wurde entwickelt, um unausgereifte Ideen zu verorten und verfeinern, Forschungslücken aufzudecken und thematische Verbindungen sichtbar zu machen, deren Existenz man sich noch nicht bewusst war.

1. Die Vision: Vom Suchen zum Finden

Herkömmliche Suchmaschinen basieren auf Keywords. Das schafft ein fundamentales Problem: Um etwas zu finden, muss man bereits wissen, wie es heißt... und dass es überhaupt existiert. Wer eine wahrhaft neue Idee hat, kennt deren akademischen Namen oft noch nicht und bleibt in der eigenen Begrifflichkeit gefangen.

Alternative Ansätze wie Zitationsnetzwerke (Citation Graphs) haben andere Schwächen: Sie erfordern oft ein spezifisches Ausgangspaper und basieren auf subjektiven Metriken der Popularität. Ein exzellentes, aber bisher wenig zitiertes Paper landet dort im toten Winkel. Auch KI-Sprachmodelle (LLMs) sind hier unzuverlässig, da sie als Black Box agieren, Resultate oft halluzinieren und Zufall bei ihren Antworten ein fundamentaler Baustein ist.

Der Ideenatlas schließt diese Lücke durch die Nutzung von aufbereiteten Vektorräumen. Dieser Ansatz bewertet nicht nach Zitationen oder Klickzahlen, sondern so objektiv wie möglich nach rein thematischer und semantischer Nähe. Der zentrale Bewertungsmaßstab ist die Kosinus-Ähnlichkeit (Nähe im Raum), die deterministisch berechnet wird und daher transparent nachvollziehbar ist. Wir geben die Datenhoheit zurück an den Nutzer.

2. Warum ein Atlas? Die Macht der Mustererkennung

Es geht nicht darum, das Denken an eine Maschine auszulagern, sondern die Aufmerksamkeit auf das Unvorhergesehene zu lenken. Eine klassische "Wall of Text" oder abstrakte Liste ist dafür ungeeignet. Der Mensch versteht räumliche und visuelle Zusammenhänge intuitiv viel besser.

Der Ideenatlas projiziert Millionen wissenschaftlicher Dokumente in eine interaktive 2D-Karte. Die hierarchischen Cluster und die Darstellung der nächsten Nachbarn erlauben eine sofortige Diagnose:

Der dichte Fleck: Liegen alle Ergebnisse eng beieinander? Dann ist die Idee fest in einem etablierten Feld verortet.
Die Streuung: Verteilen sich die Ergebnisse über die ganze Karte? Das deutet auf einen interdisziplinären Ansatz hin, der verschiedene "Wissenskontinente" verbindet.
Der Ausreißer: Ein einzelner Nachbar ist extrem weit von allem anderen entfernt? Hier könnte eine interdisziplinäre Querverbindung vorliegen, die es wert ist, genauer untersucht zu werden.

3. Serendipität: Etwas finden, während man Anderes sucht

Serendipität wird oft als reiner Zufall missverstanden. Doch die Definition enthält eine entscheidende Komponente: Eine unerwartete Entdeckung entsteht dank einem aufmerksamen Verstand. Ohne die eigene Denkarbeit kann Serendipität nicht auftreten.

Wissenschaft findet oft in Silos statt. Ein Algorithmus in der Informatik könnte strukturell identisch mit einem Problem in der Biologie sein; doch die Disziplinen sprechen unterschiedliche Sprachen. Während RAG beispielsweise primär durch die faktische Verbesserung von LLM-Antworten bekannt ist, werden ähnliche Konzepte in der Biologie genutzt, um Genomsequenzen mit Referenzdatenbanken abzugleichen und funktionelle Muster zu identifizieren. Ein Vektorraum kann diese Verbindung technisch herstellen, aber er kann sie nicht interpretieren.

Das System ist darauf ausgelegt, Daten so aufzubereiten, dass diese unerwarteten Brücken sichtbar werden. Doch das Erkennen des Wertes der Ergebnisse bleibt beim Nutzer. Der Atlas liefert die Karte, der Nutzer muss suchen.

4. Die Technologie: RAG ohne G

Für die technisch Interessierten: Das System basiert auf einem hochdimensionalen Vektorraum, der mittels UMAP auf eine viel geringere Dimension projiziert wird. Anschließend identifiziert ein Clustering-Algorithmus (HDBSCAN) die Themenfelder. Mithilfe der Cluster-Zentroiden wird ein neuer Vektorraum gefüllt, was thematische Suchen kontextbasiert ermöglicht.

Man kann den Ansatz am besten als 'RAG ohne G mit Extra-Steps' bezeichnen (Retrieval Augmented Generation, aber ohne die finale Textgenerierung). Anstatt die Suchergebnisse direkt an eine KI zu geben, präsentieren wir die rohen, strukturierten Daten. Die Daten werden nicht für LLMs, sondern für menschliche Nutzer optimiert: mit dynamischen Visualisierungen, angemessener Informationsdichte und maximaler Transparenz. Wir zeigen den Korpus, aus dem das Wissen stammt, und überlassen die Synthese dem intelligentesten Baustein im System: dem Nutzer selbst.

Für den Fall, dass man tatsächlich echtes RAG anwenden wollte, kann man jederzeit die Ergebnisse als Markdown herunterladen und weiterverwenden oder alternativ die API nutzen.

5. Status & Zukunft

Der Ideenatlas ist ein aktives, unabhängiges Forschungsprojekt im Status eines fortgeschrittenen Proof-of-Concept. Neben der aktiven Verbesserung der Website umfasst die To-do-Liste die Weiterentwicklung der Pipeline zur Clusterbildung und eine Erweiterung der Metadaten-Datenbank.

Das langfristige Ziel ist es, diese Form der transparenten, visuellen Recherche als offenes Werkzeug verfügbar zu halten - ohne Tracking, ohne Werbung und mit striktem Fokus auf wissenschaftlicher Integrität.

Notice on Data Processing

What is your goal?

Extracted Idea:

Cluster Hierarchy:

Download Options