Auch bei riesigen Datenmengen ist es für ikon kein Problem,
in kürzester Zeit daraus relevante, detaillierte Ergebnisse
zu filtern – dank der eigens entwickelten effizienten Suchtechnologie
von Collexis.
Ihr entscheidender Vorteil liegt darin, dass bei einer Suchanfrage
nicht die Dokumente selbst gescannt werden, sondern nur deren "fingerprints".
Die kennzeichnen ihre Quelle genau so eindeutig und unverwechselbar,
wie es ein menschlicher Fingerabdruck mit seinem Träger tut.
Erzeugt werden die fingerprints durch den automatischen Vergleich
der Ausgangsdokumente mit einem Thesaurus des jeweiligen Fachgebiets.
Dieser Vergleich führt zu einer Liste von Begriffen, deren
individuelle Gewichtung für jedes Dokument durch komplexe Algorithmen
berechnet wird. Zusätzlich kann der conceptual fingerprint
auch noch manuell vervollkommnet werden.
Bei der Sucheingabe wird ebenfalls ein fingerprint erzeugt, der
– im Rahmen des Thesaurus beliebig spezifiziert werden
kann. Sein Auftrag lautet: Suche alle Dateien mit ähnlichem
Inhalt und gib den Grad der Ähnlichkeit an. Da die fingerprints
selten größer als 400 bytes sind, geht die Suche blitzschnell:
Für 500 000 fingerprints braucht die Collexis Matching Engine
nicht mehr als 20 Millisekunden.