Wie funktioniert Carwatch?
Kern von Carwatch.net ist eine Suchmaschine. Während jedoch klassische Internetsuchen darauf ausgerichtet sind, relevante Webseiten mittels Suchwörtern zu identifizieren, bedarf Carwatch um vieles mehr: Neben reinen Webseiten müssen auch Dokumente und Datenbankinhalte analysiert werden. Suchergebnisse müssen inhaltlich interpretiert, strukturiert abgelegt und miteinander verknüpft werden. Hierbei sind gleichzeitig beispielsweise auch unterschiedliche Sprachen zusammenzuführen, Dubletten zu bereinigen und Synonyme zu erkennen. All das muss sich dem Anwender als eine fertige Anwendung erschließen. Wir sprechen in diesem Zusammenhang von einer such-basierten Anwendung, einer Search Based Application (SBA).
Search Based Application
Carwatch.net baut auf der bewährten Big Data Analytics-Technologie des Software-Frameworks PLEXALYTICS der Pumacy Technologies AG auf. Im Kern von Plexalytics läuft eine Searched Based Application-Engine, die für die oben genannten Aufgaben die entsprechenden Werkzeuge mitbringt, wie
- einen Index der die im Rahmen der Suchabfragen erhaltenen Ergebnisse speichert,
- einen Crawler der automatisch zeitgesteuert aus verschiedenen Datenquellen die relevanten Inhalte liest,
- verschiedene Konnektoren zu Datenbanken,
- zahlreiche Funktionsbausteine, die die Daten parsen, bereinigen, übersetzen, strukturieren etc. und nicht zuletzt
- skalierungsrelevante Technologien, mit denen die Datenmassen beherrscht und Suchen mit akzeptabler Geschwindigkeit ausgeführt werden können.
SBA: Suchbasierte Anwendung (Search-based Application)
Eine Suchbasierte Anwendung (SBA) ist Softwareanwendung, bei der eine Suchmaschinenplattform als Basisinfrastruktur für den Zugriff auf Informationen und die Berichterstellung verwendet wird. SBA verwenden semantische Technologien, um unstrukturierte, semi-strukturierte oder strukturierte Inhalte über mehrere Repositorys hinweg zu aggregieren, zu normalisieren und zu klassifizieren.