CRIC: Kontextbasierte Empfehlung unstrukturierter Texte in Echtzeitumgebungen : ein Verfahren zur Bestimmung der semantischen Proximität von Textobjekten auf Basis eines heuristischen asymmetrischen Distanzmaßes

Klahold, André

Zitierlink: https://nbn-resolving.org/urn:nbn:de:hbz:467-2410

Dateien zu dieser Ressource:

Datei	Beschreibung	Größe	Format
klahold.pdf		8.24 MB	Adobe PDF	Öffnen/Anzeigen

Dokumentart:	Doctoral Thesis
Titel:	CRIC: Kontextbasierte Empfehlung unstrukturierter Texte in Echtzeitumgebungen : ein Verfahren zur Bestimmung der semantischen Proximität von Textobjekten auf Basis eines heuristischen asymmetrischen Distanzmaßes
AutorInn(en):	Klahold, André
Institut:	Fachbereich 12, Elektrotechnik und Informatik
Schlagwörter:	recommender systems, content based filtering, personalization
DDC-Sachgruppe:	004 Informatik
GHBS-Notation:	TVVK
Erscheinungsjahr:	2006
Publikationsjahr:	2006
Zusammenfassung:	Die Idee, inhaltlich verwandte Texte automatisiert in Verbindung zueinander zu setzen, ist nicht neu. Der im Rahmen dieser Arbeit vorgestellte Lösungsansatz verfolgt zwei Hauptziele: automatisiert auf Basis unstrukturierter Texte zu arbeiten und eine hohe Anzahl gleichzeitiger Zugriffe zu unterstützen. Es unterscheidet sich von anderen Verfahren im Wesentlichen durch die Ermittlung des semantischen Abstandes zwischen den Texten auf Basis einer asymmetrischen vorberechneten Distanzmatrix. Die Beziehungen zwischen unstrukturierten Textobjekten werden mittels eines, von der Landessprache unabhängigen, heuristischen Algorithmus zur Merkmalsselektion hergestellt. Die resultierende "Wortwolke" wird dann als Anfrageparameter für die Selektion passender Texte verwendet. Dem Benutzer werden zum gerade angezeigten Text inhaltlich verwandte Texte empfohlen. Die Verarbeitungsgeschwindigkeit des Verfahrens wurde in Form der Laufzeitkomplexität der Algorithmen analysiert. Über einen Zeitraum von 12 Monaten wurden außerdem umfangreiche Praxistests auf der Website eines Industriemagazins durchgeführt, um die Effizienz des Verfahrens im Hinblick auf die Qualität der Empfehlungen zu prüfen. Die Ergebnisse zeigen, dass der vorgestellte Ansatz den manuell erstellten Empfehlungen professioneller Redakteure nahezu ebenbürtig ist. The idea to link texts with related content in an automated way is not new. The approach developed and presented here has two main goals: to work automatically on unstructured texts and to support a large number of parallel accesses. It is distinct from other approaches in that it determines the semantic distance between texts on the basis of an asymmetrical precalculated distance matrix. The relations between unstructured text objects are generated by a language independent heuristic algorithm for feature selection. The resulting bag of words is used in a query to select matching texts. The user receives recommendations to texts the content of which is related to the text that appears in front of him. Performance was analyzed on basis of the algorithms runtime complexity. Extensive real-life tests over a period of 12 months were conducted on the website of an industrial magazine in order to check the efficiency of the procedure with regard to quality of the recommendations. Results show that the presented approach nearly equals the quality of manual made recommendations by professional editors.
URN:	urn:nbn:de:hbz:467-2410
URI:	https://dspace.ub.uni-siegen.de/handle/ubsi/241
Lizenz:	https://dspace.ub.uni-siegen.de/static/license.txt
Enthalten in den Sammlungen:	Hochschulschriften

Diese Ressource ist urheberrechtlich geschützt.

Lizenzbestimmungen ansehen

Zur Langanzeige

Seitenansichten

477

checked on 18.05.2024

Download(s)

223

checked on 18.05.2024

Google Scholar^TM

Prüfe

Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt, soweit nicht anderweitig angezeigt.

OPUS Siegen

Dateien zu dieser Ressource:

Seitenansichten

Download(s)

Google ScholarTM

Google Scholar^TM