Unscharfe Suche für Terme geringer Frequenz in einem großen Korpus
Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen:
https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-201101107278
https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-201101107278
Titel: | Unscharfe Suche für Terme geringer Frequenz in einem großen Korpus |
Sonstige Titel: | Fuzzy Search for Infrequent Terms in a Large Corpus |
Autor(en): | Gerhards, Karl |
Erstgutachter: | Prof. Dr. Kai-Uwe Kühnberger |
Zweitgutachter: | PD Dr. Helmar Gust |
Zusammenfassung: | Until now infrequent terms have been neglected in searching in order to save time and memory. With the help of a cascaded index and the introduced algorithms, such considerations are no longer necessary. A fast and efficient method was developed in order to find all terms in the largest freely available corpus of texts in the German language by exact search, part-word-search and fuzzy search. The process can be extended to include transliterated passages. In addition, documents that contain the term with a modified spelling, can also be found by a fuzzy search. Time and memory requirements are determined and fall considerably below the requests of common search engines. |
URL: | https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-201101107278 |
Schlagworte: | Suche Retrieval Assoziativspeicher; Fuzzy Search Retrieval Corpus Assoziative Memory |
Erscheinungsdatum: | 10-Jan-2011 |
Lizenzbezeichnung: | Namensnennung-NichtKommerziell-KeineBearbeitung 3.0 Unported |
URL der Lizenz: | http://creativecommons.org/licenses/by-nc-nd/3.0/ |
Publikationstyp: | Dissertation oder Habilitation [doctoralThesis] |
Enthalten in den Sammlungen: | FB08 - E-Dissertationen |
Dateien zu dieser Ressource:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
thesis_gerhards.pdf | Präsentationsformat | 2,13 MB | Adobe PDF | thesis_gerhards.pdf Öffnen/Anzeigen |
Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons