Unscharfe Suche für Terme geringer Frequenz in einem großen Korpus
Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen:
https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-201101107278
https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-201101107278
Langanzeige der Metadaten
DC Element | Wert | Sprache |
---|---|---|
dc.contributor.advisor | Prof. Dr. Kai-Uwe Kühnberger | |
dc.creator | Gerhards, Karl | |
dc.date.accessioned | 2011-01-10T13:52:34Z | |
dc.date.available | 2011-01-10T13:52:34Z | |
dc.date.issued | 2011-01-10T13:52:34Z | |
dc.identifier.uri | https://osnadocs.ub.uni-osnabrueck.de/handle/urn:nbn:de:gbv:700-201101107278 | - |
dc.description.abstract | Until now infrequent terms have been neglected in searching in order to save time and memory. With the help of a cascaded index and the introduced algorithms, such considerations are no longer necessary. A fast and efficient method was developed in order to find all terms in the largest freely available corpus of texts in the German language by exact search, part-word-search and fuzzy search. The process can be extended to include transliterated passages. In addition, documents that contain the term with a modified spelling, can also be found by a fuzzy search. Time and memory requirements are determined and fall considerably below the requests of common search engines. | eng |
dc.rights | Namensnennung-NichtKommerziell-KeineBearbeitung 3.0 Unported | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/ | - |
dc.subject | Suche Retrieval Assoziativspeicher | ger |
dc.subject | Fuzzy Search Retrieval Corpus Assoziative Memory | eng |
dc.subject.ddc | 020 - Bibliotheks- und Informationswissenschaften | |
dc.subject.ddc | 830 - Deutsche und verwandte Literaturen | |
dc.title | Unscharfe Suche für Terme geringer Frequenz in einem großen Korpus | ger |
dc.title.alternative | Fuzzy Search for Infrequent Terms in a Large Corpus | eng |
dc.type | Dissertation oder Habilitation [doctoralThesis] | - |
thesis.location | Osnabrück | - |
thesis.institution | Universität | - |
thesis.type | Dissertation [thesis.doctoral] | - |
thesis.date | 2010-12-16 | - |
dc.contributor.referee | PD Dr. Helmar Gust | |
dc.subject.bk | 54.82 - Textverarbeitung | |
dc.subject.bk | 06.74 - Informationssysteme | |
dc.subject.ccs | E.2 - DATA STORAGE REPRESENTATIONS | |
dc.subject.ccs | I.5.2 - Design Methodology | |
ddb.annotation | Selten vorkommende Terme wurden bei der Suche bisher vernachlässigt, um Zeit und Speicherplatz zu sparen. Mit einem kaskadierten Index und den vorgestellten Algorithmen sind solche Rücksichten nicht mehr erforderlich. Für das größte frei verfügbare Korpus mit Texten in deutscher Sprache wurde ein schnelles und effizientes Verfahren entwickelt, um alle Terme im Korpus mit exakter Suche, Teilwortsuche und unscharfer Suche aufzufinden. Das Verfahren ist erweiterungsfähig um transliterierte Textstellen. Darüber hinaus werden mit einer unscharfen Suche auch die Dokumente gefunden, die den Term in einer abgewandelten Schreibweise enthalten. Zeit- und Speicherbedarf werden ermittelt und unterschreiten die Anforderungen verbreiteter Suchmaschinen erheblich. | ger |
vCard.ORG | FB8 | |
Enthalten in den Sammlungen: | FB08 - E-Dissertationen |
Dateien zu dieser Ressource:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
thesis_gerhards.pdf | Präsentationsformat | 2,13 MB | Adobe PDF | thesis_gerhards.pdf Öffnen/Anzeigen |
Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons