Intelligent Data Analysis for Information Retrieval on the WWW
Intelligent Data Analysis for Information Retrieval on the WWW
Wissenschaftsdisziplinen
Informatik (100%)
Das vorgeschlagene Projekt ist an der Schnittstelle zweier verwandter Forschungsgebiete angesiedelt: Intelligent Information Retrieval und Intelligent Data Analysis (maschinelles Lernen, induktive logische Programmierung und Wissensgewinnung aus Datenbanken (Data Mining)). Das langfristige Ziel ist eine umfassende Untersuchung des Potentials existierender symbolischer Lernalgorithmen für den Einsatz im Gebiet des Intelligent Information Retrieval und die Lösung der durch die speziellen Anforderungen von Textkategorisierungs- und Textklassifizierungsaufgaben entstehenden Probleme. Gegenstand des beantragten Projekts ist die Entwicklung eines Softwareagenten, der eine solche Aufgabe erfolgreich zu lösen imstande ist. Geplant ist die Entwicklung eines Agenten, der ein Benutzermodell zu lernen imstande ist, wobei die Notwendigkeit der langwährenden Beobachtung des Benutzers, die bestehende Systeme auszeichnet, durch ein Lernen aus Dokumenten, die der Benutzer in seinem Home-Directory abspeichert (wie z.B. die Bookmarks-Files, gespeicherte Newsgroups, Email Messages, usw.), ersetzt werden soll. Dieser Agent zur Benutzer-Modellierung soll autonom agieren und von anderen Informationsagenten (wie z.B. den an der Carnegie- Mellon University entwickelten WebWatcher oder NewsWeeder) interaktiv zu einer Verbesserung ihrer Performanz genützt werden können. Als solches, hoffen wir, daß das implementierte Programm ein nützliches Service für Benützer des WWW darstellen kann. Die Hauptmotivation für die Entwicklung des genannten Agenten ist jedoch seine Verwendbarkeit für weitere Studien im Grenzbereich des Information Retrieval und des maschinellen Lernens. Der Beginn dieser Studien ist bereits für das letzte Drittel des eingereichten Projekts geplant, der Hauptteil wird jedoch nach der Rückkehr des Applikanten am Österreichischen Forschungsinstitut für Artificial Intelligence durchgeführt werden. Für dieses Projekt ist ein Wechsel von der üblicherweise verwendeten Attributvektor-Repräsentation von Textdokumenten zu einem ausdrucksstärkeren Repräsentationsformalismus in Prädikatenlogik erster Stufe geplant. Dieser Repräsentationswechsel macht einen entsprechenden Wechsel von klassischen Algorithmen des maschinellen Lernens zu aufwendigeren Verfahren der induktiven logischen Programmierung notwendig. Eine Kostennutzen Analyse dieses Schrittes sollte den Abschluß des beantragten Projektes bilden. Für eine Fortsetzung des Projektes in Österreich ist die Hinzufügung von weiterem Hintergrundwissen geplant (wie z.B. linguistische und syntaktische Informationen), sowie eine Lösung der damit unweigerlich verbundenen Komplexitätsprobleme. Insbesondere wird hier die Entwicklung neuer Verfahren zur Dimensionalitätsreduktion für Algorithmen der induktiven logischen Programmierung unumgänglich sein.
Research Output
- 85 Zitationen
- 2 Publikationen
-
2002
Titel Hyperlink ensembles: a case study in hypertext classification DOI 10.1016/s1566-2535(02)00090-8 Typ Journal Article Autor Fürnkranz J Journal Information Fusion Seiten 299-312 -
2000
Titel Evolutionary Dynamics of the SGM Transposon Family in the Drosophila obscura Species Group DOI 10.1093/oxfordjournals.molbev.a026259 Typ Journal Article Autor Miller W Journal Molecular Biology and Evolution Seiten 1597-1609 Link Publikation