Effiziente Segmentierung für Semantische Extraktion
Efficient Segmentation for Multimedia Semantic Extraction
Wissenschaftsdisziplinen
Informatik (100%)
Keywords
-
Multimedia,
Image segmentation,
Physics-based image analysis,
Video analysis
Das Ziel des Projektes ist es, leistungsfähige Bildsegmentierungsalgorithmen zur automatisierten Extraktion von Semantik aus Multimediadaten zu entwickeln. Wegen der unermesslichen Menge von Multimediadaten, die zurzeit im World Wide Web verfügbar sind, ist es sehr schwierig genau, ein gewünschtes Bild oder Video zu finden. Eine Anreicherung dieser Daten mit zusätzlichen Schichten automatisch erzeugten semantischen Metadaten sowie mit künstlicher Intelligenz für die Bearbeitung dieser (Meta)Daten, ist die einzige vorstellbare Weise, den komplizierten Inhalt der Daten leicht durchsuchen zu können. Jedoch stellt die automatische Extraktion semantisch reicher Metadaten von systemnahen Merkmalen eine enorme wissenschaftliche und technologische Herausforderung. Die Europäische Union hat diese Herausforderung erkannt, indem sie semantisch-basierte Wissenssysteme als eine der strategischen Zielsetzungen im thematischen Bereich der Informationsgesellschaftstechnologie (IST) des 6. europäischen Rahmenprogramms erklärte. Die PRIP-Gruppe der TU Wien ist Mitglied des MUSCLE (Multimedia Understanding through Semantics, Computation and LEarning) Excellenznetzwerkes (NoE) in diesem Programm. Durch Austausch mit den MUSCLE-Partnern wird es sichergestellt, dass die Forschung, die in diesem FWF-Projekt durchgeführt wird, eine europaweite Auswirkung hat. Die PRIP-Gruppe beabsichtigt, sich auf den Erhalt der besten Merkmale für die Semantikextraktion in Bildern und Videosequenzen zu konzentrieren. Ein mögliches Beispiel ist, ein Segmentierungsalgorithmus, der alle vorhandenen physik-basierten Informationen einer Szene in Betracht zieht, um die Szene in tatsächliche Gegenstände (z.B., Regionen hergestellt aus gleichen Material) anstelle von willkürlichen Regionen, die durch das Beleuchten und Schatten beeinflusst werden, zu segmentieren. Dies würde weitere Verarbeitungsschritte der semantischen Extraktion wesentlich vereinfachen. Unsere Innovation liegt in der Kombination von räumlichen Segmentierungstechniken (z.B., der Watershed-Algorithmus) mit physik-basierten Segmentierungstechniken durch den Gebrauch von Hierarchien der Bildunterteilung. Während unserer Arbeit an diesem Thema, beabsichtigen wir auch, bedeutende Beiträge in den beiden Fachgebieten der mathematischen Morphologie für Farbbilder und der Farbtexturanalyse zu machen.
Das Ziel des Projektes ist es, leistungsfähige Bildsegmentierungsalgorithmen zur automatisierten Extraktion von Semantik aus Multimediadaten zu entwickeln. Wegen der unermesslichen Menge von Multimediadaten, die zurzeit im World Wide Web verfügbar sind, ist es sehr schwierig genau, ein gewünschtes Bild oder Video zu finden. Eine Anreicherung dieser Daten mit zusätzlichen Schichten automatisch erzeugten semantischen Metadaten sowie mit künstlicher Intelligenz für die Bearbeitung dieser (Meta)Daten, ist die einzige vorstellbare Weise, den komplizierten Inhalt der Daten leicht durchsuchen zu können. Jedoch stellt die automatische Extraktion semantisch reicher Metadaten von systemnahen Merkmalen eine enorme wissenschaftliche und technologische Herausforderung. Die Europäische Union hat diese Herausforderung erkannt, indem sie semantisch-basierte Wissenssysteme als eine der strategischen Zielsetzungen im thematischen Bereich der Informationsgesellschaftstechnologie (IST) des 6. europäischen Rahmenprogramms erklärte. Die PRIP-Gruppe der TU Wien ist Mitglied des MUSCLE (Multimedia Understanding through Semantics, Computation and LEarning) Excellenznetzwerkes (NoE) in diesem Programm. Durch Austausch mit den MUSCLE-Partnern wird es sichergestellt, dass die Forschung, die in diesem FWF-Projekt durchgeführt wird, eine europaweite Auswirkung hat. Die PRIP-Gruppe beabsichtigt, sich auf den Erhalt der besten Merkmale für die Semantikextraktion in Bildern und Videosequenzen zu konzentrieren. Ein mögliches Beispiel ist, ein Segmentierungsalgorithmus, der alle vorhandenen physik-basierten Informationen einer Szene in Betracht zieht, um die Szene in tatsächliche Gegenstände (z.B., Regionen hergestellt aus gleichen Material) anstelle von willkürlichen Regionen, die durch das Beleuchten und Schatten beeinflusst werden, zu segmentieren. Dies würde weitere Verarbeitungsschritte der semantischen Extraktion wesentlich vereinfachen. Unsere Innovation liegt in der Kombination von räumlichen Segmentierungstechniken (z.B., der Watershed-Algorithmus) mit physik-basierten Segmentierungstechniken durch den Gebrauch von Hierarchien der Bildunterteilung. Während unserer Arbeit an diesem Thema, beabsichtigen wir auch, bedeutende Beiträge in den beiden Fachgebieten der mathematischen Morphologie für Farbbilder und der Farbtexturanalyse zu machen.
- Technische Universität Wien - 100%
- Jean Serra, Ecole Nationale Superieure des Mines de Paris - Frankreich
- Dmitry Chetverikov, Hungarian Academy of Sciences - Ungarn
Research Output
- 38 Zitationen
- 3 Publikationen
-
2009
Titel Morphological segmentation on learned boundaries DOI 10.1016/j.imavis.2008.06.012 Typ Journal Article Autor Hanbury A Journal Image and Vision Computing Seiten 480-488 Link Publikation -
2007
Titel Multi-label image segmentation via max-sum solver* *Research of B. Micušík has been supported by FWF-P17189-N04 SESAME and FP6-IST-507752 MUSCLE and research of T. Pajdla by FP6-IST-027787 DIRAC and MSM6840770038 DMCM III grants. DOI 10.1109/cvpr.2007.383230 Typ Conference Proceeding Abstract Autor Micušík B Seiten 1-6 Link Publikation -
2007
Titel Do Colour Interest Points Improve Image Retrieval? DOI 10.1109/icip.2007.4378918 Typ Conference Proceeding Abstract Autor Stoettinger J