• Zum Inhalt springen (Accesskey 1)
  • Zur Suche springen (Accesskey 7)
FWF — Österreichischer Wissenschaftsfonds
  • Zur Übersichtsseite Entdecken

    • Forschungsradar
      • Historisches Forschungsradar 1974–1994
    • Entdeckungen
      • Emmanuelle Charpentier
      • Adrian Constantin
      • Monika Henzinger
      • Ferenc Krausz
      • Wolfgang Lutz
      • Walter Pohl
      • Christa Schleper
      • Elly Tanaka
      • Anton Zeilinger
    • Impact Stories
      • Verena Gassner
      • Wolfgang Lechner
      • Georg Winter
    • scilog-Magazin
    • Austrian Science Awards
      • FWF-Wittgenstein-Preise
      • FWF-ASTRA-Preise
      • FWF-START-Preise
      • Auszeichnungsfeier
    • excellent=austria
      • Clusters of Excellence
      • Emerging Fields
    • Im Fokus
      • 40 Jahre Erwin-Schrödinger-Programm
      • Quantum Austria
      • Spezialforschungsbereiche
    • Dialog und Diskussion
      • think.beyond Summit
      • Am Puls
      • Was die Welt zusammenhält
      • FWF Women’s Circle
      • Science Lectures
    • Wissenstransfer-Events
    • E-Book Library
  • Zur Übersichtsseite Fördern

    • Förderportfolio
      • excellent=austria
        • Clusters of Excellence
        • Emerging Fields
      • Projekte
        • Einzelprojekte
        • Einzelprojekte International
        • Klinische Forschung
        • 1000 Ideen
        • Entwicklung und Erschließung der Künste
        • FWF-Wittgenstein-Preis
      • Karrieren
        • ESPRIT
        • FWF-ASTRA-Preise
        • Erwin Schrödinger
        • doc.funds
        • doc.funds.connect
      • Kooperationen
        • Spezialforschungsgruppen
        • Spezialforschungsbereiche
        • Forschungsgruppen
        • International – Multilaterale Initiativen
        • #ConnectingMinds
      • Kommunikation
        • Top Citizen Science
        • Wissenschaftskommunikation
        • Buchpublikationen
        • Digitale Publikationen
        • Open-Access-Pauschale
      • Themenförderungen
        • AI Mission Austria
        • Belmont Forum
        • ERA-NET HERA
        • ERA-NET NORFACE
        • ERA-NET QuantERA
        • ERA-NET TRANSCAN
        • Ersatzmethoden für Tierversuche
        • Europäische Partnerschaft Biodiversa+
        • Europäische Partnerschaft BrainHealth
        • Europäische Partnerschaft ERA4Health
        • Europäische Partnerschaft ERDERA
        • Europäische Partnerschaft EUPAHW
        • Europäische Partnerschaft FutureFoodS
        • Europäische Partnerschaft OHAMR
        • Europäische Partnerschaft PerMed
        • Europäische Partnerschaft Water4All
        • Gottfried-und-Vera-Weiss-Preis
        • netidee SCIENCE
        • Projekte der Herzfelder-Stiftung
        • Quantum Austria
        • Rückenwind-Förderbonus
        • WE&ME Award
        • Zero Emissions Award
      • Länderkooperationen
        • Belgien/Flandern
        • Deutschland
        • Frankreich
        • Italien/Südtirol
        • Japan
        • Luxemburg
        • Polen
        • Schweiz
        • Slowenien
        • Taiwan
        • Tirol–Südtirol–Trentino
        • Tschechien
        • Ungarn
    • Schritt für Schritt
      • Förderung finden
      • Antrag einreichen
      • Internationales Peer-Review
      • Förderentscheidung
      • Projekt durchführen
      • Projekt beenden
      • Weitere Informationen
        • Integrität und Ethik
        • Inklusion
        • Antragstellung aus dem Ausland
        • Personalkosten
        • PROFI
        • Projektendberichte
        • Projektendberichtsumfrage
    • FAQ
      • Projektphase PROFI
      • Projektphase Ad personam
      • Auslaufende Programme
        • Elise Richter und Elise Richter PEEK
        • FWF-START-Preise
  • Zur Übersichtsseite Über uns

    • Leitbild
    • FWF-Film
    • Werte
    • Zahlen und Daten
    • Jahresbericht
    • Aufgaben und Aktivitäten
      • Forschungsförderung
        • Matching-Funds-Förderungen
      • Internationale Kooperationen
      • Studien und Publikationen
      • Chancengleichheit und Diversität
        • Ziele und Prinzipien
        • Maßnahmen
        • Bias-Sensibilisierung in der Begutachtung
        • Begriffe und Definitionen
        • Karriere in der Spitzenforschung
      • Open Science
        • Open-Access-Policy
          • Open-Access-Policy für begutachtete Publikationen
          • Open-Access-Policy für begutachtete Buchpublikationen
          • Open-Access-Policy für Forschungsdaten
        • Forschungsdatenmanagement
        • Citizen Science
        • Open-Science-Infrastrukturen
        • Open-Science-Förderung
      • Evaluierungen und Qualitätssicherung
      • Wissenschaftliche Integrität
      • Wissenschaftskommunikation
      • Philanthropie
      • Nachhaltigkeit
    • Geschichte
    • Gesetzliche Grundlagen
    • Organisation
      • Gremien
        • Präsidium
        • Aufsichtsrat
        • Delegiertenversammlung
        • Kuratorium
        • Jurys
      • Geschäftsstelle
    • Arbeiten im FWF
  • Zur Übersichtsseite Aktuelles

    • News
    • Presse
      • Logos
    • Eventkalender
      • Veranstaltung eintragen
      • FWF-Infoveranstaltungen
    • Jobbörse
      • Job eintragen
    • Newsletter
  • Entdecken, 
    worauf es
    ankommt.

    FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

    SOCIAL MEDIA

    • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
    • , externe URL, öffnet sich in einem neuen Fenster
    • Facebook, externe URL, öffnet sich in einem neuen Fenster
    • Instagram, externe URL, öffnet sich in einem neuen Fenster
    • YouTube, externe URL, öffnet sich in einem neuen Fenster

    SCILOG

    • Scilog — Das Wissenschaftsmagazin des Österreichischen Wissenschaftsfonds (FWF)
  • elane-Login, externe URL, öffnet sich in einem neuen Fenster
  • Scilog externe URL, öffnet sich in einem neuen Fenster
  • en Switch to English

  

Optimale Codegenerierung für Explizit-Parallele Prozessoren

Optimal Code Generation for Explicitly Parallel Processors

Andreas Krall (ORCID: )
  • Grant-DOI 10.55776/P21842
  • Förderprogramm Einzelprojekte
  • Status beendet
  • Projektbeginn 01.10.2009
  • Projektende 31.12.2013
  • Bewilligungssumme 465.213 €
  • Projekt-Website

Wissenschaftsdisziplinen

Informatik (80%); Mathematik (20%)

Keywords

    Compiler, Instruction Level Parallelism, VLIW, Integer Linear Programming, Scheduling, Combinatorial Optimization

Abstract Endbericht

Entwickler von Embedded Systems stehen heute Rechenanforderungen gegenüber, die vor nicht allzu langer Zeit noch Stand der Technik im Supercomputing-Bereich waren. Mit herkömmlichen Techniken und bei gleicher Technologie erfordert eine zwei bis dreifache Geschwindigkeitssteigerung etwa die achtzigfache Chipfläche und etwa die zwölffache Energie -- eine oftmals nicht akzeptable Größenordnung für mobile Anwendungen. Ein vielversprechender Ansatz diese Probleme zu lösen sind VLIW Architekturen mit einer großen Anzahl an parallelen Recheneinheiten und Datenpfaden sowie applikationsspezifische irreguläre Architekturerweiterungen, die für eine bestimmte Anwendung maßgeschneidert werden. Hoch optimierende Übersetzer und spekulative Transformationen sind nötig, um das hohe Maß an Parallelismus in entsprechende Rechenleistung umsetzen zu können. Diese Optimierungen müssen in der Regel unterschiedliche Aspekte sorgfältig gegeneinander abwägen. Vielfach eingesetzte heuristische Techniken sind dabei oft nicht in der Lage dies zufriedenstellend umzusetzen. Darüber hinaus ergeben sich weitere Herausforderungen durch - oftmals applikationsspezifische - irreguläre Architekturerweiterungen und Asymmetrien. Einerseits resultiert daraus ein erheblicher Wartungs- und Entwicklungsaufwand, der mit traditionellen statischen Codegeneratoren nur schwer zu bewältigen ist. Andererseits sind heuristische Übersetzungstechniken oftmals nur unzureichend geeignet um applikationsspezifische Erweiterungen effektiv auszunützen. Optimale Ansätze basierend auf ganzzahliger linearer Programmierung haben das Potential diese Problemstellungen zu bewältigen. Mathematische Formulierungen erlauben eine kombinierte Optimierung unterschiedlicher Teilprobleme und ermöglichen die Modellierung komplexer architektureller Einschränkungen. Letztere können automatisch aus einer generischen Architekturbeschreibung abgeleitet werden. Trotzdem erreichten optimale Verfahren bisher keine wesentliche praktische Bedeutung. Zahlreiche Teilprobleme wie Instruktionsauswahl, Registerallokation oder Instruktionsanordnung sind NP vollständig - naive mathematische Formulierungen führen daher unausweichlich zu inakzeptablen Übersetzungszeiten. Ziel dieses Projektes ist die Entwicklung neuartiger Algorithmen und mathematischer Formulierungen, die die wesentlichen Vorteile von integrierten Codeerzeugungstechniken bewahren und gleichzeitig praktikable Laufzeiten aufweisen. Dazu gehört sowohl die Anwendung von mathematischen Verfahren zur Verringerung der Laufzeit linearer Optimierungssysteme, wie zum Beispiel Cutting-Plane Ansätze, Column-Generation Techniken oder Lagrange Relaxierung. Aufgrund der erheblichen Komplexität einzelner Teilbereiche planen wir darüber hinaus, die entwickelten Modelle zur Identifikation von Schwachstellen existierender Heuristiken und zur Entwicklung effizienter Approximationsalgorithmen zu verwenden. Unsere Schwerpunkte sind die Entwicklung von integrierten Verfahren zur gemeinsamen Behandlung von Instruktionsanordnung und Registerallokation, integrierte Befehlsanordnung für zyklische Programmregionen (Software Pipelining) und Unterstützung von irregulären Architekturen und asymmetrischen Datenpfaden. Ein neuartiges Übersetzungsschema erlaubt uns Teilbereiche der Registerallokation zu separieren und dadurch die Komplexität integrierter Verfahren entscheidend zu verringern.

Der Fokus dieses Forschungsprojekts war optimale und beinahe optimale Maschinencodeerzeugung für Prozessoren mit explizitem Parallelismus. Prozessoren mit explizitem Parallelismus können innerhalb eines Befehlszyklus mehrere Befehle gleichzeitig ausführen, der Programmierer (oder der Übersetzer) muss allerdings explizit angeben, welche Befehle voneinander unabhängig sind und gleichzeitig ausgeführt werden können. Diese Prozessoren werden meistens in eingebetteten Systemen wie Mobiltelefonen verwendet und sie haben oft Hardwareeinschränkungen wie gruppierte Funktionseinheiten und Registersätze, bedingte Ausführung oder rotierbare Registersätze. Maschinencodeerzeugung ist der letzte maschinenabhängige Teil eines Übersetzers und besteht aus Befehlsauswahl, Registerzuteilung, Befehlsanordnung, Softwarepipelining, Bedingungskonvertierung und Gruppierung. Aufgrund der Komplexität der Probleme ist es oft nicht möglich eine optimale Lösung zu finden. Weiters werden die Teilprobleme unabhängig voneinander gelöst, was zu weiteren nicht optimalen Lösungen führt. Das Ergebnis dieses Projekts waren neue heuristische und exakte Methoden für optimale und beinahe optimale Maschinencodeerzeugung. Die heuristischen Methoden liefern fast genauso gute Ergebnisse wie die optimalen Methoden und sind schnell genug, um in Übersetzern zur täglichen Programmentwicklung eingesetzt zu werden.

Forschungsstätte(n)
  • Technische Universität Wien - 100%

Research Output

  • 44 Zitationen
  • 14 Publikationen
Publikationen
  • 2013
    Titel IR-level versus machine-level if-conversion for predicated architectures
    DOI 10.1145/2443608.2443611
    Typ Conference Proceeding Abstract
    Autor Jordan A
    Seiten 3-10
    Link Publikation
  • 2012
    Titel Static profiling of the worst-case in real-time programs
    DOI 10.1145/2392987.2393000
    Typ Conference Proceeding Abstract
    Autor Brandner F
    Seiten 101-110
  • 2011
    Titel Register reuse scheduling.
    Typ Conference Proceeding Abstract
    Autor Barany G
    Konferenz 9th Workshop on Optimizations for DSP and Embedded Systems (ODES'11)
  • 2011
    Titel Fast JIT code generation for x86-64 with LLVM.
    Typ Conference Proceeding Abstract
    Autor Krall A
    Konferenz ACACES 2011 Poster Abstracts, 7, Fiuggi, Italy, 2011. HiPEAC. Posterpräsentation: ACACES 2011, Fiuggi, Italien; 2011-07-10 - 2011-07-16
  • 2014
    Titel Integrated modulo scheduling and cluster assignment for TI TMS320C64x+ architecture
    DOI 10.1145/2568326.2568327
    Typ Conference Proceeding Abstract
    Autor Kim N
    Seiten 25-32
    Link Publikation
  • 2014
    Titel Computation of alias sets from shape graphs for comparison of shape analysis precision
    DOI 10.1049/iet-sen.2012.0049
    Typ Journal Article
    Autor Pavlu V
    Journal IET Software
    Seiten 120-133
    Link Publikation
  • 2014
    Titel Refinement of worst-case execution time bounds by graph pruning
    DOI 10.1016/j.cl.2014.09.001
    Typ Journal Article
    Autor Brandner F
    Journal Computer Languages, Systems & Structures
    Seiten 155-170
  • 2014
    Titel Evaluating and estimating the WCET criticality metric
    DOI 10.1145/2568326.2568331
    Typ Conference Proceeding Abstract
    Autor Jordan A
    Seiten 11-18
  • 2010
    Titel Graph-based cluster assignment for VLIW architectures.
    Typ Conference Proceeding Abstract
    Autor Jordan A
    Konferenz Posterpräsentation: 19th International Conference on Parallel Architectures and Compilation Techniques (PACT), Wien; 2010-09-11 - 2010-09-15
  • 2010
    Titel Optimistic integrated instruction scheduling and register allocation.
    Typ Conference Proceeding Abstract
    Autor Barany G
    Konferenz 15th Workshop on Compilers for Parallel Computing (CPC 2010)
  • 2010
    Titel Optimistic integrated instruction scheduling and register allocation.
    Typ Conference Proceeding Abstract
    Autor Barany G
    Konferenz Proceedings of the Junior Scientist Conference 2010; Posterpräsentation: Junior Scientist Conference 2010, Vienna; 2010-04-07 - 2010-04-09
  • 2010
    Titel Optimal and heuristic code generation for explicitly parallel processors.
    Typ Conference Proceeding Abstract
    Autor Barany G
    Konferenz ACACES 2010 Poster Abstracts. HiPEAC, 2010. Posterpräsentation: ACACES 2010, Terrassa (Barcelona), Spanien; 2010-07-11 - 2010-07-17
  • 2013
    Titel Static analysis of worst-case stack cache behavior
    DOI 10.1145/2516821.2516828
    Typ Conference Proceeding Abstract
    Autor Jordan A
    Seiten 55-64
  • 2013
    Titel Optimal and Heuristic Global Code Motion for Minimal Spilling
    DOI 10.1007/978-3-642-37051-9_2
    Typ Book Chapter
    Autor Barany G
    Verlag Springer Nature
    Seiten 21-40
    Link Publikation

Entdecken, 
worauf es
ankommt.

Newsletter

FWF-Newsletter Presse-Newsletter Kalender-Newsletter Job-Newsletter scilog-Newsletter

Kontakt

Österreichischer Wissenschaftsfonds FWF
Georg-Coch-Platz 2
(Eingang Wiesingerstraße 4)
1010 Wien

office(at)fwf.ac.at
+43 1 505 67 40

Allgemeines

  • Jobbörse
  • Arbeiten im FWF
  • Presse
  • Philanthropie
  • scilog
  • Geschäftsstelle
  • Social Media Directory
  • LinkedIn, externe URL, öffnet sich in einem neuen Fenster
  • , externe URL, öffnet sich in einem neuen Fenster
  • Facebook, externe URL, öffnet sich in einem neuen Fenster
  • Instagram, externe URL, öffnet sich in einem neuen Fenster
  • YouTube, externe URL, öffnet sich in einem neuen Fenster
  • Cookies
  • Hinweisgeber:innensystem
  • Barrierefreiheitserklärung
  • Datenschutz
  • Impressum
  • IFG-Formular
  • Social Media Directory
  • © Österreichischer Wissenschaftsfonds FWF
© Österreichischer Wissenschaftsfonds FWF