Instanziierungs- und lernbasierte Methoden im automatischen Gleichheitsbeweisen
Instantiation- and Learning-Based Methods in Equational Reasoning
Wissenschaftsdisziplinen
Informatik (40%); Mathematik (60%)
Keywords
-
Automated Theorem Proving,
Machine Learning,
Equational Reasoning,
Formal Verification,
Boolean satisfiability problem,
Instantiation-Based Methods
Als NP-vollständiges Problem galt das Boolesche Erfüllbarkeitsproblem (SAT) lange als zu schwer, um für die Praxis relevant zu sein. Durch intensivste Forschung entstanden in den letzten 15 Jahren jedoch effiziente und mächtige Werkzeuge zur Lösung des Erfüllbarkeitsproblems (sogenannte SAT-Solver). Solche Werkzeuge finden inzwischen verbreitet Anwendung in der Praxis, etwa zur Verifikation von Hardwarekomponenten oder zur Lösung von Planungsproblemen. SAT-Solver werden mittlerweile auch in Verfahren des automatischen Beweisens angewandt. Dabei werden weit schwierigere Probleme durch ein Boolesches Erfüllbarkeitsproblem approximiert. Die folgenden zwei Verfahren dieser Art sind für dieses Projekt von Bedeutung: (1) Instanziierungsbasierte Beweistechniken wie das InstGen-Verfahren wurden für das Erfüllbarkeitsproblem in der Prädikatenlogik entwickelt, welches im Allgemeinen unentscheidbar ist. (2) Maximale Vervollständigung stellt ein SAT-basiertes Verfahren für Gleichungslogik da. Diese beiden Verfahren erwiesen sich im Vergleich mit anderen Techniken für die entsprechenden Probleme als schnell und effektiv. Dieses Projekt möchte die Grenzen und Möglichkeiten des SAT-basierten Theorembeweisens weiter ausreizen. Im ersten Schritt werden wir maximale Vervollständigung erweitern, um sie mit dem InstGen- Verfahren kombinieren zu können. Damit kann ein effizienter Theorembeweiser mit optimaler Unterstützung für Gleichheit implementiert werden. Bisherige Kombinationen von instantierungsbasierten Beweistechniken mit Techniken aus dem Gleichheitsbeweisen stellten sich als schwierig heraus. Wir erwarten jedoch, dass die Verbindung zweiter SAT-basierter Verfahren es erlaubt, Synergien bei den jeweiligen Approximationen zu nützen, und dadurch ein effizienteres Verfahren ermöglicht. Im nächsten Schritt werden wir Techniken des maschinellen Lernens verwenden, um die implementierten Beweiser zu optimieren. Diese Techniken erhöhen die Effizienz indem sie es erlauben, Beweisstrategien optimal an das Eingabeproblem anzupassen. Dazu gibt es bislang noch wenige Forschungsergebnisse, wir erwarten aber, dass sich die betrachteten Verfahren für derartige Optimierungen besonders gut eignen. Theorembeweiser stellen hochgradig komplexe Software dar, und sind daher notorisch fehleranfällig. Hinzu kommt, dass es praktisch unmöglich ist, die ausgegebenen Beweise manuell zu prüfen. Dies trifft auf SAT- basierte Beweiser umso mehr zu, doch es gibt bislang keine Möglichkeit, solche Beweise automatisch zu verifizieren. Daher werden wir im dritten Schritt des Projekts einen verfizierten Beweisprüfer für die implementierten Theorembeweiser entwickeln. Zusammengefasst möchte dieses Projekt die Grenzen des SAT-basierten Beweisens in dreierlei Hinsicht erweitern: Anwendbarkeit im Gleichheitsbeweisen, Flexibilitat und Effizienz sowie Verifizierbarkeit.
Automatisches Schließen (automated reasoning) beschäftigt sich mit der Entwicklung und Implementierung von Algorithmen, die logische Deduktion in einem Computersystem automatisieren. Solche Systeme sind wichtig, um Hardware- und Softwarekomponenten automatisch auf Korrektheit zu überprüfen, aber auch um Planungsprobleme zu lösen. Das Erfüllbarkeitsproblem der Aussagenlogik (SAT) stellt einen Spezialfall des automatischen Schließens dar. Als NP-vollständiges Problem galt SAT lange als nicht effizient lösbar. Dank des Fortschritts in der Forschung der letzten 20 Jahre sind SAT-Solver jedoch mittlerweile in der Lage, riesige Probleme effizient zu verarbeiten, und werden dementsprechend routinemäßig in vielerlei Anwendungen eingesetzt. Anstatt reiner SAT-Solver werden inzwischen vielfach SMT-Solver verwendet, die SAT-Solver um Prozeduren für Theorien wie Arithmetik ergänzen, und damit Effizienz mit höherer Aussagekraft verbinden. Viele Anwendungsprobleme des automatischen Schließens sind jedoch nicht mit einem SAT- oder SMT-Solver lösbar, sondern benötigen mächtigere Inferenzmechanismen. Dieses Projekt konzentrierte sich auf logisches Schließen mit Gleichheit - ein Fall von hoher praktischer Relevanz. Um eine effektive Behandlung der Logik mit Gleichheit zu ermöglichen, kombinierte dieses Projekt zwei SAT/SMT-basierte Algorithmen. Behandelt wurden dabei sowohl der Sonderfall, in dem die Eingabeformel einer Menge von (Un-)Gleichungen ist, wie auch der allgemeine Fall der Prädikatenlogik mit Gleichheit. (1) "Maximal completion" is eine schnelle und wirksame Methode zur Behandlung des besonderen Falls, in dem das Eingabeproblem nur aus Gleichungen besteht. (2) "InstGen" ist ein SAT-basiertes Verfahren des instanzbasierten Theorembeweisens, das zwar die ganze Prädikatenlogik unterstützt, Gleichheit bislang aber ineffizient behandelte. In diesem Projekt wurden diese beiden Ansätze zu einer kombinierten Methode vereinigt, die Synergien zwischen den beiden SAT-Anbindungen nutzen kann. Eine entsprechende Implementierung in der Anwendung maedmax wurde experimentell evaluiert. Zwecks Optimierung der Performance wurden Techniken des maschinellen Lernens verwendet, um bessere Strategien für die im Beweisprozess nötigen Entscheidungen zu entwickeln. Das schließt die Bestimmung kritischer Laufzeitparameter ebenso mit ein wie die Auswahl des nächsten zu bearbeitenden Literals. Zu diesem Zweck entwickelten und evaluierten wir auch neuartige Features eines Eingabeproblems, die in diesem Kontext relevant sind. Automatische Theorembeweiser stellen komplexe, und damit inhärent fehleranfällige Softwaresysteme dar. Auch wenn ein Beweis für ein Theorem ausgegeben wird, ist dieser oft zu lang, als dass er von einem Menschen kontrolliert werden könnte. Um daher die Vertrauenswürdigkeit von Tools wie maedmax zu erhöhen, wurde im Rahmen dieses Projekts ein Beweisprüfer entwickelt, mit dem die Ausgabezertifikate von maedmax kontrolliert werden können. Dazu wurde die Korrektheit aller in maedmax implementierten Algorithmen formell im dedizierten Beweisassistenten Isabelle bewiesen. Zusammenfassend wurden in diesem Projekt die Möglichkeiten des SAT/SMT-basierten Theorembeweisens mit Gleichheit ausgereizt und erweitert. Die Methode wurde mittels maschinellem Lernen optimiert, und ihre Korrektheit formell in einem automatischen Beweisassistenten bewiesen.
- Universität Innsbruck - 100%
- Laura Kovacs, Technische Universität Wien , nationale:r Kooperationspartner:in
- Nao Hirokawa, Japan Advanced Institute of Science and Technology - Japan
- David Basin, Eidgenössische Technische Hochschule Zürich - Schweiz
- Aaron Stump, University of Iowa - Vereinigte Staaten von Amerika
- Konstantin Korovin, University of Manchester - Vereinigtes Königreich
Research Output
- 26 Zitationen
- 16 Publikationen
- 4 Software
- 2 Disseminationen
- 3 Wissenschaftliche Auszeichnungen
-
2020
Titel Tools in Term Rewriting for Education DOI 10.4204/eptcs.313.4 Typ Journal Article Autor Winkler S Journal Electronic Proceedings in Theoretical Computer Science Seiten 54-72 Link Publikation -
2019
Titel Mædmax at school: Learning selection in equational reasoning Typ Conference Proceeding Abstract Autor Winkler S. Konferenz 4th Conference on Artificial Intelligence and Theorem Proving Seiten 38-40 Link Publikation -
2019
Titel Certified Equational Reasoning via Ordered Completion DOI 10.1007/978-3-030-29436-6_30 Typ Book Chapter Autor Sternagel C Verlag Springer Nature Seiten 508-525 -
2019
Titel Smarter Features, Simpler Learning? DOI 10.4204/eptcs.311.4 Typ Journal Article Autor Winkler S Journal Electronic Proceedings in Theoretical Computer Science Seiten 25-31 Link Publikation -
2019
Titel Extending Maximal Completion (Invited Talk) DOI 10.4230/lipics.fscd.2019.3 Typ Conference Proceeding Abstract Autor Winkler S Konferenz LIPIcs, Volume 131, FSCD 2019 Seiten 3:1 - 3:15 Link Publikation -
2019
Titel Abstract Completion, Formalized DOI 10.23638/lmcs-15(3:19)2019 Typ Journal Article Autor Hirokawa N Journal Logical Methods in Computer Science Link Publikation -
2018
Titel Loop Detection by Logically Constrained Term Rewriting DOI 10.1007/978-3-030-03592-1_18 Typ Book Chapter Autor Nishida N Verlag Springer Nature Seiten 309-321 -
2017
Titel A ground joinability criterion for ordered completion Typ Conference Proceeding Abstract Autor Winkler S. Konferenz 6th International Workshop on Confluence Seiten 45-49 Link Publikation -
2017
Titel Infinite Runs in Abstract Completion DOI 10.4230/lipics.fscd.2017.19 Typ Conference Proceeding Abstract Autor Hirokawa N Konferenz LIPIcs, Volume 84, FSCD 2017 Seiten 19:1 - 19:16 Link Publikation -
2018
Titel CoCo 2018 Participant: CeTA 2.33 Typ Conference Proceeding Abstract Autor Felgenhauer B. Konferenz 7th International Workshop on Confluence Seiten 63 Link Publikation -
2018
Titel Certified ordered completion Typ Conference Proceeding Abstract Autor Sternagel C. Konferenz 7th International Workshop on Confluence Seiten 41-45 Link Publikation -
2018
Titel Completion for Logically Constrained Rewriting DOI 10.4230/lipics.fscd.2018.30 Typ Conference Proceeding Abstract Autor Middeldorp A Konferenz LIPIcs, Volume 108, FSCD 2018 Seiten 30:1 - 30:18 Link Publikation -
2018
Titel MædMax: A Maximal Ordered Completion Tool DOI 10.1007/978-3-319-94205-6_31 Typ Book Chapter Autor Winkler S Verlag Springer Nature Seiten 472-480 -
2018
Titel Certified Ordered Completion DOI 10.48550/arxiv.1805.10090 Typ Preprint Autor Sternagel C -
2018
Titel Abstract Completion, Formalized DOI 10.48550/arxiv.1802.08437 Typ Preprint Autor Hirokawa N -
2020
Titel Learning strategy design: First lessons. Typ Conference Proceeding Abstract Autor Suda M. Konferenz 5th Conference on Artificial Intelligence and Theorem Proving
-
2019
Titel Invited Talk: ThEdu 2019 Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2019
Titel Invited Participant: Dagstuhl Seminar 19371 Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2019
Titel Invited Talk: FSCD 2019 Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International