WWW2023

Cross-Modality Mutual Learning for Enhancing Smart Contract Vulnerability Detection on Bytecode

Peng Qian, Zhenguang Liu, Yifang Yin, Qinming He

91 citations

Abstract

Hiermite rkläre ich, dass ichd iese Arbeit selbständigv erfasst habe,d assi ch diev erwen-detenQ uellen und Hilfsmittelv ollständiga ngegeben habe undd assi ch dieS tellend er Arbeit -e inschließlichT abellen, Karten undA bbildungen -, diea nderen Werken oder dem Internet im Wortlaut oder dem Sinn nach entnommens ind, aufj eden Fall unter Angabed er Quelle alsE ntlehnung kenntlichg emacht habe. Iche rkläre weiters, dass ichm ichg enerativer KI-Tools lediglicha ls Hilfsmittelb edient habe und in derv orliegenden Arbeit mein gestalterischer Einflussü berwiegt.I mA nhang "Übersichtv erwendeterH ilfsmittel" habe icha lleg enerativen KI-Tools gelistet, die verwendetw urden, und angegeben, wo und wies ie verwendet wurden. FürT extpassagen, dieo hne substantielle Änderungen übernommenw urden, habeni ch jeweils diev on mirf ormulierten Eingaben (Prompts)u nd diev erwendeteI T-Anwendung miti hrem Produktnamen und Versionsnummer/Datuma ngegeben. Wien , 30. Juni 2025 Stephan Klein iii First andf oremost, Iw ould liket ot hank my advisors, Gernot andM onika, fort heir guidance andpatience in navigatingalong search forthe righttopic-ultimatelyenabling me to pursueasubject It ruly care about. Theirs teadye ncouragement ando bjective feedback,c oupled with providingc omputef or my tests, were invaluable. Also,Iwant to thankt he authorso fV ulHunter andM ANDO, thet wo publications I finally evaluatedi nd epth as part of my research.M anya uthors do noto penlyp ublish thet echnicali mplementationo ft heir research-but thoset wo research teamsd id 'got he extram ile't oe nableo ther researchersl ikem et os crutinizet heirw ork. Not only didt hey publisht he source code,b ut also hands-ond ocumentation andt ools to enableo therst o independentlyr un them odelsa nd validate smartc ontracts from end to end. iv Kurzfassung SmartC ontracts (Blockchain-Programme)s ichern mittlerweile beträchtliche Vermögenswerteu nd sind dahere in attraktivesZ ielf ür Angreifer.D abei stellt Reentrancy eine wichtige Klasse an Schwachstellend ar.G leichzeitig führtd as wachsende Interesse an maschinellemL ernen( ML)z ue iner Vielzahl vonV orschlägenf ür automatisierte Schwachstellenerkennung alsA lternative zu klassischenA nalysemethoden. Bestehende Übersichtsarbeitend azuf ührenv erschiedene Methoden an,K lassifikationenb leiben jedoch oftu ngenauo der unvollständig, und vergleichendee mpirischeE valuierungen sind rar. Um dieseL ückenz us chließen, gehenw ir alsT eild ieserA rbeitf olgendermaßenv or: (1)Z ur Bewertung des Stands derT echnik führen wire ines ystematische Literaturrecherched urch und leiten daraus eine Taxonomiea b, dieL ernparadigmen mitk onkreten Modellfamilienv erknüpft,w elchei nd er Smart-Contract-Analysez um Einsatzk ommen. (2)I ne iner vergleichendenM odellanalyse untersuchen wirz weir epräsentative MLbasierte Detektoren-MANDO-HGT( basierenda uf einem GraphN eural Network) und VulHunter( basierend aufe inem Bi-LSTM)-durch Auswertung derj eweiligen Publikationen undz ugehörigen Open-Source-Repositories.( 3) In einer empirischenT estreihe integrierenw ir diea usgewähltenT ools in dieT estumgebung SmartBugs und führen drei Experimented urch:( I) Test derM odelle mite iner Auswahlv on minimalenR eentrancy-Beispiel-Contracts (II) Testsm it einemg rößerenR eal-WorldD atensatz; und( III) Retraining derM odelle am gleichen Datenset. Ergebnisse. Daso riginale VulHunteri st konkurrenzfähig, bleibt jedoch beim Recall hinter klassischen Analysetools wie Slither und Mythril zurück. DasMANDO-Basismodell zeigt eine hohe Übererkennung (hoher Recall, geringeP räzision)u nd MANDO-HGT bleibth interd en originalen Ergebnissens einerA utoren zurück. Nach demR etraining beider Modelle miti dentischen Datenü bertrifft VulHuntera uf einem Holdout-Setv on 120 Contractsk lassische Analysetools beiF 1u nd Präzision, jedoch immern ochn icht beim Recall. Insgesamtl egen unsereE rgebnissen ahe, dass ML eins innvollere rgänzender Ansatz zur traditionellen Schwachstellenanalyses eink ann-insbesonderebei sorgfältigem Instanzentwurfs owie verlässlichenL abels. Beiträge. (i)e inek lars trukturierte Taxonomiev on ML-Technikenz ur Erkennungv on Smart-Contract-Schwachstellen; (ii) eind etaillierter Modellvergleich vonv erschiedenen ML-basierten Ansätzen (iii) eine Erweiterung des SmartBugs-Frameworksumausgewählte ML-Tools;s owie (iv) eine empirische Evaluation ML-basierter Werkzeuge.