Publications

PhishGNN: A phishing website detection framework using graph neural networks

By Tristan Bilot, Grégoire Geis, Badis Hammi

2022-07-01

In Proceedings of the 19th international conference on security and cryptography - SECRYPT

Abstract

Because of the importance of the web in our daily lives, phishing attacks have been causing a significant damage to both individuals and organizations. Indeed, phishing attacks are today among the most widespread and serious threats to the web and its users. The main approaches deployed against such attacks are blacklists. However, the latter represents numerous drawbacks. In this paper, we introduce PhishGNN, a Deep Learning framework based on Graph Neural Networks, which leverages and uses the hyperlink graph structure of web- sites along with different other hand-designed features. The performance results obtained, demonstrate that PhishGNN outperforms state of the art results with a 99.7% prediction accuracy.

Continue reading

Greibach normal form for $\omega$-algebraic systems and weighted simple $\omega$-pushdown automata

By Manfred Droste, Sven Dziadek, Werner Kuich

2022-06-30

In Information and Computation

Abstract

In weighted automata theory, many classical results on formal languages have been extended into a quantitative setting. Here, we investigate weighted context-free languages of infinite words, a generalization of $\omega$-context-free languages (as introduced by Cohen and Gold in 1977) and an extension of weighted context-free languages of finite words (that were already investigated by Chomsky and Schützenberger in 1963). As in the theory of formal grammars, these weighted context-free languages, or $\omega$-algebraic series, can be represented as solutions of mixed $\omega$-algebraic systems of equations and by weighted $\omega$-pushdown automata. In our first main result, we show that (mixed) $\omega$-algebraic systems can be transformed into Greibach normal form. We use the Greibach normal form in our second main result to prove that simple $\omega$-reset pushdown automata recognize all $\omega$-algebraic series. Simple $\omega$-reset automata do not use $\epsilon$-transitions and can change the stack only by at most one symbol. These results generalize fundamental properties of context-free languages to weighted context-free languages.

Continue reading

Posets with interfaces as a model for concurrency

Abstract

We introduce posets with interfaces (iposets) and generalise their standard serial composition to a new gluing composition. In the partial order semantics of concurrency, interfaces and gluing allow modelling events that extend in time and across components. Alternatively, taking a decompositional view, interfaces allow cutting through events, while serial composition may only cut through edges of a poset. We show that iposets under gluing composition form a category, which generalises the monoid of posets under serial composition up to isomorphism. They form a 2-category when a subsumption order and a lax tensor in the form of a non-commutative parallel composition are added, which generalises the interchange monoids used for modelling series-parallel posets. We also study the gluing-parallel hierarchy of iposets, which generalises the standard series-parallel one. The class of gluing-parallel iposets contains that of series-parallel posets and the class of interval orders, which are well studied in concurrency theory, too. We also show that it is strictly contained in the class of all iposets by identifying several forbidden substructures.

Continue reading

Estimation de la fonction de niveau de bruit pour des images couleurs en utilisant la morphologie mathématique

By Baptiste Esteban, Guillaume Tochon, Edwin Carlinet, Didier Verna

2022-06-15

In 28e colloque sur le traitement du signal et des images

Abstract

Le niveau de bruit est une information importante pour certaines applications de traitement d’image telles que la segmentation ou le débruitage. Par le passé, nous avons proposé une méthode pour estimer ce niveau de bruit en s’adaptant au contenu d’une image en niveau de gris et nous avons montré que ses performances dépassent celle de l’état de l’art. Dans cet article, nous proposons une extension de cette méthode aux images couleurs dont les valeurs multivariées, dénuées de relation d’ordre naturelle, impliquent de nouvelles problématiques. Afin de les résoudre, nous utilisons deux outils provenant de la morphologie mathématique : l’arbre des formes multivarié et l’apprentissage de treillis complet. Enfin, nous confirmons les conclusions de nos précédents travaux pour l’estimation de la fonction de niveau de bruit couleur, montrant que l’adaptation au contenu d’une image donne de meilleures performances que l’utilisation de blocs carrés.

Continue reading

Généricité dynamique pour des algorithmes morphologiques

By Baptiste Esteban, Edwin Carlinet, Guillaume Tochon, Didier Verna

2022-06-15

In 28e colloque sur le traitement du signal et des images

Abstract

La généricité est un paradigme puissant dont l’usage permet d’implémenter un unique algorithme et de l’exécuter sur différents types de données. De ce fait, il est très utilisé lors du développement d’une bibliothèque scientifique, notamment en traitement d’images où les algorithmes peuvent s’appliquer à différents types d’images. Le langage C++ est un langage de choix pour ce genre de bibliothèque. Il supporte ce paradigme et ses applications sont performantes compte tenu de sa nature compilée. Néanmoins, contrairement à des langages dynamiques tels que Python ou Julia, ses capacités en matière d’interactivité, utiles lors des étapes de prototypage d’algorithmes, sont limitées en raison de sa nature statique. Nous proposons donc dans cet article une revue des différentes techniques qui permettent d’utiliser à la fois le polymorphisme statique et dynamique, puis nous évaluons le coût du transfert d’information statique vers des informations connues à l’exécution. En particulier, nous montrons que certaines informations d’une image sont plus importantes que d’autres en matière de performance, et que le surcoût dépend aussi de l’algorithme utilisé.

Continue reading

Analyse structurelle de l’influence du bruit sur l’arbre alpha

By Baptiste Esteban, Guillaume Tochon, Edwin Carlinet, Didier Verna

2022-06-14

In 29e colloque sur le traitement du signal et des images

Abstract

L’arbre alpha est une représentation hiérarchique utilisée dans divers traitements d’une image tels que la segmentation ou la simplification. Ces traitements sont néanmoins sensibles au bruit, ce qui nécessite parfois de les adapter. Or, l’influence du bruit sur la structure de l’arbre alpha n’a été que peu étudiée dans la littérature. Ainsi, nous proposons une étude de l’impact du bruit en fonction de son niveau sur la structure de l’arbre. De plus, nous étendons cette étude à la persistance des nœuds de l’arbre en fonction d’une énergie donnée, et nous concluons que certaines fonctionnelles sont plus sensibles au bruit que d’autres.

Continue reading

Assimilation de données variationnelle de séries temporelles d’images sentinel-2 avec un modèle dynamique auto-supervisé

By Anthony Frion, Lucas Drumetz, Mauro Dalla Mura, Guillaume Tochon, Abdeldjalil Aïssa-El-Bey

2022-06-14

In 29e colloque sur le traitement du signal et des images

Abstract

Au cours des dernières années, l’apprentissage profond a acquis une importance croissante dans de nombreux domaines scientifiques, notamment en ce qui concerne le traitement d’images, et en particulier pour le traitement des données issues de satellites. Le paradigme le plus courant en ce qui concerne l’apprentissage profond est l’apprentissage supervisé, qui requiert une grande quantité de données annotées représentant la vérité terrain pour la tâche d’intérêt. Or, obtenir des données correctement annotées pose souvent des difficultés financières ou techniques importantes. Pour cette raison, nous nous plaçons ici dans le cadre de l’apprentissage auto-supervisé. Nous proposons un modèle d’apprentissage profond inspiré de la théorie de l’opérateur de Koopman qui apprend, à partir de séries temporelles d’images multispectrales Sentinel-2, à modéliser les dynamiques de long terme de réflectance des pixels. Après son entraînement, notre modèle peut être utilisé dans divers problèmes inverses faisant intervenir la dynamique temporelle pour résoudre différentes tâches telles que l’interpolation ou le débruitage de données.

Continue reading

From Spot 2.0 to Spot 2.10: What’s new?

Abstract

Spot is a C++17 library for LTL and $\omega$-automata manipulation, with command-line utilities, and Python bindings. This paper summarizes its evolution over the past six years, since the release of Spot 2.0, which was the first version to support $\omega$-automata with arbitrary acceptance conditions, and the last version presented at a conference. Since then, Spot has been extended with several features such as acceptance transformations, alternating automata, games, LTL synthesis, and more. We also shed some lights on the data-structure used to store automata.

Continue reading

Survey on smart homes: Vulnerabilities, risks, and countermeasures

Abstract

Over the last few years, the explosive growth of Internet of Things (IoT) has revolutionized the way we live and interact with each other as well as with various types of systems and devices which form part of the Information Communication Technology (ICT) infrastructure. IoT is having a significant impact on various application domains including healthcare, smart home, transportation, energy, agriculture, manufacturing, and many others. We focus on the smart home environment which has attracted a lot of attention from both academia and industry recently. The smart home provides a lot of convenience to home users but it also opens up various risks that threaten both the security and privacy of the users. In contrast to previous works on smart home security and privacy, we present an overview of smart homes from both academic and industry perspectives. Next we discuss the security requirements, challenges and threats associated with smart homes. Finally, we discuss countermeasures that can be deployed to mitigate the identified threats.

Continue reading