Les motifs des expressions régulières | Développement Web

Les motifs des expressions régulières

Pour manipuler des expressions régulières en javascript, il faut tout d’abord créer un objet de type RegExp.

La construction de cet objet se fait de la manière suivante:

   var myExp = new RegExp(motif, option);

Dans la construction de cet objet, on retrouve 2 arguments. Le premier, motif correspond à l’expression régulière que l’on recherche; Le second, option, permet quant à lui d’affiner la recherche et qui peut avoir pour valeur:

  • g: recherche globale sur toute la chaîne
  • i: rend la recherche insensible à la casse
  • gi: associe les options g et i
  • «  »: aucune option

Les motifs et leur signification

Voici un listing des syntaxes de motif pour les expressions régulières. À noter que ces syntaxes sont valables autant pour le Javascript que pour le PHP ou encore les fichiers « .htaccess ».

Motif des expressions régulières en Javascript
Élément du Motif Signification
^ Indique le début de ligne ou de chaîne (début du motif)
$ Indique la fin de motif ou de chaîne (fin du motif)
. Autorise n’importe quel caractère
[abc] Recherche exactement la chaîne entre crochet (ici, on doit nécessairement retrouver le motif « abc » pour valider la chaîne testée)
[a-z] Ne peut contenir que des caractères compris entre a et z (en minuscule)
[A-Z] Ne peut contenir que des caractères compris entre A et Z (en majuscule)
[a-zA-Z] Ne peut contenir que des caractères compris entre a et z (en minuscule ou majuscule)
[0-9] Ne peut contenir que des caractères numériques compris entre 0 et 9
[^0-9] Ne peut contenir les caractères numériques compris entre 0 et 9 (donc ici, aucun caractère numérique)
(y) Recherche l’expression parenthésée
* Peut contenir le motif précédemment déclaré de 0 à x fois
[a-r]* Peut contenir des lettres comprises entre a et r de 0 à x fois
+ Peut contenir le motif précédemment déclaré de 1 à x fois
? Peut contenir le motif précédemment déclaré de 0 à 1 fois
{n} Doit contenir le motif précédemment déclaré exactement n fois
{n,} Doit contenir le motif précédemment déclaré au moins n fois
{n,m} Doit contenir le motif précédemment déclaré de n à m fois
\ Caractère d’échappement
\\ Caractère \
\d Chiffre (équivalent à [0-9])
\D Aucun chiffre (équivalent à [^0-9])
\b Frontière / séparateur de mot (espace, alinéa, …)
\s Caractère d’espacement (espace, tabulation, saut de page, …) – équivalent à [\f \n \r \t \v]
\S Un seul caractère sauf un espacement
\w N’importe quel caractère alphanumérique dont l’underscore « _ » (équivalent à [a-zA-Z0-9_])
\W Tout sauf un caractère alphanumérique (équivalent à [^a-zA-Z0-9_])

Ce listing des motifs d’expressions régulières est quasiment exhaustif. L’ensemble des règles que l’on peut appliquer par la suite au sein des scripts seront la plupart du temps des combinaisons de tous ces motifs.