Nouvelles du web

Nouvelles du web

Maîtriser les expressions régulières en Python

 

Introduction aux regex et au module re

 

Les expressions régulières, communément appelées regex, sont un moyen efficace de rechercher, manipuler et analyser des chaînes de caractères. Python fournit le module re pour travailler avec les regex. Cet article couvre les bases du module re, y compris la recherche de correspondances, les remplacements et l'utilisation de métacaractères.

Fonctions principales du module re

1. Importer le module

Avant de pouvoir utiliser les regex en Python, il faut importer le module re :

 

import re

2. Rechercher une correspondance

Utilisez la fonction re.search() pour rechercher un motif dans une chaîne de caractères :

 

texte = "Les regex sont utiles."
resultat = re.search("utiles", texte)

3. Trouver toutes les correspondances

Utilisez re.findall() pour trouver toutes les occurrences d'un motif :

 

texte = "Les numéros 123 et 456."
nombres = re.findall("\d+", texte)

4. Remplacer du texte

Utilisez re.sub() pour remplacer du texte correspondant à un motif :

 

texte = "Les voyelles a, e, i, o et u."
sans_voyelles = re.sub("[aeiou]", "", texte)

Caractères spéciaux et modificateurs

Les regex utilisent des métacaractères pour décrire des motifs de recherche. Voici quelques exemples :

 

  • . : n'importe quel caractère, sauf un saut de ligne.
  • ^ : début de la chaîne de caractères.
  • $ : fin de la chaîne de caractères.

 

Les modificateurs sont des options qui affectent le comportement des regex, par exemple :

  • re.IGNORECASE : rend la recherche insensible à la casse.
  • re.MULTILINE : traite les chaînes multi-lignes comme des lignes individuelles.

Groupes de capture et compilation

1. Groupes de capture

Les groupes de capture permettent d'extraire des parties spécifiques d'une correspondance. Utilisez des parenthèses pour définir un groupe :

 

texte = "Prix : 100 euros"
motif = r"Prix : (\d+) euros"
resultat = re.search(motif, texte)
if resultat:
prix = int(resultat.group(1))

2. Compilation des motifs

Pour optimiser les performances lors de l'utilisation d'un motif à plusieurs reprises, utilisez la fonction re.compile() :

 

motif = re.compile("\d+")
nombres = motif.findall("123 et 456")

Conclusion

Les expressions régulières en Python sont un outil puissant pour travailler avec des chaînes de caractères.

 

Le module re offre des fonctions telles que re.search(), re.findall() et re.sub() pour effectuer diverses opérations sur le texte. Les métacaractères, les modificateurs et les groupes de capture ajoutent de la flexibilité pour rechercher et extraire des informations précises.

 

Pour tirer pleinement parti des expressions régulières en Python, continuez à explorer les ressources en ligne et à pratiquer avec des exemples concrets.



18/03/2023
0 Poster un commentaire

A découvrir aussi


Ces blogs de Informatique & Internet pourraient vous intéresser

Inscrivez-vous au site

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 4 autres membres