Comment faire correspondre des blocs multilignes en Python à l'aide d'expressions régulières ?

Page de garde > La programmation > Comment faire correspondre des blocs multilignes en Python à l'aide d'expressions régulières ?

Comment faire correspondre des blocs multilignes en Python à l'aide d'expressions régulières ?

Publié le 2024-11-04

Parcourir:516

How to Match Multiline Blocks in Python Using Regular Expressions?

Correspondance de blocs multilignes à l'aide d'expressions régulières

Vous pouvez rencontrer des difficultés lors de la mise en correspondance d'un texte s'étendant sur plusieurs lignes à l'aide des expressions régulières de Python. Prenons l'exemple de texte suivant :

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times).

Le but est de capturer deux composants :

"du TEXTE variable"
Toutes les lignes majuscules situées sur deux lignes en dessous (à l'exclusion des caractères de nouvelle ligne)

Plusieurs approches ont été tentées sans succès :

re.compile(r"^>(\w )$$(\n[.$] )^$", re.MULTILINE) # Capture both parts
re.compile(r"([^>][\w\s] )$", re.MULTILINE|re.DOTALL) # Just textlines

Pour résoudre ce problème, utilisez l'expression régulière suivante :

re.compile(r"^(. )\n((?:\n. ) )", re.MULTILINE)

Gardez à l'esprit que les ancres "^" et "$" ne correspond pas aux sauts de ligne. Par conséquent, en mode multiligne, "^" suit une nouvelle ligne et "$" précède une nouvelle ligne.

De plus, soyez attentif aux différents formats de nouvelle ligne. Pour le texte pouvant contenir des sauts de ligne, des retours chariot ou les deux, utilisez cette expression régulière plus inclusive :

re.compile(r"^(. )(?:\n|\r\n?)((?:(?:\n|\r\n?). ) )", re.MULTILINE)

Le modificateur DOTALL n'est pas nécessaire ici car le point exclut déjà les nouvelles lignes.

Dernier tutoriel Plus>

Comment supprimer proprement les gestionnaires d'événements JavaScript anonymes?
supprimer les auditeurs d'événements anonymes Ajouter des auditeurs d'événements anonymes aux éléments offre une flexibilité et une simp...

La programmation Publié le 2025-06-10
Comment localiser l'image d'arrière-plan CSS à droite?
Positionner l'image d'arrière-plan de la droite avec css Dans le domaine du développement Web, il est souvent souhaitable de positionn...

La programmation Publié le 2025-06-10
Comment réparer « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion de données ?
Comment résoudre « Erreur générale : le serveur MySQL 2006 a disparu » lors de l'insertion d'enregistrementsIntroduction :L'insertion de d...

La programmation Publié le 2025-06-10
PHP Future: adaptation et innovation
L'avenir de PHP sera réalisé en s'adaptant aux nouvelles tendances technologiques et en introduisant des fonctionnalités innovantes: 1) s'...

La programmation Publié le 2025-06-10
Implémentation dynamique réfléchissante de l'interface GO pour l'exploration de la méthode RPC
Réflexion pour l'implémentation d'interface dynamique dans go la réflexion dans go est un outil puissant qui permet l'inspection e...

La programmation Publié le 2025-06-10
Comment supprimer les emojis des chaînes dans Python: un guide pour débutant pour fixer les erreurs courantes?
Suppression des emojis des chaînes dans python Le code python fourni pour supprimer les emojis échoue car il contient des erreurs de syntax. L...

La programmation Publié le 2025-06-10
Quelle est la différence entre les fonctions imbriquées et les fermetures en python
fonctions imbriquées par rapport aux fermetures en python Bien que les fonctions imbriquées dans Python ressemblent superficiellement Non-Clos...

La programmation Publié le 2025-06-10
Comment Android envoie-t-il des données post-post au serveur PHP?
Envoi des données de publication dans Android introduction Cet article traite de la nécessité d'envoyer des données de post à un scrip...

La programmation Publié le 2025-06-10
Pourquoi Pytz montre-t-il des décalages de fuseau horaire inattendus initialement?
Dicontenance du fuseau horaire avec pytz Certains flammes de temps présentent des décalages particuliers lorsqu'ils sont initialement obte...

La programmation Publié le 2025-06-10
Python Lire le fichier CSV UnicodedeCodeerror Ultimate Solution
Unicode Decode Erreur dans la lecture du fichier CSV Lorsque vous essayez de lire un fichier CSV dans Python à l'aide du module CSV intégr...

La programmation Publié le 2025-06-10
Analyse du langage fortement tapé CSS
L'une des façons de classer un langage de programmation est de la force ou de la manière faible. Ici, «tapé» signifie si les variables sont connu...

La programmation Publié le 2025-06-10
Méthode JavaScript pour calculer le nombre de jours entre deux dates
Comment calculer la différence entre les dates dans javascrip Dates: const date1 = new Date ('7/13/2010'); const date2 = new Date (&#...

La programmation Publié le 2025-06-10
Pourquoi y a-t-il des rayures dans mon fond de dégradé linéaire, et comment puis-je les réparer?
bannissant les bandes d'arrière-plan à partir du gradient linéaire Lorsque vous utilisez la propriété linéaire-gradient pour un arrière-pl...

La programmation Publié le 2025-06-10
Y a-t-il une différence de performance entre l'utilisation d'une boucle for-out et un itérateur pour la traversée de collecte en Java?
pour chaque boucle vs iterator: efficacité dans la collection Traversal introduction Lorsque vous traversez une collection dans Java, le c...

La programmation Publié le 2025-06-10
Async void vs tâche asynchrone dans ASP.NET: Pourquoi la méthode asynchrone void lance-t-elle parfois des exceptions?
Comprendre la distinction entre la tâche asynchrone void et asynchrone dans asp.net dans les applications ASP.net, le programme asynchronique ...

La programmation Publié le 2025-06-10

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article