Utiliser REGEXEXTRACT dans Google Sheets

Video google sheet regex extract

Publié le 21 janvier 2021 par Jake Sheridan

Les fonctions regex de Google Sheets sont utiles lorsque vous gérez une grande quantité de données. Elles sont basées sur les expressions régulières (regex en abrégé) largement utilisées par les programmeurs, mais elles sont également utiles pour les utilisateurs de Google Sheets. Une expression régulière est utilisée pour rechercher et trouver des informations spécifiques. Les expressions régulières sont construites à partir de règles et vous pouvez exprimer pratiquement n’importe quoi avec elles.

Parmi les trois principales fonctions regex, REGEXEXTRACT est utilisée pour extraire des sous-chaînes correspondantes à une expression régulière.

Qu’est-ce que la fonction REGEXEXTRACT?

La syntaxe de la fonction est la suivante:

=REGEXEXTRACT(texte, expression_régulière)

Sa syntaxe peut sembler effrayante au début, mais vous pouvez trouver de nombreuses ressources en ligne qui vous aident à construire vos propres expressions régulières. Une fois que vous avez compris comment l’utiliser, c’est un outil vraiment puissant qui accélère grandement vos processus.

Vous pouvez toujours l’utiliser pour rechercher des correspondances exactes, mais la véritable puissance de cette fonction réside dans les caractères spéciaux qui vous permettent de personnaliser vos recherches.

Prenons un exemple. Une expression régulière ressemble généralement à ceci: ([A-Z]w+), ce qui signifie:

  • A-Z: les sous-chaînes que nous recherchons commencent par une lettre majuscule.
  • w: cela doit être un mot (pas un chiffre ou un espace).
  • +: cela peut être suivi de 1 caractère ou plus.

Quand utiliser REGEXMATCH pour le marketing ?

  • Extraire des données spécifiques d’une liste
  • Extraire des adresses e-mail ou des liens d’un texte.
  • Extraire un domaine à partir d’une URL.

Comment utiliser la fonction REGXMATCH dans Google Sheets

Le premier argument, texte, est le texte d’entrée. Le deuxième argument, expression_régulière, est l’expression qui doit correspondre. La première partie du texte qui correspond à cette expression sera renvoyée.

Cette fonction vous permet d’extraire une partie d’une chaîne de caractères. Elle ne fonctionne qu’avec du texte.

Supposons que vous ayez une liste d’URL et que vous deviez extraire certains mots d’entre elles. Par exemple, les URL contiennent la langue des pages et vous souhaitez extraire ces langues:

En regex, le caractère | (pipe) représente le OU logique. Vous pouvez rechercher le texte spécifique en connectant tous les mots possibles avec des relations OU. La formule recherchera le mot espagnol ou français ou allemand et ainsi de suite.

La fonction pour faire cela:

=REGEXEXTRACT(A2, "espagnol|français|allemand|anglais|italien|néerlandais")

Peu importe où se trouve le mot dans le texte, la fonction le recherche et le renvoie en tant que résultat de la fonction. Elle lit la chaîne source de gauche à droite et renvoie le premier résultat correct qu’elle trouve. Par exemple, elle a trouvé « italien » en premier dans la cinquième ligne et a ensuite ignoré le fait qu’il y avait aussi « anglais ».

Exemple de formule REGEXEXTRACT

Il est également courant d’extraire les domaines de base des URL complètes. La fonction REGEXEXTRACT convient également à cette tâche.

=REGEXEXTRACT(A2,"^(?:https?://)?([^:/n]+)")

L’expression régulière est beaucoup plus complexe ici, mais vous pouvez apprendre les bases pour vous familiariser avec de telles expressions, ou vous pouvez simplement rechercher sur Google et les écrire au fur et à mesure.

Cette expression régulière exclut « https:// » puis exclut tout ce qui se trouve après le premier caractère « / ». Ainsi, la seule partie restante est le domaine de base.

Résumé

REGEXEXTRACT peut vous faire gagner énormément de temps. Une fois que vous avez compris comment l’utiliser, vous pouvez remplacer la plupart de vos fonctions LEFT, RIGHT, MID ou FIND par cette fonction regex.

Publié sur Crawlan.com

Source

Articles en lien