Comment utiliser les formules RegEx dans Google Sheets

Comment utiliser les formules RegEx dans Google Sheets
Video google sheet regular expression

Si bạn làm việc trong lĩnh vực tối ưu hóa công cụ tìm kiếm (SEO), bạn đã biết đến việc thao tác với các tập dữ liệu lớn để phân tích. Dù là trên Google Sheets hay Excel, các công thức như vlookup, index, iferror và nhiều công thức khác là rất quan trọng để nhanh chóng sắp xếp các dữ liệu vô số. Tuy nhiên, đôi khi những công thức này đơn giản không đủ. Chúng hoạt động được, nhưng mất quá nhiều thời gian để cấu hình và tôi tự hỏi liệu có làm việc nhanh hơn thật sự hay không.

Nhờ vào một buổi thuyết trình tuyệt vời của Robin Lord tại một sự kiện Meetup về marketing kỹ thuật số của Brainlabs, tôi đã khám phá thế giới của các biểu thức chính quy (RegEx). Biểu thức chính quy là các công cụ phân tích văn bản trả về các giá trị cụ thể, như true hoặc false, dựa trên sự hiện diện hoặc không hiện diện của một biểu thức trong văn bản. Chúng có thể được sử dụng trên nhiều nền tảng như Google Analytics, Python, Java và nhiều hơn nữa để tìm kiếm các chuỗi ký tự cụ thể.

Tôi biết bạn đang nghĩ gì: “ôi không, lại một ngôn ngữ lập trình phức tạp nữa mà tôi không hiểu và làm thêm rắc rối”. Và bạn không thể sai lầm hơn được nữa. Tin vui là bạn có thể sử dụng các biểu thức chính quy trên Google Sheets để làm việc với dữ liệu của mình và giúp cuộc sống trở nên dễ dàng hơn đáng kể. Vâng, tôi luôn tìm kiếm các công cụ giúp cuộc sống dễ dàng hơn và biểu thức chính quy là một trong những công cụ yêu thích của tôi trong thời gian gần đây.

Có 3 công thức chính quy chủ yếu mà bạn có thể sử dụng trên Google Sheets là:

REGEXEXTRACT

Đây là công thức bạn muốn sử dụng khi bạn muốn trích xuất một phần cụ thể từ một chuỗi ký tự dài hơn. Ví dụ, đối với một trong những khách hàng của tôi, tôi có một danh sách các URL và tôi cần trích xuất một số từng từ trong mỗi URL. Nếu không có REGEXEXTRACT, tôi sẽ phải áp dụng nhiều bộ lọc và các công thức tùy chỉnh cho từng URL, trích xuất từng từ dựa trên vị trí của nó. Tôi không có thời gian cho việc đó và bạn cũng vậy.

Dưới đây là một ví dụ đơn giản về RegEx để trích xuất từ “tuyệt vời” từ liên kết “http://regexestgenial.com“. Khi bạn nhập “=REGEXEXTRACT” vào Google Sheets, công thức sẽ trông như sau:

=REGEXEXTRACT(A3,”.*(tuyệt vời).*”)

Phần “text” là ô trong đó bạn muốn tìm kiếm điều gì đó, và “expression_regular” là biểu thức chỉ định cho RegEx điều gì mà nó cần tìm kiếm. Trong trường hợp của chúng ta, công thức sẽ trở thành:

=REGEXEXTRACT(A3,”.*(tuyệt vời).*”)

Dấu sao trước và sau từ “tuyệt vời” cho biết rằng RegEx không quan tâm đến những gì đứng trước hoặc sau chuỗi “tuyệt vời”. Do đó, “tuyệt vời” có thể xuất hiện ở bất kỳ đâu trong URL, RegEx vẫn tìm thấy nó.

REGEXREPLACE

Trong một trường hợp khác, tôi có một danh sách dài các thẻ tiêu đề và tôi muốn viết hoa chữ cái đầu của từng từ, trừ các từ như “le”, “dans”, “pour”, “un”, bạn hiểu ý tôi. Với công thức PROPER, bạn có thể viết hoa chữ cái đầu của từng từ:

=PROPER(A4)

Nhưng điều này không giải quyết được vấn đề của tôi. Và đây là lúc REGEXREPLACE có tác dụng:

=REGEXREPLACE(PROPER(A4),”Le”,”le”)

Tương tự như REGEXEXTRACT, phần “text” là ô bạn muốn chỉnh sửa, và phần còn lại là một chỉ thị đơn giản cho RegEx về những gì nó cần thay thế.

REGEXMATCH

REGEXMATCH tìm kiếm một giá trị trong một ô và trả về TRUE hoặc FALSE. Đối với tôi, điều này trở nên hữu ích khi tôi kiểm tra xem các URL trong danh sách của mình có chứa một số từ cụ thể hay không và tôi không muốn phải đi qua nhiều bộ lọc.

Dưới đây là một ví dụ đơn giản về REGEXMATCH tìm kiếm từ “xanh” trong một URL:

=REGEXMATCH(PROPER(A3),”.*xanh.*”)

Ứng dụng của REGEXMATCH rất nhiều và có thể kết hợp với bất kỳ hàm nào khác trên Google Sheets.

Như bạn có thể đã nhận ra, tiềm năng của ba công thức đơn giản này là vô tận. Đừng quên rằng còn nhiều quy tắc cú pháp RegEx khác mà bạn có thể sử dụng để thực hiện các tính năng khác nhau. Đây là một công cụ gỡ lỗi bổ sung cho những người muốn bắt đầu lập trình với RegEx.

Biểu thức chính quy (RegEx) đã đơn giản hóa cuộc sống của tôi đáng kể và làm cho dữ liệu của tôi trở nên thú vị hơn khi làm việc. Tôi chắc chắn rằng bạn sẽ thấy chúng rất hữu ích và dễ học một cách đáng kinh ngạc. Hãy bình luận nếu bạn có bất kỳ câu hỏi về các công thức hoặc gợi ý bổ sung. Hãy thư giãn và để RegEx làm công việc của nó!

Crawlan.com

Related posts