Tìm và Xóa bỏ các dòng trùng lặp trong Google Sheets: Các lựa chọn khác nhau

Bạn không thích phải xóa bỏ những dòng trùng lặp bằng cách thủ công. Thật mất thời gian và dễ gặp lỗi, đúng không?

Bài viết này sẽ giới thiệu một vài hướng dẫn chi tiết để bạn có thể học cách xóa bỏ những dòng trùng lặp trong Google Sheets.

Chúng ta có nhiều phương pháp khác nhau để tìm và xóa bỏ những dòng trùng lặp trong Google Sheets.

Tùy thuộc vào kiểu dữ liệu của bạn, yêu cầu cũng có thể khác nhau.

Công thức mà một người dùng tìm thấy phù hợp với anh ta có thể không phù hợp với một người dùng khác do loại dữ liệu mà anh ta đang xử lý.

Tôi đã viết một số công thức và hàm tùy chỉnh cho mục đích cụ thể này.

Bạn cũng có thể phụ thuộc vào lệnh Data > Data clean-up.

Bạn sẽ thấy hai phần trong bài viết này: Một phần là cách xóa bỏ những dòng trùng lặp, và phần còn lại là cách tìm kiếm các dòng trùng lặp.

Công thức để xóa bỏ những dòng trùng lặp trong Google Sheets

1. Xóa bỏ các dòng và cột giống nhau: UNIQUE

Đây là phương pháp dễ nhất để xóa bỏ những dòng trùng lặp trong Google Sheets.

Hàm UNIQUE phù hợp để xóa bỏ những dòng trùng lặp trong một cột duy nhất.

=unique(A2:A7)

Nhưng nếu bạn muốn xóa bỏ những dòng trùng lặp trong nhiều cột, hàm này sẽ có giới hạn.

Trong ví dụ sau, ký tự “A” lặp lại 3 lần trong cột A. Nhưng sự xuất hiện lần thứ ba không phải là một dòng trùng lặp vì giá trị của nó trong cột thứ hai là khác nhau.

=unique(A2:B7)

2. Lấy các dòng duy nhất dựa trên cột duy nhất: SORTN

Làm sao để xử lý một cột cụ thể để tìm và xóa bỏ những dòng trùng lặp? Đương nhiên, UNIQUE không thể làm điều đó.

Giải pháp là sử dụng hàm SORTN với chế độ hiển thị tie mode #2.

SORTN là một hàm mà bạn nên học để lấy các dòng duy nhất dựa trên một cột duy nhất trong Google Sheets.

Ví dụ, nếu bảng của bạn chứa tên (A1:A) và địa chỉ email (B1:B) của sinh viên trong hai cột và bạn muốn xóa bỏ những dòng trùng lặp dựa trên cột email, hãy sử dụng SORTN thay vì UNIQUE.

Unique theo 1 cột duy nhất:

=sortn(A2:B7,7,2,A2:A7,TRUE)

Công thức Google Sheets trên trả về các dòng duy nhất dựa trên phạm vi duy nhất A2:A7.

phạm vi: A2:B7

Số dòng trả về: 7 (chỉ định tổng số dòng hoặc 9^9, một số rất lớn)

Chế độ hiển thị tie: 2

Cột hoặc phạm vi duy nhất: A2:A7

Sắp xếp: TRUE (Tăng dần)

Unique theo 2 cột duy nhất:

Công thức sau đây trả lời câu hỏi làm sao để lấy các dòng duy nhất từng cặp cột trong Google Sheets.

=sortn(A2:C7,10,2,A2:A7&B2:B7,TRUE)

Công thức Google Sheets trên trả về các dòng duy nhất dựa trên phạm vi duy nhất A2:A7 và B2:B7.

phạm vi: A2:C7

Số dòng trả về: 10 (chỉ định bất kỳ số lớn hơn hoặc bằng tổng số dòng trong phạm vi hoặc 9^9, một số rất lớn)

Chế độ hiển thị tie: 2

Cột hoặc phạm vi duy nhất: A2:A7&B2:B7

Sắp xếp: TRUE (Tăng dần)

Hãy đọc thêm về hàm hủy hoại này để xóa bỏ những dòng trùng lặp trong hướng dẫn chi tiết của tôi.

3. Xóa bỏ các dòng trùng lặp trong Google Sheets: Một hàm tùy chỉnh và các lựa chọn khác

Nếu bạn không tìm được giải pháp phù hợp cho vấn đề của mình, đừng lo lắng.

Tôi đã viết một số công thức khác có thể giúp bạn xóa bỏ những dòng trùng lặp từ tập dữ liệu của bạn. Đây là các công thức đó.

  1. Xóa bỏ các dòng trùng lặp và giữ lại các dòng có giá trị lớn nhất.

  2. So sánh hai bảng và xóa bỏ những dòng trùng lặp.

  3. Cách xóa bỏ các giá trị trùng lặp mà không xóa bỏ các dòng.

  4. Xóa bỏ các dòng trùng lặp từ chuỗi được phân tách bằng dấu phẩy.

  5. Xóa bỏ những dòng trùng lặp dựa trên cột khóa (Hàm tùy chỉnh).

  6. Tìm kiếm những dòng trùng lặp trong các dòng mới bên trong ô trong Google Sheets.

Hãy để tôi biết trong phần bình luận dưới đây nếu những giải pháp trên vẫn không đáp ứng yêu cầu của bạn.

Xóa bỏ những dòng trùng lặp trong phạm vi nguồn: Lệnh trong Menu

Chúng ta đã tìm hiểu và sử dụng nhiều công thức ở trên. Tất cả đều trả về kết quả trong một phạm vi mới.

Chúng sẽ hữu ích khi bạn không muốn làm gì đó trực tiếp với dữ liệu nguồn của mình.

Nếu bạn không muốn thử công thức, hãy sử dụng lệnh Remove Duplicates trong menu.

Hãy đảm bảo sao lưu dữ liệu của bạn trước khi thực hiện.

Hướng dẫn chi tiết: Xóa bỏ những dòng trùng lặp bằng lệnh Data Clean-up trong Google Sheets.

Công thức để tìm và đánh dấu những dòng trùng lặp trong Google Sheets

1. Một cột duy nhất

Đầu tiên, hãy nhớ rằng đây là một công thức không dùng mảng.

Vì vậy, dựa trên ví dụ của chúng ta, bạn nên sao chép và dán công thức Countif vào ô D2 cho đến cuối (theo số dòng) lần lượt.

Công thức này giúp bạn tìm các dòng trùng lặp trong Google Sheets dựa trên một cột duy nhất.

Nó sẽ để lại một dấu “X” bất cứ khi nào các mục lặp lại xuất hiện trong các dòng tương ứng trong cột A.

=if(countif($A$2:$A2,$A2)=1,,char(10005))

Nếu bạn muốn, bạn có thể sử dụng công thức mảng sau đây thay vì công thức trên.

Bạn hãy làm trống phạm vi D2:D và chèn công thức chạy theo thứ tự số lần đếm ở D2.

=ArrayFormula(if(countifs(row(A2:A),"<= "&row(A2:A),A2:A,A2:A)>1,char(10005),))

2. Hai cột duy nhất

Dễ dàng chỉnh sửa công thức ở trên để áp dụng nó cho hai cột duy nhất.

Công thức không dùng mảng này sẽ sử dụng hàm COUNTIFS.

=if(countifs($A$2:$A2,$A2,$B$2:$B2,$B2)=1,,char(10005))

Công thức này chỉ đánh dấu dòng D5 vì đây là dòng duy nhất lặp lại.

Đây là công thức sử dụng mảng, nằm trong ô D2 và kéo xuống.

=ArrayFormula(if(A2:A="",,if(countifs(row(A2:A),"<= "&row(A2:A),A2:A&B2:B,A2:A&B2:B)>1,char(10005),)))

Related posts