Cách xóa dữ liệu trùng trong Google Sheets (3 phương pháp dễ dàng)

Video how to remove duplicate in google sheet

Với lượng dữ liệu lớn, bạn không cần mỏi mắt tìm kiếm thủ công các trường hợp dữ liệu trùng lặp để xóa. Tính năng “xóa trùng” trong Google Sheets cho phép bạn dễ dàng loại bỏ các dữ liệu trùng lặp.

Trong bài hướng dẫn này, chúng tôi sẽ chỉ cho bạn cách xóa dữ liệu trùng trong Google Sheets theo nhiều cách khác nhau.

Cách xóa dữ liệu trùng trong Google Sheets

  1. Chọn tập dữ liệu chứa dữ liệu trùng lặp.
  2. Truy cập vào tùy chọn “Dữ liệu” > “Dọn dẹp dữ liệu”.
  3. Nhấp vào tùy chọn “Xóa trùng”.
  4. Đảm bảo rằng “Chọn tất cả” được chọn (trong phần “Các cột để phân tích”).
  5. Nhấp vào nút “Xóa trùng”.
  6. Nhấp vào “OK” trong hộp thoại xuất hiện.

Cách xóa dữ liệu trùng trong Google Sheets bằng cách sử dụng tính năng “Xóa trùng”

Việc xóa dữ liệu trùng trong Google Sheets là một thao tác phổ biến mà mọi người thường làm, hiện nay có một tùy chọn cụ thể để bạn có thể xóa nhanh chóng dữ liệu trùng trong Google Sheets.

Giả sử bạn có tập dữ liệu được minh họa dưới đây và bạn muốn xóa tất cả dữ liệu trùng trong tập dữ liệu này.

Dưới đây là các bước để loại bỏ dữ liệu trùng trong Google Sheets:

  1. Chọn tập dữ liệu mà bạn muốn xóa các bản ghi trùng lặp từ đó.

Hình ảnh 1

  1. Đi vào tùy chọn “Dữ liệu” trong menu, sau đó nhấp vào “Dọn dẹp dữ liệu”.

Hình ảnh 2

  1. Nhấp vào tùy chọn “Xóa trùng”.

Hình ảnh 3

  1. Trong hộp thoại “Xóa trùng”, đảm bảo rằng “Dữ liệu có chứa hàng tiêu đề” được chọn (chỉ khi dữ liệu của bạn có hàng tiêu đề).

Hình ảnh 4

  1. Đảm bảo rằng “Chọn tất cả” được chọn (trong phần “Các cột để phân tích”).

Hình ảnh 5

  1. Nhấp vào nút “Xóa trùng”.

Hình ảnh 6

  1. Bạn sẽ nhận được hộp thoại xuất hiện và bạn có thể nhấp vào “OK”.

Hình ảnh 7

Nếu bạn chỉ chọn một cột duy nhất trong menu xóa trùng, nó sẽ xóa các bản sao xuất hiện trong cột đó và toàn bộ hàng chứa bản sao, không giống như việc chọn tất cả.

Trong trường hợp này, 6 hàng đã bị xóa trong khi trước đây chỉ có 5 hàng đã bị xóa.

Hình ảnh 8

Điều gì xảy ra nếu bạn muốn Google Sheets xóa dữ liệu trùng dựa trên một cột?

Để xóa một cột, chỉ cần chọn cột cụ thể và thực hiện cùng quy trình. Cách này sẽ không ảnh hưởng đến các cột khác khi bạn xóa các bản sao.

Tuy nhiên, khi bạn sử dụng tùy chọn “Xóa trùng” của Google Sheets để loại bỏ các bản ghi trùng lặp, điều này sẽ không ảnh hưởng đến các dữ liệu xung quanh.

Nó không xóa hàng hoặc xóa ô nào. Nó chỉ xóa các bản ghi trùng lặp trong các ô (mà không làm phiền các ô xung quanh tập dữ liệu). Sau đó, bạn có thể dễ dàng xóa các hàng có ô trống bằng cách giữ phím CTRL, chọn tiêu đề hàng và xóa các hàng.

Bài viết liên quan: Comment comparer deux colonnes dans Google Sheets

Cách xóa dữ liệu trùng trong Google Sheets bằng cách sử dụng hàm “UNIQUE”

Google Sheets cũng có một hàm mà bạn có thể sử dụng để xóa các giá trị trùng lặp và chỉ giữ lại các giá trị duy nhất. Đó là hàm “UNIQUE”.

Giả sử bạn có tập dữ liệu được minh họa dưới đây và bạn muốn xóa tất cả các bản ghi trùng lặp trong tập dữ liệu này.

Công thức sau sẽ xóa tất cả các hàng trùng lặp và bạn sẽ chỉ có các hàng duy nhất:

=UNIQUE(A2:B17)

Công thức trên sẽ cho bạn kết quả từ ô mà bạn đã nhập công thức vào.

Kết quả là một bảng các bản ghi duy nhất và bạn không thể xóa hoặc sửa đổi một phần của kết quả bảng này. Không có gì xảy ra nếu bạn cố gắng xóa một ô trong kết quả. Và nếu bạn ghi đè lên một ô, toàn bộ kết quả sẽ biến mất và bạn sẽ nhìn thấy một lỗi “#REF!”.

Một trong những hạn chế của việc sử dụng hàm “UNIQUE” là nó chỉ coi các bản ghi là trùng lặp khi toàn bộ nội dung hàng được lặp lại. Nếu bạn chỉ muốn giữ lại một bản ghi duy nhất của một tên quốc gia và xóa tất cả các bản ghi khác, UNIQUE chỉ làm được điều đó nếu các giá trị cột còn lại cho bản ghi đó cũng giống nhau.

Nếu dữ liệu của bạn chứa các khoảng trống thừa, khoảng trống trước hoặc sau, hàm “UNIQUE” sẽ coi các bản ghi khác nhau. Trong trường hợp này, bạn có thể sử dụng công thức sau:

=ArrayFormula(UNIQUE(TRIM(A2:B17)))

Bài viết liên quan: Comment conserver les zéros en début de nombre dans Google Sheets

Cách xóa dữ liệu trùng trong Google Sheets bằng cách sử dụng hàm “QUERY”

Mặc dù hàm “QUERY” trong Google Sheets không được thiết kế đặc biệt để xóa các bản ghi trùng lặp trong một tập dữ liệu, nhưng nó vẫn có thể hoạt động. Hàm “QUERY” thường được sử dụng để lọc và xử lý dữ liệu dựa trên các tiêu chí cụ thể, nhưng bạn cũng có thể xóa các bản ghi trùng trong Google Sheets.

Trong ví dụ của chúng tôi, đây là cách xóa các bản ghi trùng trong Google Sheets bằng cách sử dụng hàm “QUERY”:

  1. Gõ ký hiệu “=” và hàm “QUERY” vào một ô trống.

Hình ảnh 9

  1. Chọn phạm vi dữ liệu.

Hình ảnh 10

  1. Nhập lệnh “=Query(A2:C17,”Select A,B,MIN(C) Group By A,B label MIN(C) ‘2022 GDP’ “)” vào giữa dấu ngoặc kép.

Hình ảnh 11

  1. Đóng ngoặc và nhấp vào “Enter”.

Công thức đầy đủ mà chúng tôi đã sử dụng cho ví dụ này là:

=Query(A2:C17,"Select A,B,MIN(C) Group By A,B label MIN(C) '2022 GDP' ")

Hàm trả về các giá trị duy nhất trong phạm vi đã chọn mà không có các giá trị trùng lặp. Những gì chức năng này làm là nhóm dữ liệu trong phạm vi, điều này loại bỏ các bản ghi trùng lặp. Công thức này yêu cầu một hàm số khác và trong ví dụ của chúng tôi, chúng tôi đã sử dụng “MIN”. Tuy nhiên, bạn cũng có thể sử dụng “SUM” hoặc “MAX”.

Mặc dù có thể xóa các bản ghi trùng trong Google Sheets bằng cách sử dụng hàm “QUERY”, công thức này phức tạp và khó hiểu.

Cách tìm và xóa dữ liệu trùng trong Google Sheets

Đôi khi, bạn muốn xóa các bản ghi trùng trong một bảng tính theo cách chọn lọc hơn là chỉ xóa tất cả các bản trùng. Trong trường hợp này, bạn phải tìm các bản ghi trùng trong dữ liệu của bạn trước.

Bạn có thể tô sáng các bản ghi trùng trong phạm vi dữ liệu bằng cách sử dụng các quy tắc định dạng có điều kiện. Đây là cách bạn làm:

  1. Chọn phạm vi dữ liệu.
  2. Đi vào “Định dạng” và sau đó “Định dạng có điều kiện”.

Hình ảnh 12

  1. Trong hộp thoại định dạng có điều kiện, đi vào danh sách thả xuống “Quy tắc định dạng” và chọn “Công thức tùy chỉnh là”.

Hình ảnh 13

  1. Để tô sáng các bản ghi trùng, nhập công thức sau:

=(COUNTIF($A$1:$A,$A1)>1)*(COUNTIF($B$1:$B,$B1)>1)

Hình ảnh 14

Bạn sẽ thấy rằng các bản ghi trùng trong dữ liệu của bạn được tô sáng. Bạn có thể thay đổi màu tô sáng trong menu định dạng có điều kiện.

Hình ảnh 15

Sau đó, bạn có thể xóa thủ công các hàng trùng lặp trong Google Sheets bằng cách nhấn nút “Xóa” hoặc sử dụng tùy chọn xóa hàng.

Cách tìm các bản ghi trùng trong Google Sheets bằng cách sử dụng bảng dữ liệu tổng hợp

Bảng dữ liệu tổng hợp trong Google Sheets tự động xóa các bản ghi trùng. Nó được sử dụng để tóm tắt dữ liệu bằng cách tổng hợp và ghi lại dữ liệu.

Dưới đây là cách tạo bảng dữ liệu tổng hợp để tìm các bản ghi trùng trong Google Sheets:

  1. Chọn dữ liệu.
  2. Đi vào “Chèn” > “Bảng dữ liệu tổng hợp”.

Hình ảnh 16

  1. Chọn “Sheet mới” hoặc “Sheet hiện có” và nhấp vào “Tạo”.

Hình ảnh 17

  1. Trong trình chỉnh sửa bảng dữ liệu tổng hợp, đi vào “Dòng” và nhấp vào “Thêm”.

Hình ảnh 18

  1. Chọn các dòng bạn muốn hiển thị mà không có bản ghi trùng.

Hình ảnh 19

  1. Sau khi đã thêm các giá trị, bạn sẽ thấy cột có tiêu đề là “Count of Count”. Cột này cho biết bao nhiêu lần giá trị được lặp lại trong dữ liệu. Điều này giúp bạn xác định các bản ghi trùng.

Bạn sẽ thấy rằng dữ liệu của bạn được sắp xếp theo thứ tự từ điển và không có bản ghi trùng.

Cách xóa dữ liệu trùng bằng cách sử dụng tiện ích Google Sheets

Google Sheets hỗ trợ một thư viện lớn các tiện ích khác nhau để giải quyết mọi vấn đề có thể tưởng tượng được.

Các tiện ích xóa bản sao có thể được sử dụng cho mục đích này. Tiện ích “Remove Duplicates” của Google Sheets được phát triển bởi Ablebits là một trong những tiện ích tốt nhất để xóa bản sao từ tập dữ liệu của bạn.

Để sử dụng một tiện ích, bạn phải thêm nó vào tài liệu Google Sheets của bạn trước.

Dưới đây là các bước để thêm một tiện ích vào tài liệu Google Sheets của bạn:

  1. Mở tài liệu Google Sheets mà bạn muốn xóa bản sao trong đó.
  2. Nhấp vào tab “Tiện ích”.

Hình ảnh 20

  1. Nhấp vào “Lấy tiện ích”.

Hình ảnh 21

  1. Trong hộp thoại “Tiện ích” mở ra, tìm kiếm “Remove duplicate” trong ô tìm kiếm ở góc trên bên phải.

Hình ảnh 22

  1. Trong danh sách tiện ích hiển thị, nhấp vào tiện ích “Remove Duplicate”.

Hình ảnh 23

  1. Trong màn hình “Remove Duplicates” của tiện ích, nhấp vào nút màu xanh “Cài đặt”.

  2. Trong hộp thoại xuất hiện, có thể yêu cầu bạn xác minh tài khoản của mình bằng cách đăng nhập vào tài khoản Gmail của bạn. Nhập thông tin liên quan và nhấp vào nút màu xanh “Cho phép”.

Các bước trên sẽ thêm tiện ích “Remove Duplicate” vào tài liệu Google Sheets của bạn và bạn có thể sử dụng nó từ đó.

Dưới đây là các bước để sử dụng tiện ích này để xóa bản sao trong Google Sheets:

  1. Chọn tập dữ liệu mà bạn có các bản ghi trùng mà bạn muốn xóa.

  2. Nhấp vào tùy chọn “Tiện ích” trong menu.

Hình ảnh 24

  1. Di chuột qua tùy chọn “Remove Duplicates”.

  2. Nhấp vào “Find duplicate or unique rows”. Điều này sẽ mở hộp thoại “Find duplicate or unique rows” (có thể mất vài giây).

Hình ảnh 25

  1. Trong bước 1, hãy đảm bảo rằng phạm vi chính xác được chọn. Bạn cũng có thể chọn ô để tạo bản sao lưu cho tài liệu Google Sheets của bạn.

Hình ảnh 26

  1. Trong bước 2, hãy đảm bảo rằng “Duplicates” được chọn.

Hình ảnh 27

  1. Trong bước 3, chỉ định liệu dữ liệu của bạn có tiêu đề hay không và liệu bạn muốn bỏ qua các ô trống hay không.

  2. Trong bước 4, chọn tùy chọn “Remove rows in selection”. Điều này sẽ xóa các hàng trùng lặp.

  3. Nhấp vào “Finish”.

Các bước trên sẽ ngay lập tức xóa các bản sao trong Google Sheets và bạn chỉ còn lại các bản ghi duy nhất.

Vì Google Sheets có thể nhanh chóng xóa bản sao bằng cách sử dụng một tính năng có sẵn, nên nó nên được sử dụng nếu có thể. Lý do duy nhất tôi khuyên bạn nên sử dụng tiện ích là khi bạn muốn làm nhiều hơn chỉ xóa bản sao.

Tiện ích này cũng có thể thực hiện các hoạt động sau:

  • Tô sáng các bản ghi trùng
  • Thêm cột và chỉ định các bản ghi trùng
  • So sánh các cột hoặc các sheet

Phương pháp nào để xóa dữ liệu trùng trong Google Sheets hiệu quả nhất?

Phương pháp phù hợp nhất phụ thuộc vào yêu cầu cụ thể và độ phức tạp của dữ liệu của bạn. Tuy nhiên, phương pháp hiệu quả nhất để xóa các mục đã trùng lặp trong Google Sheets là sử dụng tính năng “Xóa trùng” có sẵn trong Google.

Phương pháp này đơn giản và hiệu quả để xóa các mục trùng lặp trong một cột hoặc nhiều cột cùng một lúc.

Kết luận

Trong bài viết này, chúng tôi đã chỉ cho bạn cách loại bỏ các mục trùng lặp trong Google Sheets bằng ba cách: sử dụng menu “Xóa trùng”, sử dụng hàm “UNIQUE” và tô sáng và xóa thủ công.

Có nhiều cách khác để làm điều này, nhưng đây là những cách dễ dàng và đơn giản nhất. Bây giờ chúng tôi đã chỉ cho bạn cách xóa các mục trùng lặp trong Google Sheets, bạn nên có thể làm điều này một cách độc lập.

Nếu bạn thấy hướng dẫn này về việc xóa các mục trùng lặp trong Google Sheets hữu ích, bạn cũng có thể thích những hướng dẫn sau:

  • Cách ẩn giá trị trống trong Google Sheets
  • Cách lọc theo màu trong Google Sheets
  • Cách xóa các hàng trống trong Google Sheets
  • Cách đếm các ô có một văn bản cụ thể trong Google Sheets
  • Cách tìm kiếm trong Google Sheets
  • Định dạng có điều kiện dựa trên một ô khác
  • Cách so sánh hai cột trong Google Sheets

Related posts