Cách Trích Xuất Ngẫu Nhiên Một Phần Trăm Nhất Định Của Các Hàng Trong Google Sheets

Bạn có thể trích xuất ngẫu nhiên một phần trăm nhất định của các hàng trong Google Sheets bằng cách sử dụng các công thức. Điều này sẽ hữu ích trong trường hợp chọn 10% dữ liệu từ một số lượng lớn đăng ký hình thức hoặc tương tự.

Thực tế, tôi có hai phương pháp để giải quyết vấn đề này. Một phương pháp hoàn toàn dựa trên công thức, trong khi phương pháp khác lại không.

Tôi sẽ cung cấp cho bạn cả hai phương pháp này và mỗi phương pháp đều có ưu điểm và nhược điểm riêng.

Cách Sử Dụng Công Thức Để Trích Xuất Ngẫu Nhiên Một Phần Trăm Nhất Định Của Các Hàng Trong Sheets

Đây là phương pháp hoàn toàn dựa trên công thức. Công thức hoạt động như sau.

  1. Tạo một tập hợp các số ngẫu nhiên bằng cách sử dụng hàm RANDBETWEEN theo một cách độc đáo.
  2. Sử dụng các số ngẫu nhiên đó để sắp xếp dữ liệu.
  3. Tìm phần trăm hàng cần trích xuất.
  4. Giới hạn số lượng hàng bằng cách sử dụng hàm Array_Constrain hoặc Query.

Tôi sẽ chỉ bạn cách từng bước dưới đây. Nhưng trước tiên, chúng ta cần một mẫu dữ liệu để làm việc. Đây là một ví dụ.

Bước 1:

Cách Tạo Một Tập Hợp Các Số Ngẫu Nhiên Duy Nhất Trong Google Sheets

Để tạo các số ngẫu nhiên duy nhất trong tất cả các hàng không trống, bạn có thể sử dụng công thức kết hợp dưới đây trong Google Spreadsheets.

=ArrayFormula(if(len(A2:A),randbetween(row(A1:A),9^9),))

Vì mẫu dữ liệu của chúng ta chứa dữ liệu trong 13 hàng (không tính nhãn trường), công thức này sẽ tạo ra 13 số ngẫu nhiên.

Công thức này hoạt động như sau.

  • Dùng hàm LEN để kiểm tra các ô không trống trong phạm vi dữ liệu.
  • Hàm ROW trong RANDBETWEEN cung cấp 20 số cho đối số “low”, tức từ 1 đến 20.
  • Đối số “high” là số 387420489 (9^9).

Vì vậy, công thức trên sẽ tạo ra 20 số duy nhất từ 1 đến 387420489, từ 2 đến 387420489 … từ 20 đến 387420489.

Bước 2:

Cách SẮP XẾP Dữ Liệu Theo Thứ Tự Ngẫu Nhiên Trong Google Sheets

Tôi sẽ SẮP XẾP dữ liệu ở trên một cách ngẫu nhiên. Sử dụng các số ngẫu nhiên duy nhất trên làm cột sắp xếp trong hàm SORT.

Khi sử dụng hàm SORT, bạn có thể bỏ qua ArrayFormula.

=sort(A2:B,if(len(A2:A),randbetween(row(A1:A),9^9),),0)

Điều này sẽ sắp xếp ngẫu nhiên các dữ liệu trong Google Sheets.

Bước 3:

Cách Tìm Một Phần Trăm Nhất Định Của Tổng Dữ Liệu Trong Google Sheets

Giả sử số lượng hàng trong tập dữ liệu là 100%. Bạn có thể tìm số lượng hàng trong một tập dữ liệu trong Google Sheets bằng cách sử dụng hàm COUNTA.

Nhân số hàng đó với giá trị phần trăm. Ví dụ, tôi muốn tìm 50% hàng trong phạm vi A2:B14. Tôi có thể sử dụng công thức sau.

=round(counta(A2:A)*0.5)

Lưu ý, bạn cũng có thể sử dụng hàm PERCENTILE như sau. Đây chỉ là ví dụ tham khảo.

=ArrayFormula(PERCENTILE(if(LEN(A2:A),row(A1:A),),0.5))

Bước 4:

Cách Giới Hạn Số Lượng Hàng Với Một Phần Trăm Nhất Định

Thực ra, đây là công thức cuối cùng của chúng ta. Tôi kết hợp tất cả các công thức trên vào đây.

Cú pháp của hàm ARRAY_CONSTRAIN:

ARRAY_CONSTRAIN(input_range, num_rows, num_cols)

Thay thế “input_range” bằng công thức trong Bước 2 ở trên và “num_rows” bằng công thức trong Bước 3. “num_cols” tất nhiên là 2, tức số cột trong mẫu dữ liệu của chúng ta.

Công thức cuối cùng:

=array_constrain(sort(A2:B,if(len(A2:A),randbetween(row(A1:A),9^9),),0),round(counta(A2:A)*0.5),2)

Như vậy bạn có thể trích xuất một phần trăm nhất định các hàng ngẫu nhiên trong Google Sheets.

Randomly Extract a Certain Percentage of the Rows

Giờ hãy thảo luận về các ưu điểm và nhược điểm của công thức trên.

Ưu điểm:

  • Với sự trợ giúp của công thức này, bạn có thể sao chép ngẫu nhiên ‘n’ phần trăm các hàng trong Google Sheets.

Nhược điểm:

  • Kết quả của công thức sẽ được xếp hạng mỗi khi bạn thay đổi sheet của mình. Bởi vì hàm RANDBETWEEN là một hàm không ổn định.

Bạn có thể cần sao chép và dán giá trị kết quả của công thức để tránh những thay đổi này.

Xáo Trộn Phạm Vi và Sao Chép Ngẫu Nhiên ‘n’ Phần Trăm Của Các Hàng Trong Sheets

Lần này, tôi sử dụng tùy chọn “Xáo trộn phạm vi” trong menu dữ liệu thay vì hàm RANDBETWEEN. Các bước khác sẽ tương tự như trên.

Công thức rất đơn giản này. Đây là công thức bạn muốn sử dụng để sao chép ngẫu nhiên ‘n’ phần trăm các hàng.

=array_constrain(A2:B,round(counta(A2:A)*0.5),2)

Dưới đây là các bước để sử dụng công thức này.

  1. Chọn dữ liệu A2:B14.
  2. Đi vào menu Dữ liệu và chọn “Xáo trộn phạm vi”.
  3. Áp dụng công thức trên vào bất kỳ ô trống nào.

Chỉ cần vậy thôi. Bạn cũng có thể áp dụng phương pháp này để trích xuất ngẫu nhiên một phần trăm nhất định các hàng trong Google Sheets. Dưới đây là các ưu điểm và nhược điểm.

Ưu điểm:

  1. Cải thiện hiệu suất của Sheets.
  2. Kết quả công thức sẽ không thay đổi tự động. Thay đổi chỉ xảy ra nếu bạn thay đổi dữ liệu nguồn.

Nhược điểm:

  1. Đây là phương pháp bán tự động. Người dùng cần phải xáo trộn phạm vi thủ công.

Đó là tất cả. Chúc bạn có những trải nghiệm thú vị!

Tài liệu tham khảo thêm:

  1. Cách Chọn Ngẫu Nhiên N Số Từ Một Cột Trong Google Sheets
  2. Google Sheets: Macro dựa trên việc chọn tên ngẫu nhiên
  3. Cách Xáo Trộn Hàng Trong Google Sheets Mà Không Cần Plugin
  4. Cách Chọn Ngẫu Nhiên Một Tên Từ Danh Sách Dài Trong Google Sheets

Related posts