Cách tạo biểu đồ Pareto trong Google Sheets từng bước

crawlan

Để tạo một biểu đồ Pareto, chúng ta có thể sử dụng biểu đồ combo trong Google Sheets vì biểu đồ Pareto là sự kết hợp của biểu đồ cột và biểu đồ đường.

Tuy nhiên, tại thời điểm viết bài này, biểu đồ Pareto không có sẵn trong danh sách các loại biểu đồ trong Google Sheets. Vì không phải là một loại biểu đồ tích hợp sẵn, Google không có tài liệu chính thức về cách định dạng dữ liệu để tạo biểu đồ Pareto trong Google Sheets.

Vì vậy, ngoài hướng dẫn từng bước để tạo một biểu đồ Pareto, bài viết này cũng trình bày cách định dạng dữ liệu chi tiết.

Biểu đồ Pareto trong phân tích dữ liệu trên Google Sheets

Tên biểu đồ Pareto xuất phát từ tên của nhà kinh tế người Ý, Vilfredo Pareto (15 tháng 7 năm 1848 – 19 tháng 8 năm 1923).

Biểu đồ Pareto dựa trên nguyên tắc Pareto, còn được gọi là nguyên tắc 80/20, nghĩa là cho nhiều sự kiện, xấp xỉ 80% tác động đến từ 20% nguyên nhân.

Nói cách khác, bằng cách giải quyết 20% vấn đề (nguyên nhân), bạn có thể giải quyết phần lớn vấn đề.

Mục đích của biểu đồ Pareto

Biểu đồ Pareto được sử dụng phổ biến nhất trong kiểm soát chất lượng.

Mục đích của biểu đồ Pareto là nhấn mạnh/chọn ra thành phần hoặc yếu tố quan trọng nhất. Nói cách khác, nhấn mạnh một số nguyên nhân (ít nhất) tạo ra hiệu ứng toàn cầu đáng kể.

Ví dụ, bằng cách sử dụng biểu đồ Pareto, chúng ta có thể phân tích các vấn đề (defects) xảy ra thường xuyên nhất theo từng loại (nguyên nhân) một cách tổng quát. Điều đó có nghĩa là bằng cách phân loại các nguyên nhân rộng rãi, chúng ta có thể phân tích các thành phần cụ thể.

Cách đọc biểu đồ Pareto

Như đã đề cập, biểu đồ này là sự kết hợp giữa cột và đường.

Trục ngang của biểu đồ là cho danh mục (Nguyên nhân) và các cột được sắp xếp theo thứ tự giảm dần (từ cao đến thấp) từ trái sang phải.

Trục đứng (trục trái) biểu thị tần suất xảy ra (ở đây là Số lần xảy ra).

Thông thường sẽ có một trục phụ (trục phải) biểu thị tỉ lệ phần trăm tích lũy của tổng số lần xảy ra (ở đây là Số lần xảy ra) hoặc tổng của đơn vị đo lường cụ thể.

Từ biểu đồ này, bạn có thể hiểu rằng 80% sự giảm doanh số bị gây ra bởi khả năng tiếp cận, chất lượng sản phẩm và nhân viên bán hàng kém. Làm thế nào?

Hãy lấy tổng giá trị của các yếu tố quan trọng (3 cột/cột thứ nhất) và chia cho tổng giá trị (tất cả các cột/cột).

=(74+62+52)/(74+62+52+17+12+9+6+4)

Thời gian và Định dạng dữ liệu

Trước tiên, quyết định khoảng thời gian để phân tích dữ liệu cho biểu đồ Pareto. Khoảng thời gian có thể là một ngày, một tuần/làm việc, một chu kỳ làm việc và như vậy.

Đơn vị đo lường có thể là tần suất/chi phí/số lượng/thời gian tùy thuộc vào tính chất công việc của bạn. Ghi lại dữ liệu và tóm tắt chúng theo từng danh mục.

Phân tích Pareto trên Google Sheets rất dễ dàng vì chúng ta có thể sử dụng hàm Truy vấn (Query) tương tự như SQL để tóm tắt dữ liệu. Tôi sẽ giải thích nó bên dưới.

Đối với những người muốn biết thêm chi tiết về biểu đồ Pareto, tôi khuyến nghị đọc bài viết Wiki về chủ đề này.

Cách định dạng dữ liệu để tạo biểu đồ Pareto trong Google Sheets?

Giả sử bạn đã ghi lại các lỗi (vấn đề được báo cáo) một cách riêng lẻ trong cột A và nguyên nhân (danh mục) của nó trong cột B cho một khoảng thời gian làm việc cụ thể.

Từ dữ liệu này, chúng ta không thể trực tiếp tạo biểu đồ Pareto. Chúng ta cần tóm tắt dữ liệu dựa trên danh mục. Có nghĩa là số lỗi dựa trên nguyên nhân.

Dưới đây, bạn có thể tìm hiểu cách tóm tắt tập dữ liệu để tạo biểu đồ Pareto trong Google Sheets.

Truy vấn trong phân tích Pareto để nhóm lỗi theo danh mục (Nguyên nhân)

Dữ liệu mẫu trong A1:B:

Dữ liệu có khoảng 100 hàng. Tôi chỉ hiển thị một số hàng đầu để bạn hiểu cấu trúc dữ liệu.

Tóm tắt Nguyên nhân (Danh mục)

Để tóm tắt dữ liệu cho biểu đồ, chúng ta có thể sử dụng công thức Query sau đây trong ô D1 (trước khi chèn công thức hãy đảm bảo cột D và E trống).

=query(A1:B,”Chọn B, count(B) nơi B không null nhóm qua B”,1)

Nó bao phủ toàn bộ dữ liệu trong cột A và B. Nghĩa là toàn bộ cột vì bất kỳ lần ghi lại ở các cột này trong tương lai sẽ được tự động bao gồm trong bảng tóm tắt.

Tôi nhận được bảng tóm tắt sau đây:

Nguyên nhân Số lượng Nguyên nhân
A 15
B 10
C 20
D 5
E 30
F 22
G 8

Sắp xếp Số lượng Lỗi theo thứ tự giảm dần

Chúng ta phải sắp xếp cột ‘Số lượng Lỗi’ theo thứ tự giảm dần (Z-A) vì biểu đồ Pareto yêu cầu như vậy. Nếu không, bạn sẽ tạo ra một biểu đồ cột thông thường.

Để làm điều đó (sắp xếp Z-A), chúng ta có thể sửa công thức Query trên để bao gồm Mệnh đề ‘Sắp xếp theo’ để sắp xếp cột.

=query(A1:B,”Chọn B, count(B) nơi B không null nhóm qua B sắp xếp theo count(B) desc”,1)

Trong báo cáo tóm tắt, nhãn cột thứ hai là ‘Số lượng Nguyên nhân’. Tùy ý, chúng ta có thể định dạng nhãn đó thành ‘Số lượng’ bằng cách sử dụng Mệnh đề Label trong Query.

Công thức Query trong ô D1:

=query(A1:B,”Chọn B, count(B) nơi B không null nhóm qua B sắp xếp theo count(B) desc nhãn count(B) ‘Số lượng'”,1)

Kết quả (tóm tắt) trong ô D1:E:

Nguyên nhân Số lượng
E 30
F 22
C 20
A 15
B 10
G 8
D 5

Bạn có thể thích: Thứ tự Mệnh đề Đúng trong Truy vấn Google Sheets?

Để tạo biểu đồ Pareto trong Google Sheets, chúng ta cần thêm hai cột dữ liệu nữa. Cột F và G với phần trăm phân phối của ‘Nguyên nhân’ và phần trăm tích lũy.

Phân phối phần trăm của các Nguyên nhân

Nhập nhãn “% phân phối” vào ô F1. Sau đó, trong ô F2 sử dụng công thức sau để tính phần trăm của mỗi nguyên nhân.

=E2/tổng($E$2:$E)

Bạn phải sao chép dán công thức này vào F3:F6.

Bước tiếp theo là chọn phạm vi F2:F6 và định dạng các số thành phần trăm (Định dạng > Số > Phần trăm).

Muốn thay thế công thức (F2:F6) trên bằng một công thức mảng? Sau đó, hãy xóa nhãn trong ô F1 và cũng xóa tất cả các công thức từ F2:F6.

Sau đó, chèn công thức sau vào ô F1 (không cần sao chép dán xuống).

={“% phân phối”;ArrayFormula(nếu (len(D2:D),to_percent(E2:E/tổng(E2:E)),))}

Related posts