Analytics Pane in Tableau

Bài viết này mình hướng dẫn các bạn tạo một số kiểu đường phân tích trong Tableau khi phân tích dữ liệu.
This article is to help you create some analysis line in Tableau when analyzing data.


Cùng xem qua biểu đồ bên dưới. Biểu đồ mô tả lợi nhuận của mỗi loại hàng hoá (sub-category) thuộc mỗi phân lớp (category) khác nhau.
Let’s look at the below chart. It illustrates the ratio profit of each sub-caterogy in every category.

Chúng ta sẽ sử dụng Analytics Pane để thực hiện một số phân tích.
We will use Analytics Pane to do some analysis.



1. Summarise

1.1. Constant Line

Constant Line – đường cố định: cho phép người dùng nhập thông số tuỳ ý cho đường này

Constant Line: value = 25000

Constant Line: value = -10000

1.2. Average Line

Average Line cho phép người dùng thêm đường trung bình vào 3 đối tượng: table (chung cho toàn bảng), pane (theo phân lớp), cell (theo từng ô).

(1) Table Average = 17,194

(2) Pane Average:
– Furniture = 4,932
– Office Supplies = 14,003
– Technology = 36,636

(3) Cell Average: đường trung bình theo mỗi cột trong trường hợp này không phát huy tác dụng bằng chính giá trị trung bình của cột đó.

1.3. Median with Quartiles

Median with Quartiles cho phép người dùng thêm đường trung điểm và các đường tứ phân vị vào 3 đối tượng: table (chung cho toàn bảng), pane (theo phân lớp), cell (theo từng ô).

Table Median with Quartiles:

Pane Median with Quartiels:

Cell Median with Quartiles:

1.4. Totals

Totals cho phép người dùng thêm các đường tổng theo 3 cách: Subtotals (theo từng phân lớp một), Column Grand Totals (theo mỗi cột), Row Grand Totals (theo mỗi hàng). Vì đây là biểu đồ cột, nên Column Grand Totals không thể được thêm vào trong trường hợp này.

Chúng ta cần đổi biểu đồ sang dạng bảng và thêm một số thông tin để có thể thêm vào các đường tổng hợp.

Subtotals: tính trung bình cộng của mỗi category theo từng năm.

Columns Grand Totals: tính trung bình cộng theo mỗi năm

Row Grand Totals: tính trung bình cộng cho mỗi sub-category


2. Model

2.1. Average with 95% CI

Average with 95% Confident Interval cho phép người dùng thêm đường trung bình và vùng thuộc khoảng tin cậy 95% vào 3 đối tượng: table (chung cho toàn bảng), pane (theo phân lớp), cell (theo từng ô).

Table Average with 95% Confident Interval:

Pane Average with 95% Confident Interval:

Cell Average with 95% Confident Interval (giống Cell Average Line):

2.2. Median with 95% CI

Median with 95% Confident Interval cho phép người dùng thêm đường trung điểm và vùng thuộc khoảng tin cậy 95% vào 3 đối tượng: table (chung cho toàn bảng), pane (theo phân lớp), cell (theo từng ô).

Table Median with 95% Confident Interval:

Pane Median with 95% Confident Interval:

Cell Median with 95% Confident Interval (giống Cell Average Line):

2.3. Cluster

Phân cụm dữ liệu là một tính năng rất hay trên Tableau giúp người dùng dễ dàng phân lớp các điểm dữ liệu có cùng dimension.
Clustering is a powerful feature in Tableau that allows you to easily group similar dimension members.

Để thêm cluster vào biểu đồ, chúng ta sẽ sử dụng các trường thông tin:
To add a cluster to the view, we use some dimension and measures as follow:
– Columns shelf: Order Date (break down to DAY)
– Rows shelf: Profit (aggregated to SUM)
– Color Mark: Segment

Biểu đồ bên dưới thoạt rất khó nhìn vì có rất nhiều điểm dữ liệu với 3 màu sắc trộn lẫn vào nhau, rất khó để tìm ra được insight.
The below view makes users difficult to come up with any insights because there are so many colorful points blending with each other.

Sau khi thêm cluster vào biểu đồ, các điểm dữ liệu được phân vào 3 lớp: Cluster 1, Cluster 2 và Cluster 3. Trong đó, các điểm có lợi nhuận cao thuộc phân cụm màu đỏ, các điểm có lợi nhuận trung bình thuộc phân cụm màu cam, và còn lại thuộc phân cụm màu xanh dương – các điểm có lợi nhuận thấp và thậm chí là âm.
After adding the cluster to the view, these data points were classified as 3 classes: Cluster 1, Cluster 2, Cluster 3 where these high profit points, average profit points, low profit or even negative profit points were added to red cluster, orange cluster and green cluster, respectively.

Có rất nhiều biểu đồ mà trong đó có quá nhiều category, điều này làm người xem rất khó để đưa ra kết luận.
There are several views which have numerous categories making users to feel so hard to get any insights from them. I can’t stand when watching the below view.

Tuy nhiên, sau khi biểu đồ được thêm phân cụm, chúng ta sẽ nhận ra được điểm dữ liệu nào thuộc phân lớp nào.
However, adding a cluster could help us to identify which groups any points belong to.

2.4. Trend Line

Để thêm được đường xu hướng, dữ liệu cần phải có hai biến số hoặc một biến số đi kèm với một trục thời gian. Như trường hợp dưới đây, chúng ta không thể thêm được đường xu hướng, vì biểu đồ chỉ có một biến số và không đi kèm với trục thời gian.
To add a trend line to the view, your data need to have at least two numerical variables or a combination of one numerical variable and time series axis. Like the view below, we can not add the trend line to it, because that chart just had one numerical variables and did not have time series axis.

Đường xu hướng dưới đây mô tả sự tương quan giữa hai biến số Profit và Sales.
The trend line below illustares the correlation between two numerical variables: Profit and Sales.

Hay những đường xu hướng dưới đây mô tả xu hướng lợi nhuận của các phân nhóm hàng hoá khác nhau theo thời gian.
Or these trend lines below show the trend of the profit of each categories over time.

2.5. Forecast

Giống với đường xu hướng, để thêm được đường dự báo, biểu đồ cần phải có trục thời gian. Đồng thời, dữ liệu không được sử dụng Table Calculation – phép tính ở dạng bảng.
Like the trend line I mentioned above, adding the forecast line to the chart requires your data must have time series axis. Moreover, your data does not have to applied Table Calculation.

Cùng xem qua một biểu đồ mô tả doanh thu theo thời gian như hình bên dưới.
Let’s look at the below view showing the sales overtime.

Sau khi thêm đường dự báo vào biểu đồ, chúng ta có thể dự đoán được doanh số trong các quý tiếp theo.
After adding the forecast line to the view, we can predict the sales in several next quarters.


3. Custom

3.1. Reference Line

Đường tham chiếu về bản chất hoạt động giống với Contanst Line. Chúng ta có thể định dạng đường tham chiếu trở thành đường tổng, đường trung bình, đường lớn nhất hay nhỏ nhất cho cả bảng, cho mỗi phân lớp hay cho mỗi cột.
Reference lines basically work as the constant lines. We can format reference lines as total lines, average lines, maximum lines, minimum lines in the table, panes or cells.

3.2. Reference Band

Vùng tham chiếu cho phép người dùng tô xám vùng dữ liệu mong muốn trên biểu đồ. Tô xám từ giá trị nhỏ nhất đến giá trị trung bình, hoặc tô xám từ giá trị nhỏ nhất đến giá trị lớn nhất, hoặc tô xám từ giá trị trung bình đến giá trị lớn nhất.
Reference Band allows users to highlight wanted ranges on the view. From minimum line to average line, or minimum line to maximum line, or average line to maximun line,…

Reference Band cho phép người dùng tạo vùng tham chiếu cho 3 đối tượng: table (chung cho toàn bảng), pane (theo phân lớp), cell (theo từng ô).

3.3. Distribution Band

Vùng phân phối là vùng được tạo ra từ các tính toán dựa trên percentiles – bách phân vị, deciles – thập phân vị, quintiles – ngũ phân vị, quartiles – tứ phân vị, tertiles – tam phân vị, standard deviation – độ lệch chuẩn dựa trên tổng thể (population) hoặc mẫu (sample).
Distribution band is created from some computations based on percentiles, quintiles, quartiles, tertiles and standard deviation of the population or the sample.

Distribution Band cho phép người dùng tạo vùng phân phối cho 3 đối tượng: table (chung cho toàn bảng), pane (theo phân lớp), cell (theo từng ô).

3.4. Box Plot

Box Plot được tạo ra dựa trên toàn bộ dữ liệu trong biểu đồ. Tính năng này hoạt động giống biểu đồ Box Plot:
– cái hộp được vẽ từ ba đường: tứ phân vị thứ nhất, đường trung điểm, tứ phân vị thứ ba,
– đường cản bên dưới là giá trị nhỏ nhất, đường cản bên trên là giá trị lớn nhất.
– sợi bên dưới là khoảng cách từ giá trị nhỏ nhất đến tứ phân vị thứ nhất, sợ bên trên là khoảng cách từ tứ phân vị thứ ba đến giá trị lớn nhất.
Box Plot is drawn from all of values on the view. The feature is the same as Box Plot view:
– a box created from three lines: first quartile, median and third quartile lines
– lower sole is the distance between the minimum and first quartile lines, upper sole is the one between the third quartile to maximum lines.

Hi vọng các bạn thấy bài viết hữu ích!
Hopy you guys like this post!

Leave a comment