Máy Tính Thống Kê
Công cụ máy tính tứ phân vị


Công cụ máy tính tứ phân vị

Công cụ Máy Tính Tứ Phân Vị giúp tìm các tứ phân vị thứ nhất (Q1), thứ hai (Q2), và thứ ba (Q3), phạm vi liên tứ phân vị (interquartile range), giá trị lớn nhất và nhỏ nhất, cũng như phạm vi của một tập dữ liệu.

Thống Kê Phân Vị
Phân Vị Thứ Nhất (Q1) 25
Phân Vị Thứ Hai (Q2) 55
Phân Vị Thứ Ba (Q3) 75
Phạm Vi Tứ Phân Vị (IQR) 50
Trung Vị = Q2 (x˜) 55
Tối thiểu 10
Tối đa 100
Phạm Vi (R) 90

Có lỗi với phép tính của bạn.

Mục lục

  1. Tứ Phân Vị
  2. Cách tính các tứ phân vị
  3. Phạm vi liên tứ phân vị
  4. Giá trị lớn nhất và nhỏ nhất
  5. Phạm vi của một tập dữ liệu
  6. Ứng dụng tính toán tứ phân vị trong thực tế

Công cụ máy tính tứ phân vị

Công cụ Máy Tính Tứ Phân Vị thực sự hữu ích khi bạn muốn tìm 5 thông số tổng quan (five-number summary) cho biểu đồ Hộp. Công cụ thống kê này sẽ tính toán Tứ phân vị Thứ nhất (Q1), Tứ phân vị thứ hai (Q2) hoặc trung vị, Tứ phân vị thứ ba (Q3), giá trị lớn nhất và nhỏ nhất của tập dữ liệu đã cho. Ngoài ra, nó cũng tính toán phạm vi liên tứ phân vị và phạm vi của tập dữ liệu.

Bạn chỉ cần nhập hoặc sao chép và dán dữ liệu và nhấn nút "tính toán" (Calculate). Hãy nhớ ngăn cách các số bằng dấu phẩy hoặc khoảng trắng.

Tứ Phân Vị

Tứ phân vị là một trong các đại lượng mô tả vị trí. Chúng giúp mô tả vị trí của một giá trị so với các giá trị khác trong một tập dữ liệu.

Các tứ phân vị được sử dụng để chia một tập hợp dữ liệu tăng dần (dữ liệu được sắp xếp theo thứ tự tăng dần) thành bốn phần bằng nhau. Mỗi phần chứa một số lượng bằng nhau các phần tử. Chúng ta có thể tính toán ba tứ phân vị cho một tập dữ liệu.

  • Tứ phân vị đầu tiên (Q1 hoặc tứ phân vị dưới)
  • Tứ phân vị thứ hai (Q2 hay còn gọi là Trung vị)
  • Tứ phân vị thứ 3 (Q3 là tứ phân vị trên)

Tứ phân vị thứ nhất (Q1) là giá trị dữ liệu chia tách phần dưới 25% và phần trên 75% của dữ liệu được sắp xếp theo thứ tự tăng dần. Do đó, tứ phân vị đầu tiên có 25% số phần tử thấp hơn và 75% số phần tử lớn hơn nó. Tứ phân vị này tương đương với phân vị thứ 25 của tập dữ liệu.

Tứ phân vị thứ hai (Q2) là giá trị dữ liệu chia tách phần dưới 50% và phần trên 50% của dữ liệu được sắp xếp theo thứ tự tăng dần. Do đó, phân vị thứ hai có 50% số phần tử thấp hơn và 50% số phần tử lớn hơn nó. Phân vị thứ hai hoàn toàn bằng với trung vị cũng như phân vị thứ 50 của tập dữ liệu.

Tứ phân vị thứ ba (Q3) là giá trị dữ liệu chia tách phần dưới 75% và phần trên 25% của dữ liệu được sắp xếp theo thứ tự tăng dần. Do đó, phân vị thứ ba có 75% số phần tử thấp hơn và 25% số phần tử lớn hơn nó. Tứ phân vị này tương đương với phân vị thứ 75 của tập dữ liệu.

Cách tính các tứ phân vị

Bạn có thể làm theo các bước dưới đây để tìm các tứ phân vị:

  • Sắp xếp dữ liệu theo thứ tự tăng dần.
  • Tìm trung vị của các giá trị dữ liệu. Đây là tứ phân vị thứ hai.
  • Tìm trung vị của các giá trị dữ liệu nằm dưới tứ phân vị thứ hai. Đây là tứ phân vị thứ nhất.
  • Tìm trung vị của các giá trị dữ liệu nằm trên tứ phân vị thứ hai. Đây là tứ phân vị thứ ba.

Ví dụ 1

Bộ dữ liệu sau đây thể hiện mức lương khởi điểm của kế toán viên mới tốt nghiệp ở một trường cao đẳng. Tìm trung vị (Q2), tứ phân vị dưới (Q1) và tứ phân vị trên (Q3) cho các mức lương khởi điểm. Diễn giải kết quả của bạn.

$55.000, $60.000, $52.000, $45.000, $74.000, $75.000, $48.000, $58.000, $72.000, $66.000, $45.000, $50.000, $54.000, $65.000, $71.000

Lời giải

Đầu tiên chúng ta sẽ sắp xếp dữ liệu theo thứ tự tăng dần.

$45.000, $45.000, $48.000, $50.000, $52.000, $54.000, $55.000, $58.000, $60.000, $65.000, $66.000, $71.000, $72.000, $74.000, $75.000

Sau đó, chúng ta sẽ tìm vị trí của tứ phân vị thứ hai hay còn gọi là trung vị.

$$\text{Phân vị thứ hai }(Q2) = \left(\frac{N+1}{2}\right)^{\text{th}}\text{ phần tử} = \left(\frac{15+1}{2}\right)^{\text{th}}\text{ phần tử} = 8^{\text{th}}\text{ phần tử} = 58.000$$

Tiếp theo, tìm giá trị trung vị của các giá trị dữ liệu bên dưới Q2 để tìm Q1.

45.000 USD, 45.000 USD, 48.000 USD, 50.000 USD, 52.000 USD, 54.000 USD, 55.000 USD

Tứ phân vị thứ nhất (Q1) = 50.000 USD

Tiếp theo, tìm giá trị trung vị của các giá trị dữ liệu trên Q2 để tìm Q3.

60.000 USD, 65.000 USD, 66.000 USD, 71.000 USD, 72.000 USD, 74.000 USD, 75.000 USD

Tứ phân vị thứ ba (Q3) = $71.000

Bạn có thể giải thích các tứ phân vị như sau.

25% kế toán viên mới tốt nghiệp kiếm được ít hơn 50.000 USD và 25% kiếm được hơn 71.000 USD. 50% kế toán viên mới tốt nghiệp kiếm được hơn 58.000 USD, trong khi 50% còn lại kiếm được ít hơn thế.

Bạn có thể thấy rằng từ ví dụ trên, đối với số lượng dữ liệu lẻ, giá trị các tứ phân vị sẽ là giá trị dữ liệu của chính tập dữ liệu. Tuy nhiên, với số lượng dữ liệu chẵn, các tứ phân vị sẽ không tương ứng với các giá trị của tập dữ liệu. Hãy sửa đổi ví dụ trên để hiểu rõ điều này.

Ví dụ 2

Giả sử rằng bạn đã quên đưa một dữ liệu về lương vào tập dữ liệu trong Ví dụ 1. Mức lương mà bạn đã quên là 95.000 USD. Tìm trung vị (Q2), tứ phân vị dưới (Q1) và tứ phân vị trên (Q3) cho mức lương khởi điểm của tập dữ liệu đã được cập nhật.

Lời giải

Đầu tiên chúng ta sẽ sắp xếp dữ liệu theo thứ tự tăng dần.

$45.000, $45.000, $48.000, $50.000, $52.000, $54.000, $55.000, $58.000, $60.000, $65.000, $66.000, $71.000, $72.000, $74.000, $75.000, $95, 000

Sau đó, chúng ta sẽ tìm vị trí của các tứ phân vị.

$$\text{Phân vị thứ hai }(Q2) = \left(\frac{N+1}{2}\right)^{\text{th}}\text{ phần tử} = \left(\frac{16+1}{2}\right)^{\text{th}}\text{ phần tử} = 8,5^{\text{th}}\text{ phần tử}$$

$$\text{Phân vị thứ hai }(Q2) = \frac{\text{Phần tử thứ }8 + \text{Phần tử thứ }9}{2} = \frac{58.000 + 60.000}{2} = 59.000$$

Bây giờ, chia tập dữ liệu thành hai nhóm ở vị trí trung vị. Tìm trung vị của các giá trị dữ liệu bên dưới Q2 để tìm Q1.

45.000 USD, 45.000 USD, 48.000 USD, 50.000 USD, 52.000 USD, 54.000 USD, 55.000 USD, 58.000 USD

Tứ phân vị thứ nhất (Q1)=($50.000 + $52.000)/2 = $51.000

Tiếp theo, tìm giá trị trung vị của các giá trị dữ liệu phía trên Q2 để tìm Q3.

60.000 USD, 65.000 USD, 66.000 USD, 71.000 USD, 72.000 USD, 74.000 USD, 75.000 USD, 95.000 USD

Tứ phân vị thứ ba (Q3) = ($71.000 + $72.000)/2 = $71.500

Phạm vi liên tứ phân vị

Mức chênh lệch giữa tứ phân vị trên (Q3) và tứ phân vị dưới (Q1) được gọi là phạm vi liên tứ phân vị.

  • Phạm vi liên tứ phân vị (IQR) = Tứ phân vị trên - Tứ phân vị dưới
  • Phạm vi liên tứ phân vị (IQR) = Tứ phân vị thứ ba - Tứ phân vị thứ nhất
  • Phạm vi tứ phân vị (IQR) = Q3- Q1

Phạm vi liên tứ phân vị loại bỏ 25% các phần tử thấp nhất và 25% các phần tử cao nhất của tập dữ liệu. Nói cách khác, phạm vi liên tứ phân vị tập trung vào mức độ trải rộng của 50% phần giữa của tập dữ liệu. Vì phạm vi liên tứ phân vị loại bỏ các phần tử bên dưới tứ phân vị dưới và các phần tử phía trên tứ phân vị trên, nên phạm vi liên tứ phân vị không có các giá trị cực trị hay còn gọi các giá trị quá lớn hoặc quá nhỏ (outlier) của tập dữ liệu. Điều này giúp loại bỏ nhược điểm chính của việc tính toán phạm vi.

Ví dụ 3

Tìm phạm vi liên tứ phân vị cho Ví dụ 1.

Lời giải

Chúng tôi đã tìm thấy các phần tư cho phạm vi dữ liệu:

  • Tứ phân vị thứ nhất (Q1) = 50.000 USD
  • Tứ phân vị thứ hai (Q2) = $58.000
  • Tứ phân vị thứ ba (Q3) = $71.000

Hãy áp dụng dữ liệu trên vào công thức liên tứ phân vị.

Phạm vi liên tứ phân vị (IQR) = Tứ phân vị thứ ba (Q3)- Tứ phân vị thứ nhất (Q1) = 71.000 USD - 50.000 USD = 21.000 USD

Ví dụ 4

Tìm phạm vi liên tứ phân vị cho Ví dụ 2.

Lời giải

Chúng ta đã tìm thấy các tứ phân vị cho việc tính toán phạm vi dữ liệu:

  • Tứ phân vị thứ nhất (Q1) = $51.000
  • Tứ phân vị thứ hai (Q2) = $59.000
  • Tứ phân vị thứ ba (Q3) = $71.500

Hãy áp dụng dữ liệu trên vào công thức phạm vi liên tứ phân vị.

Phạm vi liên tứ phân vị (IQR) = Tứ phân vị thứ ba (Q3) - Tứ phân vị thứ nhất (Q1) = $71.500 - $51.000 = $20.500

Giá trị lớn nhất và nhỏ nhất

Giá trị nhỏ nhất của tập dữ liệu có nghĩa là giá trị thấp nhất của tập dữ liệu. Khi bạn sắp xếp tập dữ liệu theo thứ tự tăng dần thì đó là giá trị đầu tiên của tập dữ liệu.

Giá trị lớn nhất của tập dữ liệu có nghĩa là giá trị cao nhất của tập dữ liệu. Khi bạn sắp xếp tập dữ liệu theo thứ tự tăng dần thì đó là giá trị cuối cùng của tập dữ liệu.

Giá trị lớn nhất và nhỏ nhất giúp chúng ta biết được tổng quan mức độ phân tán của tập dữ liệu. Phạm vi là thước đo cơ bản về độ phân tán dựa trên giá trị lớn nhất và nhỏ nhất của tập dữ liệu.

Ví dụ 5

Tìm giá trị nhỏ nhất và lớn nhất của tập dữ liệu về mức lương khởi điểm của các kế toán viên mới ra trường của Ví dụ 1.

Lời giải

Chúng ta đã sắp xếp tập dữ liệu theo thứ tự tăng dần như dưới đây.

$45.000, $45.000, $48.000, $50.000, $52.000, $54.000, $55.000, $58.000, $60.000, $65.000, $66.000, $71.000, $72.000, $74.000, $75.000

Mức lương nhỏ nhất là dữ liệu đầu tiên trong tập dữ liệu trên. Vì thế,

Mức lương khởi điểm nhỏ nhất của kế toán viên mới tốt nghiệp = 45.000 USD

Mức lương lớn nhất là dữ liệu lương cuối cùng trong tập dữ liệu đã được sắp xếp trên. Vì thế,

Mức lương khởi điểm lớn nhất của kế toán viên mới ra trường = 75.000 USD

Ví dụ 6

Tìm giá trị nhỏ nhất và lớn nhất của tập dữ liệu về mức lương khởi điểm của các kế toán viên mới ra trường của Ví dụ 2.

Lời giải

Chúng ta đã sắp xếp tập dữ liệu theo thứ tự tăng dần như dưới đây.

$45.000, $45.000, $48.000, $50.000, $52.000, $54.000, $55.000, $58.000, $60.000, $65.000, $66.000, $71.000, $72.000, $74.000, $75.000, $95. 000

Mức lương nhỏ nhất là dữ liệu lương đầu tiên trong tập dữ liệu trên. Vì thế,

Mức lương khởi điểm nhỏ nhất của kế toán viên mới tốt nghiệp = 45.000 USD

Mức lương lớn nhất là dữ liệu lương cuối cùng trong tập dữ liệu trên. Vì thế,

Mức lương khởi điểm lớn nhất của kế toán viên mới ra trường = 95.000 USD

Phạm vi của một tập dữ liệu

Phạm vi trong thống kê là thước đo cơ bản nhất về độ phân tán của một tập dữ liệu. Phạm vị được tính bằng mức chênh lệch giữa giá trị lớn nhất (tối đa) và giá trị nhỏ nhất (tối thiểu) của tập dữ liệu.

Phạm vi của tập dữ liệu = Giá trị tối đa - Giá trị tối thiểu

Phạm vi của tập dữ liệu = Giá trị lớn nhất - Giá trị nhỏ nhất

Phạm vi là tổng khoảng cách hoặc tổng mức chênh lệch giữa các giá trị cực trị của tập dữ liệu. Đó là một thước đo tổng quát về độ phân tán.

Phạm vi chỉ phụ thuộc vào hai mục cực trị của tập dữ liệu. Nếu các giá trị cực trị chứa bất kỳ giá trị outlier nào (quá lớn hoặc quá nhỏ so với phần còn lại) thì phạm vi đó dễ bị biến dạng và sai lệch.

Vì phạm vi không dựa trên tất cả dữ liệu của tập dữ liệu nên phạm vi không được coi là một thước đo tốt về độ phân tán.

Ví dụ 7

Tìm phạm vi trong tập dữ liệu về mức lương khởi điểm của các kế toán viên mới ra trường của Ví dụ 1.

Lời giải

Như ở trên, chúng ta đã tìm thấy giá trị lớn nhất và giá trị nhỏ nhất của tập dữ liệu.

Mức lương khởi điểm nhỏ nhất của kế toán viên mới tốt nghiệp = 45.000 USD

Mức lương khởi điểm lớn nhất của kế toán viên mới tốt nghiệp = 75.000 USD

Bây giờ chúng ta sẽ áp dụng các giá trị trên vào công thức phạm vi.

Phạm vi của tập dữ liệu = Giá trị lớn nhất - Giá trị nhỏ nhất = 75.000 USD - 45.000 USD = 30.000 USD

Ví dụ 8

Tìm phạm vi của tập dữ liệu về mức lương khởi điểm của các kế toán viên mới ra trường của Ví dụ 2.

Giải pháp

Như ở trên, chúng ta đã tìm được giá trị lớn nhất và giá trị nhỏ nhất của tập dữ liệu.

Mức lương khởi điểm nhỏ nhất của kế toán viên mới tốt nghiệp = 45.000 USD

Mức lương khởi điểm lớn nhất của kế toán viên mới tốt nghiệp = 95.000 USD

Bây giờ chúng ta sẽ áp dụng các giá trị trên vào công thức phạm vi.

Phạm vi của tập dữ liệu = Giá trị lớn nhất - Giá trị nhỏ nhất = 95.000 USD - 45.000 USD = 50.000 USD

Ứng dụng tính toán tứ phân vị trong thực tế

Việc tính toán tứ phân vị rất hữu ích khi chúng ta muốn loại bỏ các giá trị cực trị của tập dữ liệu và kiểm tra sự phân bố của nó. Danh sách bên dưới cho thấy một số lĩnh vực sử dụng tứ phân vị để đưa ra quyết định.

Nhân sự - Các tứ phân vị về tiền lương được xác định trước khi xây dựng khung lương của nhân viên trong công ty. Nó giúp loại bỏ các mức lương quá thấp, chẳng hạn như lương thực tập sinh, và mức lương quá cao do kinh nghiệm và tài năng xuất sắc của nhân viên.

Tài chính - Khi lập kế hoạch chi tiêu hàng tháng, các tứ phân vị được tính toán để biết được chi phí đã được phân bổ như thế nào trong quá khứ. Nó giúp tránh việc bị dư thừa và thiếu ngân sách.

Điều này giúp đưa ra dữ liệu về phạm vi khả năng sản xuất không bị ảnh hưởng do mất điện, đình công, và những ngày hết nguyên liệu, v.v.

Tiếp thị - Khi các nhà tiếp thị phân tích phạm vi giá của đối thủ cạnh tranh, họ sẽ xác định các tứ phân vị cho các mức giá của các đối thủ cạnh tranh. Sau đó, họ có thể bỏ qua việc định giá các sản phẩm chất lượng thấp và có thương hiệu cao trong quá trình phân tích.