Máy Tính Thống Kê
Công cụ máy tính phương sai


Công cụ máy tính phương sai

Với một tập dữ liệu rời rạc cho trước, máy tính sẽ tính toán giá trị trung bình, phương sai và độ lệch chuẩn của một mẫu hoặc một tổng thể và hiển thị tất cả các bước thực hiện của phép tính.

Mẫu Dân số
Phương sai σ2 = 28.5 s2 = 24.9375
Độ lệch chuẩn σ = 5.3385 s = 4.9937
Số lượng n = 8 n = 8
Trung bình μ = 18.25 x̄ = 18.25
Tổng Bình Phương SS = 199.5 SS = 199.5

Có lỗi với phép tính của bạn.

Mục lục

  1. Phương sai là một đại lượng đo lường độ biến thiên
  2. Các quy tắc khi sử dụng máy tính này
  3. Công thức tính phương sai: phương sai tổng thể và phương sai mẫu
    1. Phương sai tổng thể
    2. Phương sai mẫu
  4. Các bước tính phương sai
  5. Ví dụ về tính toán phương sai cho một mẫu
  6. Ý nghĩa của phương sai

Công cụ máy tính phương sai

Phương sai là một đại lượng đo lường độ biến thiên

Một trong những khía cạnh cơ bản trong phân tích thống kê của một tập dữ liệu cụ thể là đo lường một đại lượng mô tả sự biến thiên của dữ liệu so với giá trị trung bình của chúng. Các đại lượng đo lường độ biến thiên phổ biến nhất là:

  • Phương sai là trung bình của các bình phương độ lệch so với giá trị trung bình.
  • Độ lệch chuẩn - là căn bậc hai của phương sai. Độ lệch chuẩn là một đại lượng thường được sử dụng để đo lường độ phân tán/biến thiên.
  • Một hệ số biến thiên khác, còn được biết đến là độ lệch chuẩn tương đối. Hệ số biến thiên này được tính là tỉ lệ giữa độ lệch chuẩn σ và giá trị trung bình μ hoặc \$(C_v=\frac{σ}{μ})\$.

Công cụ máy tính này giúp tìm phương sai của một tập dữ liệu nhất định, đồng thời hiển thị các bước liên quan đến phép tính.

Các quy tắc khi sử dụng máy tính này

Máy tính phương sai chấp nhận đầu vào dưới dạng danh sách các số được phân tách bằng dấu phân cách. Một vài ví dụ về đầu vào có thể được hiển thị trong bảng dưới đây.

đầu vào hàng đầu vào cột đầu vào cột đầu vào cột
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Các số có thể được phân tách bằng dấu phẩy, khoảng trắng, xuống dòng hoặc sự kết hợp của nhiều loại dấu phân tách. Bạn có thể sử dụng cả định dạng hàng hoặc cột. Đối với tất cả các định dạng được hiển thị trong bảng trên, máy tính sẽ xử lý đầu vào là 44, 63, 72, 75, 80, 86, 87 và 89.

Sau khi nhập dữ liệu, bạn có thể chọn liệu đó là dữ liệu mẫu hay tổng thể. Khi nhấn nút tính toán, máy tính sẽ hiển thị năm tham số thống kê của tập dữ liệu: số lượng quan sát (số lượng phần tử), giá trị trung bình, tổng bình phương các mức chênh lệch, phương sai và độ lệch chuẩn.

Máy tính này được thiết kế để tính phương sai của một tập dữ liệu. Nó cũng cung cấp cung cấp lời giải chi tiết để bạn có thể tham khảo.

Khi thực hiện phân tích, chúng ta nên ưu tiên sử dụng một tập dữ liệu lớn để thu được kết quả thống kê tốt. Nhưng thường khó khăn để có được dữ liệu tổng thể tổng quát cho tất cả các quan sát (phần tử) có thể có. Do đó, theo quy tắc, một "mẫu" được lấy từ một tổng thể. Và những kết luận về tổng thể thường được rút ra từ dữ liệu mẫu.

Phương sai đo lường sự phân tán trung bình của một tập dữ liệu so với giá trị trung bình. Thường được ký hiệu bằng σ² cho tổng thể và s² cho mẫu. Một giá trị lớn của σ² hoặc s² ngụ ý một sự phân tán lớn hơn của các điểm dữ liệu so với trung bình mẫu và ngược lại.

Xem xét các tập dữ liệu ví dụ sau.

(Tập dữ liệu I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(Tâp dữ liệu II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Đưa Tập dữ liệu I vào máy tính tính phương sai, chúng ta sẽ thu được:

n=11

x̄=16

SS=704

s²=70,4

s=8,39

cho một mẫu, và

n=11

μ=16

SS=704

σ²=64

σ=8

cho tổng thể của mẫu đó.

Tương tự, đưa Tập dữ liệu II vào máy tính tính phương sai, chúng ta sẽ thu được:

n=11

x̄=16

SS=56

s²=5,6

s=2,36

cho một mẫu, và

n=11

μ=16

SS=56

σ²=5,09

σ=2,25

cho tổng thể của mẫu đó.

  • Ở Tập dữ liệu I, các số có sai lệch đáng kể so với giá trị trung bình của mẫu

s²=70,4

σ²=64

  • Ở Tập dữ liệu II thì độ biến thiên nhỏ

s²=5,6

σ²=5,09

Công thức tính phương sai: phương sai tổng thể và phương sai mẫu

Phương sai tổng thể

Tổng thể trong thống kê đề cập đến tất cả các quan sát có thể có trong một thí nghiệm. Đối với N quan sát, phương sai tổng thể là:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

trong đó

  • σ² là phương sai tổng thể,
  • Σ là tổng,
  • xᵢ là mỗi quan sát,
  • μ là giá trị trung bình của tổng thể,
  • n là số lượng quan sát trong tổng thể.

Phương sai mẫu

Phương sai mẫu được định nghĩa là

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

trong đó

  • là phương sai mẫu,
  • Σ là tổng,
  • xᵢ là mỗi quan sát,
  • là giá trị trung bình mẫu,
  • n là số lượng quan sát trong mẫu.

Các bước tính phương sai

Phương sai được tính theo các bước sau đây.

Bước 1: Tính giá trị trung bình cộng của mẫu/tổng thể. Đây là tổng của tất cả các điểm dữ liệu chia cho số điểm dữ liệu (n cho một mẫu và N cho tổng thể), tức là

Trung bình cộng của mẫu:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

Trung bình cộng của tổng thể:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

Bước 2: Tính độ chênh lệch bằng cách trừ giá trị của mỗi điểm dữ liệu cho giá trị trung bình của mẫu/tổng thể , tức là

Độ chênh lệch mẫu:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

Độ chênh lệch tổng thể:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

Bước 3: Tính bình phương độ chênh lệch cho từng điểm dữ liệu.

Bình phương các mức chênh lệch ở mẫu:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

Bình phương các mức chênh lệch ở tổng thể:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

Step 4: Tính tổng các bình phương mức chênh lệch.

Tổng các bình phương mức chênh lệch của mẫu:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

Tổng các bình phương mức chênh lệch của tổng thể:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

Bước 5: Chia tổng bình phương các mức chênh lệch cho n-1 đối với mẫu và N đối với tổng thể để thu được phương sai.

Phương sai mẫu:

$$s^2=\frac{SS}{n-1}$$

Phương sai tổng thể:

$$\sigma^2=\frac{SS}{N}$$

Ví dụ về tính toán phương sai cho một mẫu

Chúng ta hãy xem xét tập dữ liệu sau: 1, 2, 4, 5, 6 và 12. Để tính phương sai mẫu, chúng ta thực hiện theo các bước sau:

Bước 1: Tính giá trị trung bình của mẫu (trung bình cộng).

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

Bước 2: Tính toán mức chênh lệch so với giá trị trung bình của từng điểm dữ liệu.

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

Bước 3: Tính bình phương các mức chênh lệch.

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

Bước 4: Tính tổng các bình phương mức chênh lệch.

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

Bước 5: Tính phương sai mẫu bằng cách chia tổng bình phương mức chênh lệch thu được cho bậc tự do (n-1).

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15,2$$

Đối với một tổng thể, chúng ta sẽ chia cho n (tổng số điểm dữ liệu), thay vì n-1, để tính phương sai của tổng thể.

Ý nghĩa của phương sai

Sự phân tán được sử dụng trong đầu tư. Nó giúp các nhà quản lý tài sản cải thiện hiệu suất đầu tư của họ. Các nhà phân tích tài chính có thể sử dụng phương sai để đánh giá hiệu suất riêng lẻ của các thành phần trong danh mục đầu tư.

Các nhà đầu tư tính toán phương sai khi xem xét một giao dịch mua mới để quyết định xem khoản đầu tư đó có xứng đáng với rủi ro hay không. Độ phân tán giúp các nhà phân tích xác định thước đo độ không chắc chắn, khó định lượng nếu không có phương sai và độ lệch chuẩn.

Sự không chắc chắn không thể đo lường trực tiếp được. Nhưng phương sai và độ lệch chuẩn (căn bậc hai của phương sai) giúp xác định tác động nhận thức của một cổ phiếu cụ thể đối với danh mục đầu tư.

Các nhà khoa học, nhà thống kê, nhà toán học và nhà phân tích dữ liệu cũng có thể sử dụng phương sai. Nó giúp cung cấp thông tin hữu ích về một thí nghiệm hoặc một mẫu trong tổng thể.

Các nhà khoa học có thể tìm kiếm sự khác biệt giữa các nhóm thử nghiệm để xác định xem chúng có đủ giống nhau để kiểm tra giả thuyết thành công hay không. Phương sai của tập dữ liệu càng cao, các giá trị trong tập dữ liệu càng bị phân tán. Các nhà nghiên cứu dữ liệu có thể sử dụng thông tin này để xem giá trị trung bình thể hiện tập dữ liệu tốt đến mức nào.

Nhược điểm của việc sử dụng phương sai là các giá trị ngoại lệ cực lớn trong một tập hợp có thể dẫn đến một số sai lệch của dữ liệu. Điều này là do các giá trị cực nhỏ hoặc cực lớn (outlier) có thể tăng trọng số của chúng hơn nữa sau khi bình phương.

Nhiều nhà nghiên cứu thích làm việc với độ lệch chuẩn được tính bằng căn bậc hai của phương sai. Độ lệch chuẩn ít bị ảnh hưởng bởi các giá trị outlier hơn, đó là một con số nhỏ hơn và dễ diễn giải hơn.