انحراف معیار

با توجه به یک داده‌سری گسسته، این ماشین حساب میانگین، واریانس و انحراف معیار یک نمونه یا جامعه آماری را محاسبه کرده و تمامی مراحل میانی محاسبات را نمایش می‌دهد.

نتیجه
انحراف معیار s = 4.5
واریانس s2 = 20.24
تعداد n = 7
میانگین x̄ = 14.29
مجموع مربع ها SS = 100

در محاسبه شما خطایی رخ داد.

فهرست مطالب

  1. انحراف معیار به عنوان یک معیار آماری
  2. قوانین استفاده از این ماشین حساب
  3. مشکلاتی که این ماشین حساب برای حل آن طراحی شده است
  4. فرمول‌ها برای محاسبه انحراف معیار
  5. محاسبه انحراف معیار
  6. مثالی از محاسبه انحراف معیار یک نمونه
  7. کاربردهای انحراف معیار

انحراف معیار

انحراف معیار به عنوان یک معیار آماری

انحراف معیار یکی از پرکاربردترین معیارها برای توصیف آمار داده‌های یک مجموعه داده می‌باشد. انحراف معیار، به زبان ساده، معیاری برای اندازه‌گیری پراکندگی داده‌ها است. با محاسبه انحراف معیار، می‌توان دریافت که آیا اعداد به میانگین نزدیک هستند یا از آن دور. اگر نقاط داده از میانگین دور باشند، آنگاه انحراف زیادی در مجموعه داده وجود دارد. بنابراین، هرچه پراکندگی داده‌ها بیشتر باشد، انحراف معیار بالاتر است.

این ماشین حساب انحراف معیار یک مجموعه داده مشخص را تعریف کرده و مراحل ریاضی درگیر در محاسبه را نمایش می‌دهد.

قوانین استفاده از این ماشین حساب

ماشین حساب ورودی را به صورت فهرستی از اعداد جدا شده توسط یک جداکننده قبول می‌کند. چند نمونه از ورودی‌های ممکن در جدول زیر نشان داده شده است.

ورودی سطری ورودی ستونی ورودی ستونی ورودی ستونی
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

اعداد می‌توانند توسط کاما/فاصله/شکست خط یا ترکیبی از آنها جدا شده و می‌توانند به صورت فرمت سطری یا ستونی وارد شوند. برای تمام فرمت‌های نشان داده شده در جدول بالا، ماشین حساب ورودی را به صورت 44, 63, 72, 75, 80, 86, 87 و 89 پردازش می‌کند.

پس از وارد کردن داده‌ها، انتخاب کنید که آیا داده‌ها مربوط به یک نمونه یا جامعه آماری است و سپس اینتر را فشار دهید. ماشین حساب پنج پارامتر آماری مجموعه داده را نمایش می‌دهد: تعداد (تعداد مشاهدات)، میانگین، جمع مربعات انحرافات، واریانس، و انحراف معیار.

مشکلاتی که این ماشین حساب برای حل آن طراحی شده است

این ماشین حساب برای محاسبه انحراف معیار یک مجموعه داده گسسته طراحی شده است و بینشی به نظریه پشت محاسبه ارائه می‌دهد.

داده‌ها می‌توانند شامل یک جامعه آماری باشند که تمام مشاهدات ممکن در یک آزمایش (از هر نوع) تحت شرایط مشخص را شامل می‌شود. در بسیاری از موارد، نمونه‌برداری از هر عضو جامعه غیرممکن است.

در عمل آماری، کار با یک زیرمجموعه از جامعه‌ای بزرگتر که به آن 'نمونه' اشاره می‌کنیم، معمول است. این به دلیل این است که اغلب غیرعملی یا غیرممکن است داده‌ها را از هر فرد در جامعه جمع‌آوری کنیم. ما بر اساس اطلاعات جمع‌آوری شده از نمونه، تخمین‌ها یا نتیجه‌گیری‌هایی در مورد جامعه انجام می‌دهیم.

هنگام محاسبه انحراف معیار، فرمولی که استفاده می‌کنیم با توجه به اینکه آیا با یک نمونه یا کل جامعه سر و کار داریم، تنظیم می‌شود. این تنظیم از طریق عاملی به نام 'درجات آزادی' انجام می‌شود. برای یک نمونه، ما برای محاسبه واریانس به جای n توسط n - 1 (که n اندازه نمونه است) تقسیم می‌کنیم که سپس مربع آن گرفته می‌شود تا انحراف معیار پیدا شود. این تصحیح برای جبران این واقعیت که ما از داده‌های نمونه برای تخمین انحراف معیار جامعه استفاده می‌کنیم انجام شده و اطمینان می‌دهد که تخمین ما بدون سوگیری است.

انحراف معیار میزان پراکندگی/انحراف/تغییرپذیری متوسط یک مجموعه داده نسبت به میانگین را اندازه‌گیری می‌کند. اغلب با حرف یونانی σ برای جامعه یا s برای نمونه نشان داده می‌شود. مقدار بزرگتر σ یا s نشان‌دهنده پراکندگی بیشتر نقاط داده از میانگین نمونه است و بالعکس.

در نظر بگیرید نمونه‌های زیر از مجموعه داده‌ها.

(مجموعه I)

11، 3، 5، 21، 10، 15، 20، 25، 13، 26، 27

(مجموعه II)

12، 14، 14، 15، 15، 16، 16، 17، 18، 19، 20 با جایگزین کردن این مجموعه‌های داده در ماشین حساب، برای مجموعه I به دست می‌آوریم

  • x̄=16 - مقدار میانگین
  • s=8.3904708 - انحراف معیار

برای مجموعه II

  • x̄=16 - مقدار میانگین
  • s=2.3664319 - انحراف معیار

در مجموعه I، اعداد به طور قابل توجهی از میانگین نمونه (s=8.39) منحرف شده‌اند در حالی که در مجموعه II تغییرپذیری کم است (s=2.36) در مقایسه با مجموعه I.

فرمول‌ها برای محاسبه انحراف معیار

این فرمول زمانی اعمال می‌شود که تمام ارزش‌های جامعه آنالیز می‌شوند.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ انحراف معیار جامعه است،
  • xᵢ ارزش فردی هر یک از ارزش‌های جامعه است،
  • μ میانگین حسابی جامعه است،
  • n اندازه جامعه است.

فرمول زیر زمانی استفاده می‌شود که اندازه جامعه بسیار بزرگ است و فقط نمونه‌ای از آن برای تجزیه و تحلیل گرفته شده است.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s انحراف معیار نمونه است،
  • xᵢ ارزش یک مقدار نمونه فردی است،
  • میانگین نمونه است،
  • n اندازه نمونه است.

محاسبه انحراف معیار

مراحل زیر در محاسبه انحراف معیار دخیل هستند.

مرحله 1: محاسبه میانگین نمونه/جامعه. این مجموع تمام نقاط داده تقسیم بر تعداد شمارش‌های N یا n است یعنی.

میانگین نمونه:

$$\bar{x}=\frac{x₁+x₂+x₃+........+x_n}{n}$$

میانگین جامعه

$$\mu=\frac{x₁+x₂+x₃+........+x_N}{N}$$

مرحله 2: محاسبه انحرافات با کسر میانگین نمونه/جامعه از هر نقطه داده، یعنی.

انحرافات نمونه:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x₃-\bar{x}) …………………… (x_n-\bar{x})$$

انحرافات جامعه:

$$(x₁-\ \mu), (x₂-\ \mu), (x₃-\ \mu) ………………….. (x_N-\ \mu)$$

مرحله 3: محاسبه انحرافات مربعی برای هر نقطه داده.

انحرافات مربعی نمونه:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x₃-\bar{x})^2 …………………… (x_n-\bar{x})^2$$

انحرافات مربعی جامعه:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x₃-\ \mu)^2 ………………….. (x_N-\ \mu)^2$$

مرحله 4: محاسبه مجموع انحرافات مربعی با اضافه کردن تمام انحرافات مربعی فردی

مجموع انحرافات مربعی نمونه:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x₃-\bar{x})^2……………………+(x_n-\bar{x})^2$$

مجموع انحرافات مربعی جامعه:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x₃-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

مرحله 5: تقسیم مجموع انحرافات مربعی بر تعداد درجات آزادی برای به دست آوردن واریانس. برای یک جامعه، تقسیم بر N، و برای یک نمونه، تقسیم بر n-1.

واریانس نمونه

$$s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1}$$

واریانس جامعه

$$\sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N}$$

هنگام محاسبه واریانس برای یک نمونه، ممکن است فرض کنیم که از این عبارت برای محاسبات استفاده می‌کنیم:

$$\frac{(x-\bar{x})^2}{n}$$

که در آن

x̄ میانگین نمونه و n اندازه نمونه است. اما چنین فرمولی استفاده نمی‌شود.

چنین بیانی تخمین خوبی از واریانس جامعه ارائه نمی‌دهد. زمانی که جامعه کلی بسیار بزرگ و نمونه بسیار کوچک است، واریانس محاسبه شده توسط این فرمول واریانس جامعه را دست‌کم می‌گیرد. این امر به دلیل کمبود داده، واریانس بسیار کوچکی را نشان می‌دهد. پس با استفاده از عبارت n-1 ما مقدار واریانس بالقوه را افزایش می‌دهیم.

به جای تقسیم بر n، ما واریانس نمونه را با تقسیم بر n-1 پیدا می‌کنیم. این عملیات مقداری کمی بزرگ‌تر از واریانس را می‌دهد، که به مقدار واقعی نزدیک‌تر است.

مرحله 6: ریشه دوم عدد حاصل را بیرون بکشید. انحراف معیار ریشه دوم واریانس است.

انحراف معیار نمونه

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

انحراف معیار جامعه

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

مثالی از محاسبه انحراف معیار یک نمونه

بیایید نمرات زیر از n=8 دانش‌آموز در امتحان نهایی فیزیک را در نظر بگیریم:

45، 67، 70، 75، 80، 81، 82، و 84

ماشین حساب انحراف معیار نمونه را با استفاده از مراحل زیر محاسبه می‌کند:

مرحله 1: میانگین را محاسبه کنید.

$$\bar{x} = \frac{\sum_{i} x_i}{n} = \frac{45+ 67+ 70+ 75+ 80+ 81+ 82+ 84}{8} = 73$$

مرحله 2: انحرافات را محاسبه کنید

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
28- 6- 3- 2 7 8 9 11

مرحله 3: مربع انحرافات را محاسبه کنید

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

مرحله 4: جمع مربع انحرافات را حساب کنید.

$$SS = \sum_{i}^{n}{{(x_i-\ \bar{x})}^2 = 784+36+9+4+49+64+81+121} = 1148$$

مرحله 5: واریانس را با تقسیم جمع مربع انحرافات بر تعداد درجات آزادی (n-1) محاسبه کنید. برای یک جامعه، واریانس در این مرحله باید بر N تقسیم شود نه N-1. در این مورد، ما یک نمونه داریم، یعنی اطلاعاتی در مورد بخشی از جمعیت دانش‌آموزی، نه کل جمعیت.

$$s^2= \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

مرحله 6: برای به دست آوردن انحراف معیار، ریشه دوم واریانس را بگیرید.

$$s = \sqrt{s^2} = \sqrt{164} = 12.80$$

کاربردهای انحراف معیار

پراکندگی و انحراف معیار می‌تواند برای تعیین پراکندگی داده‌ها استفاده شود. اگر واریانس یا انحراف معیار بزرگ باشد، داده‌ها پراکنده‌تر هستند. این اطلاعات هنگام مقایسه دو (یا بیشتر) مجموعه داده برای تعیین اینکه کدام یک بیشتر (بیشترین) تغییرپذیری دارد، مفید است.

در صنعت، انحراف معیار به طور گسترده‌ای برای کنترل کیفیت استفاده می‌شود. در تولید مقیاس بزرگ، برخی از ویژگی‌های محصول باید در داخل یک محدوده تعریف شده قرار گیرند که با محاسبه انحراف معیار قابل دسترسی است. به عنوان مثال، در تولید مهره و پیچ، تغییر در قطر آنها باید کم باشد، در غیر این صورت، قطعات با هم جور نخواهند شد.

انحراف معیار در مالی و بسیاری از زمینه‌های دیگر برای ارزیابی خطر استفاده می‌شود. در تحلیل فنی، انحراف معیار برای ساخت خطوط بولینگر و محاسبه نوسان استفاده می‌شود.

همچنین، انحراف معیار در مالی به عنوان معیاری از نوسان، و در جامعه‌شناسی، در نظرسنجی‌های افکار عمومی برای کمک به محاسبه عدم قطعیت استفاده می‌شود.

واریانس و انحراف معیار برای تعیین تعداد مقادیر داده‌هایی که در یک فاصله توزیع داده شده قرار می‌گیرند، استفاده می‌شوند. به عنوان مثال، قضیه چبیشف نشان می‌دهد که برای هر توزیعی، حداقل 75% از مقادیر داده‌ها در دو انحراف معیار از میانگین قرار خواهند گرفت.

بیایید با یک مثال ساده با آب و هوا شروع کنیم. فرض کنید ما دمای روزانه دو شهر در یک منطقه مشابه را مطالعه می‌کنیم. یک شهر در کنار ساحل و دیگری در داخل خشکی قرار دارد. متوسط حداکثر دمای روزانه در این دو شهر ممکن است یکسان باشد. اما انحراف معیار، یعنی پراکندگی حداکثر دماهای روزانه برای شهر واقع در قاره بیشتر خواهد بود و شهر ساحلی انحراف معیار کمتری از حداکثر دماهای روزانه خواهد داشت.

این بدان معناست که یک شهر قاره‌ای تغییرات بیشتری در حداکثر دمای هوا در هر روز داده شده از سال نسبت به یک شهر ساحلی خواهد داشت. یعنی، شهر ساحلی آب و هوایی ملایم‌تر خواهد داشت.