ماشین حساب‌های آماری
ماشین حساب میانگین، میانه، مد


ماشین حساب میانگین، میانه، مد

ماشین حساب برای میانگین، میانه و مد در آمار. از این ماشین حساب برای به دست آوردن میانگین، میانه، مد، دامنه و میانگین برای هر مجموعه داده استفاده کنید

نتیجه
میانگین x̄ 16.75 نقاط پرت 6, 33, 35
میانه x̃ 15 کوارتیل Q1 12.5
مُد 15، 3 بار ظاهر شد کوارتیل Q2 15
دامنه 29 کوارتیل Q3 16
حداقل 6 دامنه بین چارکی IQR 3.5
حداکثر 35
جمع 201
تعداد n 12

در محاسبه شما خطایی رخ داد.

فهرست مطالب

  1. معیارهای گرایش مرکزی
  2. ماشین حساب میانگین
  3. میانگین برای نمونه و جامعه
  4. مثالی از محاسبه میانگین
  5. ماشین حساب میانه
  6. مثالی از محاسبه میانه
  7. تفاوت بین میانگین و میانه
  8. ماشین حساب مد
  9. نمونه محاسبه مُد
  10. معیارهای پراکندگی
  11. ماشین حساب دامنه
  12. نمونه محاسبه دامنه
  13. ماشین حساب کوارتیل
    1. محاسبه کوارتیل‌ها
  14. مثالی از محاسبه کوارتیل
  15. ماشین حساب دامنه بین کوارتیلی
  16. مثال محاسبه IQR
  17. نتایج

ماشین حساب میانگین، میانه، مد

معیارهای گرایش مرکزی

نگاه کردن به جداول و نمودارهای داده‌های آماری می‌تواند برای ما برای تفسیر دشوار باشد. ما اغلب نیاز داریم تا مجموعه داده‌ها را خلاصه کرده و ویژگی‌های مهم را برای به دست آوردن اطلاعات مفیدتر از آمار شناسایی کنیم.

در آمار، از معیارهای مختلفی برای خلاصه کردن داده‌ها استفاده می‌شود. برخی توصیف کننده مرکز داده‌ها هستند؛ آنها به عنوان معیارهای گرایش مرکزی نامیده می‌شوند. دیگران نشان می‌دهند که مقادیر داده‌ها چقدر پراکنده هستند؛ آنها به عنوان معیارهای پراکندگی شناخته می‌شوند. دیگران، که به عنوان معیارهای موقعیت شناخته می‌شوند، نسبت داده‌هایی که کمتر از یک مقدار داده شده است را آشکار می‌کنند.

هدف اصلی این ماشین حساب محاسبه معیارهای گرایش مرکزی—میانگین و میانه—است که می‌توانند نماینده مقدار معمولی یا مرکزی در یک مجموعه داده باشند. هدف ثانویه این ماشین حساب تعیین میزان تغییرپذیری در یک مجموعه داده با محاسبه دامنه، کوارتیل‌ها و فاصله بین کوارتیلی است.

ماشین حساب میانگین

میانگین مجموع مقادیر تقسیم بر تعداد کل مقادیر است. آسان‌ترین راه برای فهمیدن و محاسبه آن، استفاده از فرمول زیر برای محاسبه میانگین برای یک نمونه است:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

فرمول برای میانگین جامعه عبارت است از:

$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$

در اینجا، صورت کسر نشان‌دهنده مجموع مقادیر در مجموعه داده است. و مخرج نشان‌دهنده تعداد مقادیر در مجموعه داده است.

ویژگی اصلی استفاده از میانگین حسابی این است که تمام نقاط داده موجود در مجموعه داده را در بر می‌گیرد.

محدودیت اصلی میانگین این است که به مقادیر بسیار بزرگ یا بسیار کوچک حساس است. چنین مقادیری به عنوان نقاط دور از مرکز شناخته می‌شوند، و آنها به طور قابل توجهی بر میانگین تأثیر می‌گذارند.

همچنین توجه داشته باشید که مقدار متوسط لزوماً مقدار نمونه‌ای برای داده‌ها نیست. مقدار میانگین ممکن است مقداری باشد که اصلاً در مجموعه داده وجود نداشته باشد.

میانگین برای نمونه و جامعه

جامعه شامل کل مجموعه مقادیری است که اطلاعات در مورد آن به دست آورده می‌شود. نمونه شامل یک گروه کوچکتری است که از جامعه گرفته شده است.

روش محاسبه مقدار میانگین برای هر دو نمونه و جامعه یکسان است. فقط نام‌گذاری‌ها متفاوت هستند.

اگر x₁, x₂,..., xₙ یک نمونه باشد، میانگین به عنوان میانگین نمونه شناخته شده و با نماد x̄ نمایش داده می‌شود. میانگین جامعه با حرف یونانی 𝜇 نمایش داده می‌شود.

در آمار، ما از حرف کوچک n برای نشان دادن اندازه نمونه و از حرف بزرگ N برای نشان دادن اندازه جامعه استفاده می‌کنیم.

مثالی از محاسبه میانگین

بیایید به مثال زیر نگاه کنیم: لوئیجی یک سرآشپز درجه یک و عاشق پیتزا است. او تصمیم گرفته است تا پیتزافروشی خود را در بالی افتتاح کند. برای یافتن یک سرمایه‌گذار، لوئیجی یک طرح تجاری می‌نویسد. او می‌خواهد هزینه متوسط پیتزا در رستوران‌های مختلف در جزیره را برای ارزیابی عملکرد مالی آینده مشخص کند.

او تحقیق کوچکی در مورد قیمت پیتزا مارگاریتا در رستوران‌های بالی انجام داد و به مجموعه‌ای از قیمت‌های پیتزا دست یافت. برای سهولت در محاسبه، بیایید سه صفر آخر را حذف کنیم و از تعداد هزارها در قیمت استفاده کنیم. یعنی، 60 در محاسبات ما به معنی 60,000 روپیه اندونزی خواهد بود.

60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70

لوئیجی تمام پیتزافروشی‌های جزیره را بازدید نکرده است. او به طور تصادفی 20 تا از آن‌ها را انتخاب کرده است. بنابراین، ما با یک نمونه سر و کار داریم.

بیایید مقدار متوسط این مجموعه داده را با استفاده از فرمول زیر محاسبه کنیم:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

ما به میانگین x̄ = 71.9 دست پیدا می‌کنیم.

تحقیقات لوئیجی نشان می‌دهد که قیمت متوسط یک پیتزا مارگاریتا در بالی 71,900 روپیه اندونزی است. او حالا می‌تواند محاسبات خود را بر اساس این قیمت انجام دهد.

ماشین حساب میانه

میانه یک معیار موقعیتی است که مقدار متوسط یک مجموعه داده مرتب شده به ترتیب صعودی یا نزولی را نشان می‌دهد.

با محاسبه میانه، ما سعی می‌کنیم یک عدد پیدا کنیم که مجموعه داده‌ها را به دو نیم تقسیم کند. نیمی از مقادیر داده کمتر از میانه و نیم دیگر بیشتر از میانه هستند. به همین دلیل است که وقتی بدون استفاده از ماشین حساب میانه، میانه را به صورت دستی تعیین می‌کنیم، نیاز داریم که مقادیر را به ترتیب صعودی یا نزولی مرتب کنیم.

محاسبه میانه بستگی به این دارد که تعداد مقادیر در مجموعه داده زوج یا فرد باشد.

اگر تعداد کل عناصر فرد باشد، یعنی n یا N فرد باشد، آنگاه فرمول زیر اعمال می‌شود:

$$میانه=(\frac{n+1}{2})-امین \ عنصر$$

اما، اگر تعداد عناصر زوج باشد، یعنی n یک عدد زوج باشد، آنگاه فرمول زیر استفاده می‌شود:

$$میانه=\frac{\left[(\frac{n}{2})-امین \ عنصر+(\frac{n}{2}+1)-امین \ عنصر\right]}{2}$$

مزیت اصلی استفاده از میانه این است که کمترین تأثیر را از مقادیر بسیار بالا یا بسیار پایین می‌پذیرد.

مثالی از محاسبه میانه

برای مجموعه‌ای داده شده از بیست مقدار،

60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70

می‌توانیم میانه را به شکل زیر محاسبه کنیم:

  1. مجموعه داده‌ها را به ترتیب صعودی یا نزولی مرتب کنید. اینجا ترتیب به شکل زیر است:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. بیایید تعداد مقادیر در مجموعه داده‌ها را مشخص کنیم. ما n = 20 داریم.

  2. اگر n فرد باشد، مقدار مرکزی داده‌ها را به عنوان میانه انتخاب می‌کنیم. اگر n زوج باشد، میانگین حسابی دو مقدار میانه را پیدا می‌کنیم. آنها را اضافه کرده و مجموع را بر 2 تقسیم می‌کنیم.

20 یک عدد زوج است.

مقادیر مرکزی در نمونه ما 69 و 70 هستند. به این شکل میانه را پیدا می‌کنیم:

$$میانه = \frac{69 + 70}{2} = 69.5$$

اگر لوئیجی مجموعه‌ای از 21 مقدار داشت، مثلاً

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70

می‌توانست مقادیر را مرتب کند:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160

و مقدار واقع در مرکز در جایگاه یازدهم، یعنی 70، را انتخاب کند.

تفاوت بین میانگین و میانه

هم میانگین و هم میانه به عنوان معیارهای گرایش مرکزی استفاده می‌شوند. اما دانستن تفاوت‌های آنها ضروری است.

یک تفاوت حیاتی بین میانگین و میانه این است که فرمول میانگین از تمام مقادیر در مجموعه داده استفاده می‌کند. در حالی که فرمول میانه فقط به عدد مرکزی یا دو عدد مرکزی بستگی دارد.

این موضوع بخصوص برای مجموعه‌های داده‌ای که یک یا چند عدد به طور غیرمعمول بزرگ یا کوچک هستند، مهم است. چنین اعدادی به عنوان نقاط دور از مرکز شناخته می‌شوند. در بیشتر موارد، این نقاط دور از مرکز به طور قابل توجهی بر میانگین تأثیر می‌گذارند، اما تأثیر کم یا بدون تأثیری بر میانه خواهند داشت.

در آمار، می‌گوییم که یک معیار مقاوم است اگر مقدار آن به شدت تحت تأثیر مقادیر شدید در مجموعه داده نباشد. بنابراین می‌توان گفت که میانه مقاوم است و میانگین مقاوم نیست.

میانگین و میانه مرکز مجموعه داده را به روش‌های مختلفی اندازه‌گیری می‌کنند. میانگین نقطه‌ای است که مجموعه داده در آن تعادل پیدا می‌کند. میانه میانگینی است که 50% داده‌ها را از یک طرف با 50% داده‌ها از طرف دیگر جدا می‌کند. وقتی مجموعه داده تقارنی است، میانگین و میانه برابر هستند.

با این حال، میانگین و میانه ممکن است برابر نباشند.

در برخی از مجموعه‌های داده، میانگین ممکن است کمتر از میانه باشد، یا میانه ممکن است کمتر از میانگین باشد. در این حالت، می‌گوییم که مجموعه داده متمایل است.

اگر مقدار میانگین در سمت چپ یا کمتر از میانه قرار داشته باشد، می‌گوییم مجموعه داده به سمت چپ متمایل است. اگر میانگین در سمت راست یا بیشتر از میانه قرار گیرد، می‌گوییم مجموعه داده به سمت راست متمایل است.

نه میانگین و نه میانه به عنوان معیار گرایش مرکزی بهتر نیستند. هر دو به روش‌های مختلفی مرکز را اندازه‌گیری می‌کنند. برخی از کارشناسان ترجیح می‌دهند هنگامی که داده‌ها به شدت متمایل هستند یا شامل مقادیر شدید هستند، از میانه استفاده کنند زیرا میانه نماینده‌تر از یک مقدار نمونه‌ای است.

ماشین حساب مد

مد مقداری از مجموعه داده است که بیشترین تعداد دفعات در مجموعه داده رخ می‌دهد. مد یک مجموعه داده، مقداری است که بیشترین تکرار را دارد.

یک مجموعه داده اگر یک مقدار داشته باشد که بیش از هر مقدار دیگری تکرار شود، یکنواخت (unimodal) است.

اگر مجموعه داده‌ای دو مقدار با بالاترین فرکانس یکسان داشته باشد، پس هر دو مقدار به عنوان مد در نظر گرفته می‌شوند و مجموعه داده دونواخت (bimodal) در نظر گرفته می‌شود.

اگر مجموعه داده بیش از دو مقدار با بالاترین فرکانس یکسان داشته باشد، پس هر مقدار به عنوان یک مد استفاده می‌شود و مجموعه داده چندنواخت (multimodal) در نظر گرفته می‌شود.

اگر هیچ مقدار داده‌ای بیش از یک بار تکرار نشود، آنگاه گفته می‌شود مجموعه داده فاقد مد است. در این حالت، اشتباه خواهد بود اگر بگوییم مد صفر است. در واقع صفر ممکن است یک مقدار واقعی در برخی مجموعه‌های داده باشد، مانند اندازه‌گیری‌های دما.

مزیت اصلی محاسبه مد این است که آسان‌ترین برای یافتن است و تحت تأثیر مقادیر شدید قرار نمی‌گیرد. نقطه ضعف محاسبه مد این است که، در برخی شرایط، ممکن است برای برخی از مجموعه‌های داده مقدار مدی وجود نداشته باشد.

نمونه محاسبه مُد

برای دسته‌ای از بیست مقدار داده‌شده،

60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70

می‌توانیم مُد را به شیوه زیر پیدا کنیم:

مجموعه داده‌ها را به ترتیب صعودی یا نزولی مرتب می‌کنیم. اینجا ترتیب به شکل زیر است:

42، 45، 50، 53، 55، 59، 59، 60، 60، 69، 70، 70، 70، 70، 72، 75، 84، 95، 120، 160

سپس، مقداری که بیشترین تکرار را دارد پیدا می‌کنیم. اینجا، مقداری که بیشترین تکرار را دارد 70 است. پس، برای یک مجموعه داده داده‌شده، مقدار مُد 70 است.

در حالی که مُد یک معیار از تمایل مرکزی است، ممکن است همیشه مقدار مرکزی توزیع را منعکس نکند، به‌خصوص در توزیع‌های کج. مُد می‌تواند بزرگترین مقدار در مجموعه داده‌ها، کوچکترین مقدار، یا هر مقدار دیگری باشد. به عنوان مثال، اگر ما مقادیر زیر را در مجموعه داده داشتیم:

42، 45، 50، 53، 55، 57، 59، 60، 63، 69، 70، 72، 79، 82، 83، 95، 96، 120، 120، 120

مُد در این حالت 120 خواهد بود. گرچه در این مورد، مُد تمایل مرکزی را منعکس نمی‌کند.

جالب اینجاست که ما فقط می‌توانیم میانگین و میانه را برای داده‌های کمی محاسبه کنیم. و می‌توانیم مُد را هم برای داده‌های کمی و هم برای داده‌های کیفی محاسبه کنیم.

به طور میانگین، آنا ماهانه 12 بار پیتزا می‌خورد.

  • 3 بار پیتزای ناپولیتانا،
  • 3 بار پیتزای مارگاریتا،
  • 2 بار پیتزای کالزونه،
  • 1 پپرونی،
  • 1 مارینارا،
  • 1 چهار پنیر،
  • 1 کاپرسه.

در این مورد، ما دو مُد خواهیم داشت: پیتزای ناپولیتانا و پیتزای مارگاریتا.

معیارهای پراکندگی

معیارهای پراکندگی، که به عنوان معیارهای تغییرپذیری نیز شناخته می‌شوند، برای تعیین گسترش یا تغییرپذیری درون یک مجموعه داده استفاده می‌شوند. معمولاً درجه تغییرات در داده‌ها از مقدار مرکزی را منعکس می‌کنند. ما می‌توانیم تغییرات در یک مجموعه داده را با استفاده از دامنه، کوارتیل‌ها، و دامنه بین کوارتیلی بررسی کنیم.

ماشین حساب دامنه

دامنه برای یک مجموعه داده تفاوت بین بالاترین و پایین‌ترین مقدار در مجموعه داده است. ما می‌توانیم آن را با تعیین مقادیر حداکثری و حداقلی مجموعه داده محاسبه کنیم. فرمول محاسبه دامنه به شکل زیر است:

$$دامنه = بزرگ‌ترین\ مقدار - کوچک‌ترین\ مقدار$$

نمونه محاسبه دامنه

برای دسته‌ای از بیست مقدار داده‌شده،

60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70

می‌توانیم دامنه را به شیوه زیر محاسبه کنیم:

مجموعه داده‌ها را به ترتیب صعودی یا نزولی مرتب کنید. اینجا، ترتیب به این شکل است:

42، 45، 50، 53، 55، 59، 59، 60، 60، 69، 70، 70، 70، 70، 72، 75، 84، 95، 120، 160

علاوه بر این، بالاترین مقدار 160 و پایین‌ترین مقدار 42 است. بنابراین، دامنه:

$$دامنه = بزرگ‌ترین\ مقدار - کوچک‌ترین\ مقدار = 160 - 42 = 118$$

پس، برای این مجموعه داده، دامنه 118 است.

ماشین حساب کوارتیل

کوارتیل‌ها مقادیری هستند که مجموعه داده را به چهار قسمت با سه نقطه تقسیم می‌کنند، به نام‌های کوارتیل اول، دوم، و سوم.

کوارتیل اول، که با Q₁ نشان داده می‌شود، مقداری است که زیر آن 25٪ از داده‌ها قرار دارند، با باقیمانده 75٪ بالای آن.

کوارتیل دوم، که با Q₂ نشان داده می‌شود، همچنین به عنوان میانه شناخته می‌شود. این داده‌ها را به دو قسمت مساوی تقسیم می‌کند، با 50٪ از مقادیر زیر آن و 50٪ بالای آن.

کوارتیل سوم، که با Q₃ نشان داده می‌شود، مقداری است که زیر آن 75٪ از داده‌ها قرار دارند، با باقیمانده 25٪ بالای آن.

محاسبه کوارتیل‌ها

رویه‌ای برای محاسبه کوارتیل‌های یک مجموعه داده:

  1. داده‌ها را به ترتیب صعودی مرتب کنید.

  2. برای محاسبه کوارتیل دوم، میانه را محاسبه کنید. برای کوارتیل‌های اول و سوم، به شیوه زیر ادامه دهید. تعداد n - تعداد مقادیر در مجموعه داده را تعیین کنید.

  3. برای کوارتیل اول، L = 0.25n را محاسبه کنید. برای کوارتیل سوم، L = 0.75n را محاسبه کنید.

  4. اگر L عدد صحیح باشد، کوارتیل میانگین عدد در موقعیت L و عدد در موقعیت L + 1 است.

  5. اگر L عدد صحیح نباشد، آن را به عدد صحیح بالاتر گرد کنید. کوارتیل عدد در موقعیت مطابق با مقدار گرد شده است.

مثالی از محاسبه کوارتیل

برای دسته‌ای از بیست مقدار داده‌شده،

60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70

ما می‌توانیم کوارتیل‌ها را به شیوه زیر محاسبه کنیم:

  1. مجموعه داده‌ها را به ترتیب صعودی یا نزولی مرتب کنید. اینجا، ترتیب به این شکل است:

42، 45، 50، 53، 55، 59، 59، 60، 60، 69، 70، 70، 70، 70، 72، 75، 84، 95، 120، 160

  1. از محاسبات قبلی، ما از قبل می‌دانیم که

میانه = 70

  1. L برای کوارتیل اول: 0.25 × 20 = 5. L برای کوارتیل سوم: 0.75 × 20 = 15.

  2. 5 عدد صحیح است، پس Q₁ در مورد ما:

$$Q₁=\frac{55+59}{2}=57$$

  1. 15 هم یک عدد صحیح است، پس Q₃، در مورد ما:

$$Q₃=\frac{72+75}{2}=73.5$$

بنابراین، برای این مجموعه داده، کوارتیل اول 57، دوم 70 و سوم 73.5 است.

ماشین حساب دامنه بین کوارتیلی

دامنه بین کوارتیلی (IQR) تفاوت بین کوارتیل سوم Q₃ و اول Q₁ یک مجموعه داده است. این یک معیار از پراکندگی میانگین است، که می‌توان به شکل زیر محاسبه کرد:

IQR = Q₃ - Q₁

مثال محاسبه IQR

در بخش قبل، ما از قبل کوارتیل اول و سوم را محاسبه کردیم. آنها 57 و 73.5 هستند. تنها کاری که باید انجام دهیم اعمال فرمول است.

IQR = Q₃ - Q₁ = 73.5 - 57 = 16.5

بنابراین، برای این مجموعه داده، دامنه بین کوارتیلی 16.5 است.

نتایج

در مورد ما، با نظرسنجی کوچک لوئیجی درباره قیمت‌های پیتزا مارگاریتا، او می‌تواند نتیجه‌گیری‌های زیر را بکشد: میانگین و میانه با هم مطابقت نداشتند؛ انحراف کمی در داده‌ها ایجاد شد. اما بسیار محسوس نیست. بنابراین هم میانگین و هم میانه می‌توانند برای اندازه‌گیری تمایل مرکزی استفاده شوند.

اگر لوئیجی خواسته باشد قیمت میانگین برای پیتزا مارگاریتا را تعیین کند، می‌تواند هم میانگین و هم میانه را در نظر بگیرد. با این حال، قیمت‌هایی مانند 71,900 روپیه اندونزی یا 69,500 روپیه اندونزی شاید به یادماندنی نباشند. خوشبختانه، قیمت مُد برای پیتزا مارگاریتا در این محدوده قرار دارد، با 70,000 روپیه اندونزی، که این یک رقم مناسب برای استفاده در استراتژی قیمت‌گذاری لوئیجی است.

اگر او خواسته باشد پیتزافروشی را برای گروه هدف صرفه‌جوتر ایجاد کند، می‌تواند بر روی ارقام نزدیک‌تر به کوارتیل اول تمرکز کند. یعنی قیمتی حدود 57,000 روپیه اندونزی. تمرکز بر روی کوارتیل سوم برای تعیین قیمت برای مشتریان خواستارتر چندان مناسب نیست زیرا کوارتیل سوم نماینده بسیار خوبی نیست.