نتیجهای یافت نشد
هم اکنون نمیتوانیم چیزی با آن عبارت پیدا کنیم، سعی کنید چیز دیگری را جستجو کنید.
ماشین حساب برای میانگین، میانه و مد در آمار. از این ماشین حساب برای به دست آوردن میانگین، میانه، مد، دامنه و میانگین برای هر مجموعه داده استفاده کنید
نتیجه | |||
---|---|---|---|
میانگین x̄ | 16.75 | نقاط پرت | 6, 33, 35 |
میانه x̃ | 15 | کوارتیل Q1 | 12.5 |
مُد | 15، 3 بار ظاهر شد | کوارتیل Q2 | 15 |
دامنه | 29 | کوارتیل Q3 | 16 |
حداقل | 6 | دامنه بین چارکی IQR | 3.5 |
حداکثر | 35 | ||
جمع | 201 | ||
تعداد n | 12 |
در محاسبه شما خطایی رخ داد.
نگاه کردن به جداول و نمودارهای دادههای آماری میتواند برای ما برای تفسیر دشوار باشد. ما اغلب نیاز داریم تا مجموعه دادهها را خلاصه کرده و ویژگیهای مهم را برای به دست آوردن اطلاعات مفیدتر از آمار شناسایی کنیم.
در آمار، از معیارهای مختلفی برای خلاصه کردن دادهها استفاده میشود. برخی توصیف کننده مرکز دادهها هستند؛ آنها به عنوان معیارهای گرایش مرکزی نامیده میشوند. دیگران نشان میدهند که مقادیر دادهها چقدر پراکنده هستند؛ آنها به عنوان معیارهای پراکندگی شناخته میشوند. دیگران، که به عنوان معیارهای موقعیت شناخته میشوند، نسبت دادههایی که کمتر از یک مقدار داده شده است را آشکار میکنند.
هدف اصلی این ماشین حساب محاسبه معیارهای گرایش مرکزی—میانگین و میانه—است که میتوانند نماینده مقدار معمولی یا مرکزی در یک مجموعه داده باشند. هدف ثانویه این ماشین حساب تعیین میزان تغییرپذیری در یک مجموعه داده با محاسبه دامنه، کوارتیلها و فاصله بین کوارتیلی است.
میانگین مجموع مقادیر تقسیم بر تعداد کل مقادیر است. آسانترین راه برای فهمیدن و محاسبه آن، استفاده از فرمول زیر برای محاسبه میانگین برای یک نمونه است:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
فرمول برای میانگین جامعه عبارت است از:
$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$
در اینجا، صورت کسر نشاندهنده مجموع مقادیر در مجموعه داده است. و مخرج نشاندهنده تعداد مقادیر در مجموعه داده است.
ویژگی اصلی استفاده از میانگین حسابی این است که تمام نقاط داده موجود در مجموعه داده را در بر میگیرد.
محدودیت اصلی میانگین این است که به مقادیر بسیار بزرگ یا بسیار کوچک حساس است. چنین مقادیری به عنوان نقاط دور از مرکز شناخته میشوند، و آنها به طور قابل توجهی بر میانگین تأثیر میگذارند.
همچنین توجه داشته باشید که مقدار متوسط لزوماً مقدار نمونهای برای دادهها نیست. مقدار میانگین ممکن است مقداری باشد که اصلاً در مجموعه داده وجود نداشته باشد.
جامعه شامل کل مجموعه مقادیری است که اطلاعات در مورد آن به دست آورده میشود. نمونه شامل یک گروه کوچکتری است که از جامعه گرفته شده است.
روش محاسبه مقدار میانگین برای هر دو نمونه و جامعه یکسان است. فقط نامگذاریها متفاوت هستند.
اگر x₁, x₂,..., xₙ یک نمونه باشد، میانگین به عنوان میانگین نمونه شناخته شده و با نماد x̄ نمایش داده میشود. میانگین جامعه با حرف یونانی 𝜇 نمایش داده میشود.
در آمار، ما از حرف کوچک n برای نشان دادن اندازه نمونه و از حرف بزرگ N برای نشان دادن اندازه جامعه استفاده میکنیم.
بیایید به مثال زیر نگاه کنیم: لوئیجی یک سرآشپز درجه یک و عاشق پیتزا است. او تصمیم گرفته است تا پیتزافروشی خود را در بالی افتتاح کند. برای یافتن یک سرمایهگذار، لوئیجی یک طرح تجاری مینویسد. او میخواهد هزینه متوسط پیتزا در رستورانهای مختلف در جزیره را برای ارزیابی عملکرد مالی آینده مشخص کند.
او تحقیق کوچکی در مورد قیمت پیتزا مارگاریتا در رستورانهای بالی انجام داد و به مجموعهای از قیمتهای پیتزا دست یافت. برای سهولت در محاسبه، بیایید سه صفر آخر را حذف کنیم و از تعداد هزارها در قیمت استفاده کنیم. یعنی، 60 در محاسبات ما به معنی 60,000 روپیه اندونزی خواهد بود.
60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70
لوئیجی تمام پیتزافروشیهای جزیره را بازدید نکرده است. او به طور تصادفی 20 تا از آنها را انتخاب کرده است. بنابراین، ما با یک نمونه سر و کار داریم.
بیایید مقدار متوسط این مجموعه داده را با استفاده از فرمول زیر محاسبه کنیم:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
ما به میانگین x̄ = 71.9 دست پیدا میکنیم.
تحقیقات لوئیجی نشان میدهد که قیمت متوسط یک پیتزا مارگاریتا در بالی 71,900 روپیه اندونزی است. او حالا میتواند محاسبات خود را بر اساس این قیمت انجام دهد.
میانه یک معیار موقعیتی است که مقدار متوسط یک مجموعه داده مرتب شده به ترتیب صعودی یا نزولی را نشان میدهد.
با محاسبه میانه، ما سعی میکنیم یک عدد پیدا کنیم که مجموعه دادهها را به دو نیم تقسیم کند. نیمی از مقادیر داده کمتر از میانه و نیم دیگر بیشتر از میانه هستند. به همین دلیل است که وقتی بدون استفاده از ماشین حساب میانه، میانه را به صورت دستی تعیین میکنیم، نیاز داریم که مقادیر را به ترتیب صعودی یا نزولی مرتب کنیم.
محاسبه میانه بستگی به این دارد که تعداد مقادیر در مجموعه داده زوج یا فرد باشد.
اگر تعداد کل عناصر فرد باشد، یعنی n یا N فرد باشد، آنگاه فرمول زیر اعمال میشود:
$$میانه=(\frac{n+1}{2})-امین \ عنصر$$
اما، اگر تعداد عناصر زوج باشد، یعنی n یک عدد زوج باشد، آنگاه فرمول زیر استفاده میشود:
$$میانه=\frac{\left[(\frac{n}{2})-امین \ عنصر+(\frac{n}{2}+1)-امین \ عنصر\right]}{2}$$
مزیت اصلی استفاده از میانه این است که کمترین تأثیر را از مقادیر بسیار بالا یا بسیار پایین میپذیرد.
برای مجموعهای داده شده از بیست مقدار،
60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70
میتوانیم میانه را به شکل زیر محاسبه کنیم:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
بیایید تعداد مقادیر در مجموعه دادهها را مشخص کنیم. ما n = 20 داریم.
اگر n فرد باشد، مقدار مرکزی دادهها را به عنوان میانه انتخاب میکنیم. اگر n زوج باشد، میانگین حسابی دو مقدار میانه را پیدا میکنیم. آنها را اضافه کرده و مجموع را بر 2 تقسیم میکنیم.
20 یک عدد زوج است.
مقادیر مرکزی در نمونه ما 69 و 70 هستند. به این شکل میانه را پیدا میکنیم:
$$میانه = \frac{69 + 70}{2} = 69.5$$
اگر لوئیجی مجموعهای از 21 مقدار داشت، مثلاً
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70
میتوانست مقادیر را مرتب کند:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160
و مقدار واقع در مرکز در جایگاه یازدهم، یعنی 70، را انتخاب کند.
هم میانگین و هم میانه به عنوان معیارهای گرایش مرکزی استفاده میشوند. اما دانستن تفاوتهای آنها ضروری است.
یک تفاوت حیاتی بین میانگین و میانه این است که فرمول میانگین از تمام مقادیر در مجموعه داده استفاده میکند. در حالی که فرمول میانه فقط به عدد مرکزی یا دو عدد مرکزی بستگی دارد.
این موضوع بخصوص برای مجموعههای دادهای که یک یا چند عدد به طور غیرمعمول بزرگ یا کوچک هستند، مهم است. چنین اعدادی به عنوان نقاط دور از مرکز شناخته میشوند. در بیشتر موارد، این نقاط دور از مرکز به طور قابل توجهی بر میانگین تأثیر میگذارند، اما تأثیر کم یا بدون تأثیری بر میانه خواهند داشت.
در آمار، میگوییم که یک معیار مقاوم است اگر مقدار آن به شدت تحت تأثیر مقادیر شدید در مجموعه داده نباشد. بنابراین میتوان گفت که میانه مقاوم است و میانگین مقاوم نیست.
میانگین و میانه مرکز مجموعه داده را به روشهای مختلفی اندازهگیری میکنند. میانگین نقطهای است که مجموعه داده در آن تعادل پیدا میکند. میانه میانگینی است که 50% دادهها را از یک طرف با 50% دادهها از طرف دیگر جدا میکند. وقتی مجموعه داده تقارنی است، میانگین و میانه برابر هستند.
با این حال، میانگین و میانه ممکن است برابر نباشند.
در برخی از مجموعههای داده، میانگین ممکن است کمتر از میانه باشد، یا میانه ممکن است کمتر از میانگین باشد. در این حالت، میگوییم که مجموعه داده متمایل است.
اگر مقدار میانگین در سمت چپ یا کمتر از میانه قرار داشته باشد، میگوییم مجموعه داده به سمت چپ متمایل است. اگر میانگین در سمت راست یا بیشتر از میانه قرار گیرد، میگوییم مجموعه داده به سمت راست متمایل است.
نه میانگین و نه میانه به عنوان معیار گرایش مرکزی بهتر نیستند. هر دو به روشهای مختلفی مرکز را اندازهگیری میکنند. برخی از کارشناسان ترجیح میدهند هنگامی که دادهها به شدت متمایل هستند یا شامل مقادیر شدید هستند، از میانه استفاده کنند زیرا میانه نمایندهتر از یک مقدار نمونهای است.
مد مقداری از مجموعه داده است که بیشترین تعداد دفعات در مجموعه داده رخ میدهد. مد یک مجموعه داده، مقداری است که بیشترین تکرار را دارد.
یک مجموعه داده اگر یک مقدار داشته باشد که بیش از هر مقدار دیگری تکرار شود، یکنواخت (unimodal) است.
اگر مجموعه دادهای دو مقدار با بالاترین فرکانس یکسان داشته باشد، پس هر دو مقدار به عنوان مد در نظر گرفته میشوند و مجموعه داده دونواخت (bimodal) در نظر گرفته میشود.
اگر مجموعه داده بیش از دو مقدار با بالاترین فرکانس یکسان داشته باشد، پس هر مقدار به عنوان یک مد استفاده میشود و مجموعه داده چندنواخت (multimodal) در نظر گرفته میشود.
اگر هیچ مقدار دادهای بیش از یک بار تکرار نشود، آنگاه گفته میشود مجموعه داده فاقد مد است. در این حالت، اشتباه خواهد بود اگر بگوییم مد صفر است. در واقع صفر ممکن است یک مقدار واقعی در برخی مجموعههای داده باشد، مانند اندازهگیریهای دما.
مزیت اصلی محاسبه مد این است که آسانترین برای یافتن است و تحت تأثیر مقادیر شدید قرار نمیگیرد. نقطه ضعف محاسبه مد این است که، در برخی شرایط، ممکن است برای برخی از مجموعههای داده مقدار مدی وجود نداشته باشد.
برای دستهای از بیست مقدار دادهشده،
60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70
میتوانیم مُد را به شیوه زیر پیدا کنیم:
مجموعه دادهها را به ترتیب صعودی یا نزولی مرتب میکنیم. اینجا ترتیب به شکل زیر است:
42، 45، 50، 53، 55، 59، 59، 60، 60، 69، 70، 70، 70، 70، 72، 75، 84، 95، 120، 160
سپس، مقداری که بیشترین تکرار را دارد پیدا میکنیم. اینجا، مقداری که بیشترین تکرار را دارد 70 است. پس، برای یک مجموعه داده دادهشده، مقدار مُد 70 است.
در حالی که مُد یک معیار از تمایل مرکزی است، ممکن است همیشه مقدار مرکزی توزیع را منعکس نکند، بهخصوص در توزیعهای کج. مُد میتواند بزرگترین مقدار در مجموعه دادهها، کوچکترین مقدار، یا هر مقدار دیگری باشد. به عنوان مثال، اگر ما مقادیر زیر را در مجموعه داده داشتیم:
42، 45، 50، 53، 55، 57، 59، 60، 63، 69، 70، 72، 79، 82، 83، 95، 96، 120، 120، 120
مُد در این حالت 120 خواهد بود. گرچه در این مورد، مُد تمایل مرکزی را منعکس نمیکند.
جالب اینجاست که ما فقط میتوانیم میانگین و میانه را برای دادههای کمی محاسبه کنیم. و میتوانیم مُد را هم برای دادههای کمی و هم برای دادههای کیفی محاسبه کنیم.
به طور میانگین، آنا ماهانه 12 بار پیتزا میخورد.
در این مورد، ما دو مُد خواهیم داشت: پیتزای ناپولیتانا و پیتزای مارگاریتا.
معیارهای پراکندگی، که به عنوان معیارهای تغییرپذیری نیز شناخته میشوند، برای تعیین گسترش یا تغییرپذیری درون یک مجموعه داده استفاده میشوند. معمولاً درجه تغییرات در دادهها از مقدار مرکزی را منعکس میکنند. ما میتوانیم تغییرات در یک مجموعه داده را با استفاده از دامنه، کوارتیلها، و دامنه بین کوارتیلی بررسی کنیم.
دامنه برای یک مجموعه داده تفاوت بین بالاترین و پایینترین مقدار در مجموعه داده است. ما میتوانیم آن را با تعیین مقادیر حداکثری و حداقلی مجموعه داده محاسبه کنیم. فرمول محاسبه دامنه به شکل زیر است:
$$دامنه = بزرگترین\ مقدار - کوچکترین\ مقدار$$
برای دستهای از بیست مقدار دادهشده،
60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70
میتوانیم دامنه را به شیوه زیر محاسبه کنیم:
مجموعه دادهها را به ترتیب صعودی یا نزولی مرتب کنید. اینجا، ترتیب به این شکل است:
42، 45، 50، 53، 55، 59، 59، 60، 60، 69، 70، 70، 70، 70، 72، 75، 84، 95، 120، 160
علاوه بر این، بالاترین مقدار 160 و پایینترین مقدار 42 است. بنابراین، دامنه:
$$دامنه = بزرگترین\ مقدار - کوچکترین\ مقدار = 160 - 42 = 118$$
پس، برای این مجموعه داده، دامنه 118 است.
کوارتیلها مقادیری هستند که مجموعه داده را به چهار قسمت با سه نقطه تقسیم میکنند، به نامهای کوارتیل اول، دوم، و سوم.
کوارتیل اول، که با Q₁ نشان داده میشود، مقداری است که زیر آن 25٪ از دادهها قرار دارند، با باقیمانده 75٪ بالای آن.
کوارتیل دوم، که با Q₂ نشان داده میشود، همچنین به عنوان میانه شناخته میشود. این دادهها را به دو قسمت مساوی تقسیم میکند، با 50٪ از مقادیر زیر آن و 50٪ بالای آن.
کوارتیل سوم، که با Q₃ نشان داده میشود، مقداری است که زیر آن 75٪ از دادهها قرار دارند، با باقیمانده 25٪ بالای آن.
رویهای برای محاسبه کوارتیلهای یک مجموعه داده:
دادهها را به ترتیب صعودی مرتب کنید.
برای محاسبه کوارتیل دوم، میانه را محاسبه کنید. برای کوارتیلهای اول و سوم، به شیوه زیر ادامه دهید. تعداد n - تعداد مقادیر در مجموعه داده را تعیین کنید.
برای کوارتیل اول، L = 0.25n را محاسبه کنید. برای کوارتیل سوم، L = 0.75n را محاسبه کنید.
اگر L عدد صحیح باشد، کوارتیل میانگین عدد در موقعیت L و عدد در موقعیت L + 1 است.
اگر L عدد صحیح نباشد، آن را به عدد صحیح بالاتر گرد کنید. کوارتیل عدد در موقعیت مطابق با مقدار گرد شده است.
برای دستهای از بیست مقدار دادهشده،
60، 60، 84، 45، 59، 70، 42، 59، 53، 70، 69، 70، 120، 160، 95، 50، 75، 55، 72، 70
ما میتوانیم کوارتیلها را به شیوه زیر محاسبه کنیم:
42، 45، 50، 53، 55، 59، 59، 60، 60، 69، 70، 70، 70، 70، 72، 75، 84، 95، 120، 160
میانه = 70
L برای کوارتیل اول: 0.25 × 20 = 5. L برای کوارتیل سوم: 0.75 × 20 = 15.
5 عدد صحیح است، پس Q₁ در مورد ما:
$$Q₁=\frac{55+59}{2}=57$$
$$Q₃=\frac{72+75}{2}=73.5$$
بنابراین، برای این مجموعه داده، کوارتیل اول 57، دوم 70 و سوم 73.5 است.
دامنه بین کوارتیلی (IQR) تفاوت بین کوارتیل سوم Q₃ و اول Q₁ یک مجموعه داده است. این یک معیار از پراکندگی میانگین است، که میتوان به شکل زیر محاسبه کرد:
IQR = Q₃ - Q₁
در بخش قبل، ما از قبل کوارتیل اول و سوم را محاسبه کردیم. آنها 57 و 73.5 هستند. تنها کاری که باید انجام دهیم اعمال فرمول است.
IQR = Q₃ - Q₁ = 73.5 - 57 = 16.5
بنابراین، برای این مجموعه داده، دامنه بین کوارتیلی 16.5 است.
در مورد ما، با نظرسنجی کوچک لوئیجی درباره قیمتهای پیتزا مارگاریتا، او میتواند نتیجهگیریهای زیر را بکشد: میانگین و میانه با هم مطابقت نداشتند؛ انحراف کمی در دادهها ایجاد شد. اما بسیار محسوس نیست. بنابراین هم میانگین و هم میانه میتوانند برای اندازهگیری تمایل مرکزی استفاده شوند.
اگر لوئیجی خواسته باشد قیمت میانگین برای پیتزا مارگاریتا را تعیین کند، میتواند هم میانگین و هم میانه را در نظر بگیرد. با این حال، قیمتهایی مانند 71,900 روپیه اندونزی یا 69,500 روپیه اندونزی شاید به یادماندنی نباشند. خوشبختانه، قیمت مُد برای پیتزا مارگاریتا در این محدوده قرار دارد، با 70,000 روپیه اندونزی، که این یک رقم مناسب برای استفاده در استراتژی قیمتگذاری لوئیجی است.
اگر او خواسته باشد پیتزافروشی را برای گروه هدف صرفهجوتر ایجاد کند، میتواند بر روی ارقام نزدیکتر به کوارتیل اول تمرکز کند. یعنی قیمتی حدود 57,000 روپیه اندونزی. تمرکز بر روی کوارتیل سوم برای تعیین قیمت برای مشتریان خواستارتر چندان مناسب نیست زیرا کوارتیل سوم نماینده بسیار خوبی نیست.