آتوسا نوروزی

مطالعه این مقاله حدود 41 دقیقه زمان ‌می‌برد.
1402/03/13
8153



در آمار، مفاهیم میانگین، میانه و مد به عنوان معیارهای مختلفی برای بیان میزان مرکزیت داده‌ها در نظر گرفته می‌شوند.

در این مقاله از وبسایت اس‌دیتا، به بررسی تفاوت بین میانگین، میانه و مد در آمار و کاربردهای هرکدام پرداخته خواهد شد. این سه مورد به تنهایی می‌توانند از اصول و مفاهیم مهم و پایه در علم آمار باشند.

 

بررسی  میانگین، میانه و مد در آمار

در این بخش به توضیح و بررسی هر کدام از این موارد می‌پردازیم.

 

میانگین:

میانگین یا میانه ریاضی، مجموع تمام اعداد در یک مجموعه را تقسیم بر تعداد اعداد موجود در آن مجموعه می‌دهد. به عبارت دیگر، میانگین میزان مرکزیت داده‌ها را به عنوان میانگین در نظر می‌گیرد.

میانگین برای داده‌هایی که توزیع آن‌ها نزدیک به یکنواخت است و همچنین برای داده‌هایی که بدون توجه به مقدار مثبت یا منفی هستند مفید است.

برای مثال، میانگین می‌تواند برای محاسبه‌ی متوسط درآمد، میانگین دمای یک منطقه، میانگین تعداد کلیک‌ها در یک وبسایت و موارد مشابه به کار رود.

 

میانه:

میانه، مقدار وسطی یک مجموعه از اعداد است. به عبارت دیگر، از داده‌ها، مقداری که در وسط مجموعه قرار دارد، به عنوان میانه در نظر گرفته می‌شود.

میانه برای داده‌هایی که توزیع آن‌ها به شدت از نرمال فاصله دارد و گاهی اوقات برای داده‌هایی که دارای پرتی هستند مفید است. برای مثال، میانه می‌تواند برای محاسبه‌ی میزان سن، میانه‌ی امتیازات در یک مسابقه و موارد مشابه به کار رود.

 

مد:

مد، مقداری است که در فراوانی بیشترین تکرار دارد. به عبارت دیگر، مد نشان‌دهنده‌ی مقداری است که بیشترین تعداد بار تکرار شده است.

مد برای داده‌هایی که دارای توزیع غیرنرمال هستند و همچنین برای داده‌هایی که دارای دو یا چند پیک هستند، مفید است. برای مثال، مد می‌تواند برای محاسبه‌ی میزان ترافیک در یک راه‌آهن، میزان پرداخت در یک مسابقه و موارد مشابه به کار رود.

تفاوت بین این سه مفهوم در این است که هر یک به صورت مختلفی میانگین داده‌ها را محاسبه می‌کند.

میانگین به صورت مجموع مقادیر داده‌ها تقسیم بر تعداد داده‌ها است، میانه به عنوان مقدار وسطی داده‌ها تعریف می‌شود و مد به عنوان مقداری که بیشترین تعداد بار تکرار شده است، تعریف می‌شود.

در کاربردهای مختلف، هر یک از این سه مفهوم مفید است. انتخاب مفهوم مناسب برای محاسبه‌ی میانگین داده‌ها، به دلیل توزیع داده‌ها، مهم است.

برای مثال، در داده‌هایی که دارای توزیع غیرنرمال هستند، میانگین ممکن است از میانه یا مد مناسب‌تر باشد.

همچنین، در داده‌هایی که دارای پرتی هستند، میانگین ممکن است از میانه مناسب‌تر باشد. میانگین، میانه و مد به عنوان معیارهای مختلفی برای بیان میزان مرکزیت داده‌ها استفاده می‌شوند.

هر یک از این معیارها برای محاسبه‌ی میانگین داده‌ها در شرایط خاصی مفید است و باید با توجه به توزیع داده‌ها و شرایط مختلف، مورد استفاده قرار گیرد.

 

میانگین، میانه و مد در چه شرایطی مفید نیستند؟

در بررسی تفاوت بین میانگین، میانه و مد در آمار و کاربردهای هرکدام استفاده از میانگین، میانه و مد برای بیان میزان مرکزیت داده‌ها در بسیاری از شرایط مفید است، اما در بعضی شرایط ممکن است به عنوان یک معیار مناسب برای بیان میزان مرکزیت داده‌ها نباشند.

در زیر به برخی از شرایطی که در آن استفاده از میانگین، میانه و مد مفید نیست، اشاره می‌کنیم:

 

داده‌های پرت:

در داده‌هایی که دارای پرتی هستند، میانگین به عنوان معیاری برای بیان میزان مرکزیت داده‌ها مناسب نیست.

به عنوان مثال، اگر در یک داده‌سری، یک داده بسیار بزرگتر یا کوچکتر از سایر داده‌ها وجود داشته باشد، میانگین به شدت تحت تأثیر قرار می‌گیرد. در چنین شرایطی، میانه به عنوان یک معیار مرکزیت مفیدتر است.

 

داده‌های توزیع غیرنرمال:

در داده‌هایی که توزیع آن‌ها به شدت از توزیع نرمال فاصله دارد، میانگین به عنوان یک معیار مرکزیت مناسب نخواهد بود. به عنوان مثال، اگر داده‌ها به شدت تمرکز شده باشند ولی تعدادی از آن‌ها از بافت داده‌های اصلی خارج شده باشند، میانگین به شدت تحت تأثیر قرار می‌گیرد و ممکن است به عنوان یک معیار نامناسب شناخته شود.

در چنین شرایطی، میانه به عنوان یک معیار مرکزیت مفیدتر است.

 

داده‌های نامتقارن:

در بعضی داده‌ها، توزیع آن‌ها نامتقارن است و در چنین شرایطی، استفاده از میانگین به عنوان معیار مرکزیت نامطلوب است.

به عنوان مثال، در داده‌هایی که توزیع آن‌ها به شدت از توزیع نرمال فاصله دارد ولی از بافت داده‌های منفی، بسیار کمتری نسبت به بافت داده‌های مثبت دارد، استفاده از میانگین به عنوان معیار مرکزیت مناسب نخواهد بود. در چنین شرایطی، ممکن است مد به عنوان یک معیار مرکزیت مناسب‌تر باشد.

در کل، باید به توزیع داده‌ها و شرایط مختلف توجه کرده و معیار مناسب برای بیان میزان مرکزیت داده‌ها را انتخاب کرد. استفاده از معیار مناسب می‌تواند به دقت و کیفیت تحلیل داده‌ها کمک کند.

 

چه معیاری برای داده‌های پرت مناسب است؟

در بررسی تفاوت بین میانگین، میانه و مد در آمار و کاربردهای هرکدام بهتر است تا بدانیم چه معاری برای داده‌های پرت مناسب است.

برای داده‌های پرت، معیارهای مرکزیت دیگری به جز میانگین مانند میانه و مد می‌توانند مناسب باشند. در صورتی که داده‌های پرت به شدت تحت تأثیر قرار گرفته باشند، ممکن است میانه به عنوان معیار مناسب‌تر از میانگین باشد. همچنین، استفاده از معیارهای پرت‌تر مانند کوارتیل‌ها و محدوده‌های میانه می‌تواند برای برخی داده‌های پرت مناسب باشد.

یکی از معیارهایی که برای داده‌های پرت مفید است، میانه مطلق است. در این روش، ابتدا میانگین را با استفاده از تمام داده‌ها محاسبه کرده و سپس از این میانگین مطلق، فاصله‌ی داده‌ها با میانگین را محاسبه می‌شود.

میانه مطلق، میانه‌ی این فاصله‌ها است و برای داده‌های پرت مناسب است. همچنین، استفاده از میانه‌ی محدوده برش (trimmed median) نیز برای داده‌های پرت مفید است.

در این روش، بعضی از داده‌های پرت از بین می‌رودند و سپس میانه‌ی داده‌های باقیمانده به عنوان معیار مرکزیت در نظر گرفته می‌شود.

در کل، برای داده‌های پرت، استفاده از میانگین به تنهایی به عنوان معیار مناسب برای بیان میزان مرکزیت داده‌ها مناسب نیست و باید به معیارهای دیگر نیز توجه کرد.

 

سخن پایانی

در این مقاله به موضوع تفاوت بین میانگین، میانه و مد در آمار و کاربردهای هرکدام پرداخته شد. برای اطلاعات بیشتر در خصوص این موارد می‌توانید به وبسایت اس‌دیتا مراجعه نمایید.




برچسب‌ها:

آمار میانگین حسابی مد میانگین هندسی