
دانلود مقاله پروژه آمار توصیفی با word دارای 56 صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است
فایل ورد دانلود مقاله پروژه آمار توصیفی با word کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه و مراکز دولتی می باشد.
این پروژه توسط مرکز مرکز پروژه های دانشجویی آماده و تنظیم شده است
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی دانلود مقاله پروژه آمار توصیفی با word،به هیچ وجه بهم ریختگی وجود ندارد
بخشی از متن دانلود مقاله پروژه آمار توصیفی با word :
پروژه آمار توصیفی
فهرست مطالب
پیشگفتار 1
دیدگاههایی درمورد آمار 1
دید کلی 2
نقش آمار در زندگی روزمره 2
نقش آمار در پژوهشهای علمی 2
کاربرد آمار 3
فصل اول
آمار توصیفی
جمعیت 4
نمونه 5
متغیر 5
مقیاسهای اندازهگیری 6
داده 7
فصل دوم
جدولهای آماری
فراوانی مطلق 9
فراوانی نسبی 9
فراوانی تجمعی 11
فراوانی نسبی تجمعی 12
فصل سوم
نمودارهای آماری
هیستوگرام 13
چندبر فراوانی 13
چندبر فراوانی تجمعی: 13
منحنیهای فراوانی و فراوانی تجمعی 13
نمایش نمودار تنه و شاخه 14
نمودار جعبهای 14
فصل چهارم
معیارهای مرکزی
میانگین 22
میانگین حسابی 23
میانگین وزنی 23
میانگین هندسی 24
میانه 25
نما 27
چندکها 29
مقایسه معیارهای مرکزی 32
داده پرت 32
فصل پنجم
معیارهای پراکندگی
دامنه 34
میانگین انحراف از میانگین 34
واریانس 35
انحراف معیار 36
ضریب تغییرات 37
ضریب چولگی و کشیدگی 38
منحنیهای فراوانی 39
ضریب چولگی 40
ضریب کشیدگی 43
نمودار جعبهای 44
تشخیص داده پرت به روش چارکها و رابطه داده پرت با نمودار جعبهای (نمودار جعبهای اصلاح شده) 49
منابع 54
پیشگفتار
در عصر حاضر کسی نمیتواند منکر این واقعیت باشد که آمار نقشی لاینفک در زندگی روزمره ما بازی میکند. اخبار روزانه رسانههای گروهی با گزارشی از وضع هوا به پایان میرسند و در طول اخبار، به جریانهای بازار بورس و سهام اشاره میشود و روزنامهها خبر از افزایش نرخ اجناس میدهند.
آمار به عنوان پایه یک روش و راه موثر در بررسی مسائل موجود، در بسیاری از زمینههای علمی از جمله جامعه شناسی، کشاورزی، فیزیک و ;. به کار گرفته میشود. در دانش امروزی، معمولاً سعی میشود که اطلاعات موجود در یک زمینه خاص، در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطلاعات، فهم بهتری از پدیده مورد مطالعه به دست آمده و امکان مقایسه فراهم گردد. در یک جمله آمار مجموعهای از روشهای جمع آوری، تهیه و تنظیم و تجزیه و تحلیل اطلاعات است که برای کسب یک یا چند نتیجه به خدمت گرفته میشود.
دیدگاههایی درمورد آمار
تهیه آمار کاری وقتگیر و زمان بر و اصولا کسالتآور است.
آمار گورستانی از اعداد و ارقام است که در هر اداره و سازمان نمونهای از آن پیدا میشود.
آمار مجموعهای از روابط و فرمولهای ریاضی پیچیده و گیجکننده است.
آمار شامل نمودارها و جدولهایی از اعداد است.
آمار فرایندی است که در آن هر ده سال افرادی را به منازل فرستاده و اطلاعات خانوارها مانند تعداد فرزندان، سن افراد خانوار را از آنها کسب میکنند.
آمار ابزاری است که بسیاری با توسل به آن افکار عمومی را به نفع خود جلب میکنند.
آمار مفهومی است که برای ثبت و نمایش اطلاعات عددی به کار میرود، مانند تعداد بیکاران، جمعیت نواحی جنوب شهر تهران، تعداد افراد تلف شده در اثر شیوع یک بیماری یا مقدار مسافت طی شده در زمان معینی به وسیله برنده مسابقه دو.
دید کلی
بیشتر مردم با کلمه آمار، به مفهومی که برای ثبت و نمایش اطلاعات عددی بکار میرود، آشنا هستند: تعداد بیکاران، قیمت روزانه بعضی از سهام در بازار بورس، مثالهایی از این مفهوماند. ولی این مفهوم با موضوع منطبق با موضوع اصلی مورد بحث آمار نیست. آمار عمدتا با وضعیتهای سروکار دارد که در آنها وقوع یک پیشامد بطور حتمی قابل پیش بینی نیست. استنتاجهای آماری غالباً غیر حتمیاند زیرا مبتنی بر اطلاعات ناکاملی هستند. معادل کلمه آمار در زبان انگلیسی Statistics است که از لحاظ تاریخی از کلمه لاتین Status مشتق شده است.
نقش آمار در زندگی روزمره
پی بردن به واقعیات امور از طریق گردآوری و تعبیر دادهها، منحصر به پژوهشگران حرفهای نیست. این امر در زندگی روزمره همه مردم که میکوشند آگاهانه، ناآگاهانه مسائلی را درباره جامعه، محیط زندگی خود و کل دنیا درک کنند، معمول است. برای کسب اطلاع از وضع بیکاری، اثر یک مسکن در رفع بیماری و سایر مسائل مورد علاقه در زندگی روزمره، اطلاعات و ارقام را جمعآوری و آنها را تفسیر مینماییم یا کوشش میکنیم که تفسیرهای دیگران را بفهیم. بنابراین، هر روز از طریق تجزیه و تحلیل ضمنی اطلاعات مبتنی بر واقعیات، عمل کسب آگاهی انجام میگیرد.
نقش آمار در پژوهشهای علمی
موضوع آمار عبارت است از هنر علم جمع آوری، تعبیر و تجزیه و تحلیل دادهها و استخراج تعمیمهای منطقی در مورد پدیدههای تحت بررسی. با توجه به مراحل اساسی یک تحقیق علمی که عبارتند از: مشخص کردن هدف، جمع آوری اطلاعات، تجزیه و تحلیل دادهها و بیان یافتههای آشکار است که آمار بطور وسیعی در قلمرو تمام تحقیقات علمی بکار میرود. به ویژه، در مرحله جمع آوری اطلاعات، آمار راهنمای محقق در انتخاب روشها و وسایل مناسب برای جمعآوری دادههای اطلاعاتی است. در مراحل بعد از گرد آوری دادهها، نیاز بیشتری به روشهای آماری وجود دارد.
کاربرد آمار
کاربرد روشهای آماری در قلمروهای گوناگون از علوم انسانی، علوم مهندسی، رشتههای علمی جدیدی پدید آورده است که در ارتباط متقابل با آمار هستند. نظیر آمار زیستی، روانسنجی، آمار مهندسی، آمار بازرگانی، اقتصادسنجی و جمعیتشناسی. به علاوه علم آمار در رشتههای بسیار دیگری که هنوز از ترکیب آنها با آمار شاخههایی با اسامی خاص پدید نیامده، از قبیل علوم سیاسی، هواشناسی و محیطشناسی نقش عمدهای ایفا میکند.
فصل اول
آمار توصیفی
برای اینکه نتایج مناسب و مطلوب از اطلاعات که در آمارگیریها جمعآوری میکنیم، به دست آید باید:
– اعداد نماینده واقعی مشاهدات بوده و غیرواقع یا غلط نباشند
– به نحو مفیدی تهیه و تنظیم شوند
– به نحو صحیح تجزیه و تحلیل گردند
– قابل نتیجه گیری صحیح باشند
به طور کلی، روشهایی که بوسیله آنها میتوان اطلاعات جمعآوری شده را تنظیم، طبقهبندی و خلاصه نمود و آنها را بوسیله نمودارهایی نمایش داد، به آمار توصیفی موسوم است. هدف آمار توصیفی توجیه نیست، بلکه توصیف استخراج نکات اساسی و تحقق بخشیدن به ترکیب اطلاعات به کمک زبان اعداد است. برای معرفی این روشها نیاز به برخی اصطلاحات داریم که در ذیل به معرفی آنها میپردازیم.
جمعیت
مجموعه تمام افراد یا اشیایی که مطالعات آماری در مورد یک یا چند صفت آنها در یک مکان و زمان معین انجام میگیرد به جمعیت موسوم است. هر یک از این افراد یا اشیا را یک عضو جمعیت مینامند و تعداد اعضای جمعیت را اندازه جمعیت مینامند.
مثال1: اندازه قد یا وزن دانشجویان بیست ساله یک شهر، تعداد لامپهای سالم و یا ناسالم تولید شده در یک کارخانه و در یک روز معین، مثالهایی از جمعیتهای آماری هستند.
مثال2: اگر بخواهیم معدل دانشجویان یک دانشکده در یک نیمسال را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر کلیه دانشجویان آن دانشکده میباشند و صفت مورد مطالعه معدل نیمسال تحصیلی آنها است. همینطور اگر بخواهیم میزان کالری موجود در غذاهای کنسرو شده در یک کارخانه کنسرو سازی در یک روز معین را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر تمامی غذاهای کنسرو شده کارخانه در آن روز و صفت مورد مطالعه میزان کالری موجود در آنها میباشد.
نکته:
معمولا مطالعه ویژگیهای مورد نظر، به هنگامی که جمعیت آماری بسیار گسترده باشد، مستلزم صرف هزینه و وقت زیادی میباشد و در بسیاری از مواقع، این امر اصولا امکان پذیر نیست. بنابراین در چنین موردی، برای مطالعه ویژگی مورد نظر، به قسمتی از جمعیت آماری اکتفا میکنیم
نمونه
زیر مجموعهای از جمعیت که طبق یک قاعده و ضابطه خاصی برای مطالعه صفتی از جمعیت انتخاب میشود را یک نمونه گویند. تعداد اعضای نمونه به اندازه نمونه موسوم است.
نکته:
این نمونه وقتی مفید و قابل قبول خواهد بود که بتواند نماینده خوبی برای کل جمعیت مورد مطالعه باشد. با توجه به اهمیت این موضوع شاخهای از آمار تحت عنوان نظریه نمونهگیری با بررسی نمونهای به این امر مهم میپردازد. در بسیاری از موارد، معمولا نمونه تصادفی ساده را در نظر میگیرند.
مثال: برای بررسی اندازه قد دانشجویان بیست ساله یک شهر، انتخاب مثلاً 150 نفر از بین این جمعیت به طور تصادفی، یا انتخاب 100 لامپ به تصادف از لامپهای تولیدی یک کارخانه در یک روز معین، برای تعیین کیفیت لامپهای تولیدی این کارخانه مثالهایی از نمونه تصادفی هستند.
متغیر
خصوصیت مورد مطالعه، از فردی به فرد دیگر، یا از شی به شی دیگر در جمعیت آماری تغییر میکند، که آن را اصطلاحاً متغیر مینامیم.
معمولاً دو نوع متغیر در آمار مورد نظر هستند:
متغیرهای گروهی، نظیر رنگ، نژاد، شغل و گروه خونی که شامل چند گروه یا طبقه میباشند.
متغیرهای عددی که ممکن است نتیجه شمارش باشد، مانند تعداد احشام هر خانوار در یک روستا،تعداد حوادث در یک کارخانه در روزهای مختلف و یا نتیجه اندازهگیری باشد، مثل قد دانشجویان بیست ساله در یک شهر، حجم شربت مولتی ویتامین با استاندارد خاص.
متغیر:
• متغیرهای گسسته
1 متغیرهای گروهی
2 متغیرهای عددی که از راه شمارش بهدست آمده اند
• متغیرهای پیوسته
1 متغیرهایی را که از طریق اندازهگیری به دست آمده باشند
مقیاسهای اندازهگیری
در بسیار از مسائل پیشرو، اندازهگیری ویژگی یک متغیر مستلزم آگاهی و شناخت خاصی است. به طور کلی چهار نوع مقیاس برای اندازهگیری وجود دارد:
§ مقیاس اسمی
§ مقیاس ترتیبی
§ مقیاس فاصلهای
§ مقیاس نسبتی
مقیاس اسمی:
این نوع مقیاس اندازهگیری عمدتاً برای طبقه بندی دادهها به کار میرود و منظور از آن اطلاق یک عدد طبیعی به دادههای متفاوت است.
مثال: اختصاص اعداد 1 تا 4 به گروههای خونی A, B, AB, O.
توجه داشته باشید که:
این اعداد را نمیتوان برای مقایسه یا چهار عمل اصلی به کار برد
مقیاس ترتیبی:
این نوع مقیاس اندازهگیری عموما برای طبقه بندی دادهها به منظور یک نوع برتری به کار میرود.
مثال: در یک کارخانه ممکن است کارگران را به سه دسته ساده، نیمه ماهر و ماهر تقسیمبندی کنیم. اطلاق به ترتیب اعداد 1 تا 3 به این سه دسته یک مقیاس ترتیبی است.
توجه داشته باشید که:
این اعداد تنها برای مقایسه به کار میروند و نمیتوان با آنها چهار عمل اصلی را انجام داد.
مقیاس فاصله ای:
این نوع مقیاس اندازهگیری عموما در زمینههای که علاوه بر حفظ ترتیب به نحوی فاصله بین ویژگیها را نیز حفظ میکند. به عبارت دیگر در چنین مقیاسی نسبت تفاضلها ثابت میماند.
مثال: اندازهگیری ضریب هوشی دانش آموزان کلاس اول دبستان در شهر اصفهان.
توجه داشته باشید که:
در این نوع مقیاس، عدد صفر یک مفهوم قراردادی است.
مقیاس نسبتی:
این نوع مقیاس اندازهگیری علاوه بر حفظ فاصله، نسبت را نیز حفظ میکند. به عبارت دیگر در این نوع اندازهگیری نسبت دو مقدار بستگی به واحد اندازهگیری ندارد.
داده
در یک بررسی آماری، بایستی صفت مورد مطالعه را به صورت اعداد و ارقام نمایش دهیم. اگر صفت مورد مطالعه کمی، مانند وزن، حجم، درجه حرارت و غیره باشد آنگاه این عمل به سادگی با اندازهگیری امکان پذیر است اما اگر صفت مورد مطالعه کیفی، مانند گروه خون، شغل، رنگ چشم و غیره باشد آنگاه بایستی با یک قاعده معین این مسائل کیفی را با اعداد و ارقام نشان داد. در هر صورت این اعداد و ارقام را داده ها گویند که به دو صورت گسسته و پیوسته میباشند. دادههای گسسته دادههایی هستند که بین دو مقدار متصور آنها هیچ عدد دیگری وجود نداشته باشد، مانند تعداد فرزندان یک خانواده که شامل مقادیر 0، 1، 2 و; است و همچنین صفت شغل افراد که به آن مثلاً اعداد 1، 2، 3 و; را نسبت میدهیم و بین این مقادیر عدد دیگری در رابطه با صفت موردنظر وجود ندارد. دادههای پیوسته داده هایی هستند که بین هر دو مقدار متصور آنها همواره عدد دیگری وجود دارد، مانند وزن افراد که بین دو نفر با وزنهای نزدیک به هم همواره میتوان فردی را با وزنی بین وزن دو فرد یاد شده در جمعیت یافت. از جمله دادههای گسسته میتوان دادههای مربوط به صفات گروه خون، رنگ، نژاد، شغل، تعداد کالاهای تولیدی و غیره را برشمرد و از جمله دادههای پیوسته میتوان دادههای مربوط به صفات وزن، طول قد، فشار گاز، قطر لوله تولیدی یک کارخانه و غیره را برشمرد.
داده خام:
معمولا به دادههای جمع آوری شده که انبوهی عدد است و هیچ نوع پردازشی روی آنها انجام نشده است داده خام میگویند.
در آمار بعد از جمعآوری دادهها به بررسی آماری بر روی آنها میپردازیم. در مرحله نخست با توجه به اهداف بررسی، داده ها را تنظیم، طبقه بندی و خلاصه میکنیم به طوری که بتوانیم اطلاعات مفیدی برای نیل به اهداف و نتایج مورد نظر به دست آوریم. انجام این کار در سه مرحله به شرح زیر صورت میپذیرد:
الف) تنظیم و طبقه بندی دادهها در یک جدول
ب) ترسیم نمودارهای گوناگون از روی مقادیر ارائه شده در جدول
ج) خلاصه کردن داده ها به یک یا چند عدد موسوم به شاخص یا آماره
سه موضوع فوق از موضوعات اساسی بحث آمار توصیفی است که در ذیل به معرفی و بررسی آنها میپردازیم.
فصل دوم
جدولهای آماری
نخستین گام در خلاصه کردن دادهها، طبقه بندی و تنظیم آنها در یک جدول موسوم به جدول آماری است. یک جدول آماری بایستی به نحوی تنظیم شود که بتوان از آن به راحتی اطلاعات نهفته در دادهها را استخراج کرد. متداولترین جدول آماری جدول فراوانی است که در آن دادهها، تعداد موجود از هر داده و درصد موجود از هر داده مشخص میشود. پیش از آنکه نحوه تنظیم جدول فراوانی را بیان نماییم، اطلاع از اصطلاحات زیر ضروری است.
فراوانی مطلق
هرگاه nداده y1, y2, k, yn از k نوع x1, x2, k, xk، با فرض ، به ترتیب با تعدادهای تشکیل شده باشند، آنگاه را فراوانی مطلق میگوییم. به عبارت دیگر تعداد دفعاتی را که در دادههای تکرار میشود، فراوانی مینامیم و آن را با نماد نمایش میدهیم.
به خاطر داشته باشید که:
اگر اندازه نمونه برابر n باشد، آنگاه برای
فراوانی نسبی
مثال: دادههای زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان میدهد. فراوانی دادها را تعیین نمایید.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
مشاهده میشود که دادههای تکرار اعداد 2،3،4،5،6،7،8 میباشند،بنابراین جدول زیر را برای فراوانی دادهها خواهیم داشت:
2
3
4
5
6
7
8 1
4
3
8
7
3
4
نسبت فراوانی به اندازه نمونه را فراوانی نسبی مینامیم. اگر فراوانی در یک نمونه با اندازه n، برابر fi باشد، آنگاه فراوانی نسبی xi را با نماد ri نمایش خواهیم داد، به طوری که:
به خاطر داشته باشید که
برای
مثال: دادههای زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان میدهد. فراوانی نسبی را محاسبه کنید.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
جمع فراوانیهای fi، تعداد کل جمعیت یعنی n است و جمع فراوانیهای نسبی ri برابر یک میباشد.
فراوانی تجمعی
با توجه به تعریف فراوانی، فراوانی تجمعی ردیف i را با نماد نمایش میدهیم و به صورت زیر تعریف میکنیم:
به خاطر داشته باشید که
برای اندازه نمونه n و آنگاه:
مثال: دادههای زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان میدهد. فراوانی تجمعی را تعیین نمایید.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
فراوانی نسبی تجمعی
با توجه به تعریف فراوانی نسبی، فراوانی نسبی تجمعی ردیف i را با نماد Ri نماد نمایش میدهیم و به صورت زیر تعریف میکنیم:
به خاطر داشته باشید که:
برای اندازه نمونه n و آنگاه:
مثال: دادههای زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان میدهد. فراوانی نسبی تجمعی را تعیین نمایید.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
فصل سوم
نمودارهای آماری
معمولا دادهها را با نمودارهای مختلف نمایش میدهند. عموما این نمودارها در ارتباط با دادههای پیو.سته به کار گرفته می شود و منظور از نمایش آنها، تجسم عینی اطلاعات نهفته در دادهها است. در این بخش به معرفی چند نمودار معروف اکتفا میکنیم:
هیستوگرام
نمودار دادههای پیوسته را نمودار هیستوگرام مینامند. در این نمودار محور افقی کران طبقات و محور عمودی فراوانی را نشان میدهد. در این نمودار باید مستطیل یا ستونها به هم چسبیده باشند.
چندبر فراوانی
برای رسم این نمودار، xi یا نماینده طبقات در هر مستطیل را بوسیله خطاهای شکسته به یکدیگر متصل میکنیم و به خاطر زیبایی این نمودار از کوچکترین کران جدول فاصله طبقات (W) را کم کرده و به بزرگترین کران جدول فاصله طبقات (W) را اضافه میکنیم و ابتدا و انتهای نمودار را به وسط قاعدههای جدید یا همان xiهای طبقههای جدید وصل میکنیم.
چندبر فراوانی تجمعی:
برای رسم این نمودار محور افقی را xi (نماینده طبقات) و محور عمودی را Ri درنظر بگیرید و نقاط تلاقی آنها را بوسیله خطهای شکسته به هم وصل کنید.
منحنیهای فراوانی و فراوانی تجمعی
برای رسم منحنی فراوانی محور افقی را xi و محور عمودی را fi و برای رسم منحنی فراوانی تجمعی محور افقی را xi و محور عمودی را Ri قرار دهید و نقاط تلاقی را به یکدیگر وصل کنید.
نمایش نمودار تنه و شاخه
این نوع نمودار برای دادههای کمی بکار میرود. برای رسم این نمودار ابتدا بهتر است دادهها را به صورت صعودی مرتب کنیم و ارقام مشاهدات را به دو قسمت به نامهای تنه و شاخه تقسیم کنیم. تنه شامل یک یا چند رقم و شاخه شامل ارقام باقیمانده است. مثلاً عدد 32 را به 3 تنه و 2 شاخه تقسیم میکنیم.
توجه: اگر دادههای ارقام اعشاری باشند، آنها را سرراست میکنیم.
نمودار جعبهای
رسم این نمودار را در انتهای فصل پنجم به طور جامع توضیح میدهیم.
مثال 1: نمرات 80 دانشجو در امتحانات نهایی درس احتمال و آمار به شرح زیر است:
93 76 88 62 90 68 82 75 84 68
75 85 59 71 93 60 73 88 79 73
72 63 78 95 62 74 87 75 65 61
60 68 74 69 77 94 75 82 78 66
71 83 79 60 95 75 61 89 78 99
75 71 65 76 85 78 97 67 62 79
74 50 76 62 78 88 57 73 80 65
77 85 75 76 63 72 81 73 67 86
موارد زیر را بدست آورید.
الف) تشکیل جدول فراوانی ب) رسم نمودارهای آماری
حل: اندازه واقعی مدلها در فاصله [5/99-5/49] است.
در آن r تمام ارقام گرد شده است. C تعداد طبقات است که برابر 5 میباشد. اندازه طبقات برابر:
Ri Fi ri fi xi کلاس
3
3 545 495-595
24
21 645 595-695
57
33 745 695-795
72
15 845 795-895
1 80
8 945 895-995
— — 1 80 — sum
نمودار هیستوگرام:
که در آن:
کران بالای طبقه + کران پایین طبقه = xi xi: نمایده طبقات هستند
2
نمودار چندبر فراوانی
نمودار چندبر فراوانی
نمودار منحنی فراوانی
نمودار منحنی فراوانی تجمعی
پس از ساختن نمودار اولیه معمولا بهتر است مقادیر هر شاخه را از کوچک به بزرگ، با تعداد دفعات تکرار، مرتب کرد، به صورت زیر:
مثال 2: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار، به شرح زیر است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
قسمتهای زیر را محاسبه کنید.
الف) تشکیل جدول فراوانی
ب) رسم نمودارهای آماری
چون دادهها تا یک رقم اعشار گرد شدهاند، بنابراین میتوان گفت که اندازه واقعی معدلها در فاصله [135,295] است.
برای محاسبه فاصله طبقات (W) ابتدا نیاز به محاسبات زیر است که در آن r تعداد ارقام گرد شده است.
که در آن:
C: تعداد طبقات
W: طول واقعی کلاس
R: دامنه است.
Ri Fi ri fi xi کلاس
008 4 008 4 145 135-155
020 10 012 6 165 155-175
044 22 024 12 185 175-195
062 31 018 9 205 195-215
078 39 016 8 225 215-235
090 45 012 6 452 235-255
094 47 004 2 265 255-275
100 50 006 3 285 275-295
— — 100 50 — sum
هیستوگرام
چندبر فراوانی
چندبر فراوانی تجمعی
نمودار منحنی فراوانی تجمعی
نمودار منحنی فراوانی
نمودار تنه و شاخه
فصل چهارم
معیارهای مرکزی
با استفاده از جدول فراوانی و رسم نمودارها میتوانیم دادهها را به نحو مطلوبی تنظیم کرده و اطلاعات نهفته را تا حدودی مشخص کنیم. با این حال برای ارایه یک گزارش مناسب،بهتر است آنها را در یک یا چند عدد مناسب نیز خلاصه کنیم. چنین عددی میتواند معیار مرکزی باشد. مهمترین معیارهای مرکزی میانگین، میانه و نما است که در بخش این به شرح هر یک از آنها خواهیم پرداخت.
هرگاه n داده y1, y2, k, yn از k نوع ، با فرض ، به ترتیب با تعدادهای تشکیل شده باشند، آنگاه را فراوانی میگوییم.
میانگین
میانگین به عنوان یک شاخص مرکزی به صورت ذیل تعریف میگردد:
حاصل جمع دادهها = میانگین
تعداد دادهها
مثال: میانگین دادههای زیر را که در خصوص تعداد فرزند کارمندان یک اداره است را بدست آورید:
5 5 4 3 3 2 2 1 1 1 1 0 0
یعنی به طور متوسط کارمندان دارای 15/2 فرزند هستند.
توجه: میانگین جمعیت را با حرف یونانی نشان داده و آنرا “مو” تلفظ میکنند. میانگین نمونه را با حرف نمایش داده و آن را “ایکس بار” مینامند. میانگین انواع مختلف دارد که مختصر به چند نوع آن اشاره خواهیم کرد.
مثال: فرض کنید تعداد دانشجویان تهران 2000 نفر میباشند. بطور تصادفی یک نمونه 100 تایی گرفته شده است تا قد دانشجویان مورد بررسی قرار گیرد و واحد اندازهگیری بر حسب سانتیمتر تا نزدیکترین واحد سر راست شدهاند که نتایج آن بصورت زیر درآمده است.
i کران طبقات fi xi
1
2
3
4
5 149.5-156.5
156.5-163.5
163.5-170.5
170.5-177.5
177.5-184.5 15
20
30
25
10 153
160
167
178
181
Sum — 100 —
یعنی بطور متوسط قد دانشجویان 65/166 سانتیمتر است.
یادآوری: k تعداد طبقات در جدول فروانی است.
میانگین حسابی
میانگین حسابی برای دادهها وقتی بکار گرفته میشوند که دادههای آماری دارای اهمیت مساوی باشند که آن را با نماد نمایش میدهند و فرمول آن به صورت زیر است:
میانگین وزنی
اگر دادههای آماری دارای اهمیت مساوی نباشند، به هر یک از این دادهها، وزنی به تناسب اهمیت آن اختصاص میدهند، یعنی متناظر هر یک از دادههای وزنی به صورت درنظر میگیریم. به عبارت دیگر wi وزنهایی است که به هر یک از xiها به ازای نسبت داده شده است. میانگین وزنی را معمولاً با نماد نمایش میدهیم و فرمول آن به صورت زیر است:
مثال: در یک شهر که 3 روزنامه محلی منتشر میشود، 18 درصد خانوارهای ساکن این شهربا هیچ یک از روزنامهها مشترک نیستند، اما درصد آنها با یکی از روزنامه، 17 درصد با دو روزنامه، 4 درصد هر سه روزنامه مشترکند. متوسط اشتراک خانواده این شهر را با این روزنامهها بدست آورید.
i xi wi
1
2
3
4 0
1
2
3 0.18
0.61
0.17
0.04
1
میانگین هندسی
تعاریف مختلفی برای این نوع میانگین آوردهاند، اما رایجترین آنها این است:
فرض کنید n مشاهده مثبت غیرصفر بصورت ذیل داریم:
در اینصورت میانگین هندسی را به صورت زیر تعریف میکنیم:
در مسائل اقتصادی یا جمعیتشناسی میانگین هندسی را معمولاً هرگاه xiها از درصد یا نسبت تشکیل شده باشند بکار میبرند.
تذکر:
میانگین هندسی همواره از میانگین حسابی کوچکتر است به استثناء موارد نادری که تمام مقادیر یکسان میباشند که در این صورت میانگین هندسی و حسابی برابر میشوند.
مثال: فرض کنید میزان تولید کارخانهای در چهار سال متوالی 2، 4، 6 و 27 باشد. در حالتهای زیر میزان افزایش متوسط را بدست آورید.
الف) سال پایه ثبت باشد (یعنی تولید امسال را نسبت به یک سال درنظر میگیرند).
ب) سال پایه ثابت نباشد (یعنی تولید هر سال را نسبت به سال قبل درنظر میگیرند).
حل) الف:
ب:
میانه
اگر دادهها را از کوچک به بزرگ مرتب نماییم، عدد m را میانه این دادهها مینامیم، اگر نصف دادهها در سمت چپ و نصف داده در سمت راست این عدد قرار گیرد
محاسبه میانه برای دادههای گسسته
اگر y1, y2, k, yn دادههای ما باشند و شکل مرتب شده آنها را با . نمایش دهیم. آنگاه:
مثال: تعداد کتابهای منتشر شده سال 79 در 15 انتشاراتی به شرح زیر است. میانه را بدست آورید.
4 3 2 10 1
9 8 6 5 4
11 2 10 10 9
ابتدا دادهها را به صورت صعودی مرتب میکنیم. داریم:
11 10 10 10 9 9 8 6 5 4 4 3 2 2 1
چون تعداد دادهها فرد است، پس میانه دادهها است. پس:
در نتیجه میانه برابر 6 میباشد.
محاسبه میانه برای دادههای پیوسته
برای محاسبه ابتدا ستون فراوانی انباشته (Fi) را تشکیل میدهیم. را محاسبه کرده و هر طبقهای را که برابر یا بلافاصله بزرگتر از n/2 باشد را به عنوان رده میانه درنظر میگیریم. فرمول میانه به صورت زیر میباشد:
که در آن:
LM: کران پایین رده میانه
n: تعداد دادهها
Fb: فراوانی انباشته قبل از رده میانه
fm: فراوانی رده میانه
W: طول (فاصله) رده میانه است.
مثال: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار، به شرح زیر است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
fi xi کلاس
4 145 135-155
6 165 155-175
12 185 175-195
9 205 195-215
8 225 215-235
6 452 235-255
2 265 255-275
3 285 275-295
50 — sum
میانه را حساب کنید.
حل: ستون فراوانی انباشته را تشکیل میدهیم، داریم: ، پس طبقه 15/2-99/1 چون فراوانی انباشته آن را بلافاصله بعد از 25 است رده میانه است.
Fi fi xi کلاس
4 4 145 135-155
10 6 165 155-175
22 12 185 175-195
31 9 205 195-215
39 8 225 215-235
45 6 452 235-255
47 2 265 255-275
50 3 285 275-295
— 50 — Sum
نما
دادهای که فراوانی آن نسبت به دیگر دادهها بیشتر باشد، نما یا مد نامیده میشود و آن را با نماد M نمایش میدهیم.
محاسبه نما برای دادههای گسسته
برای به دست آوردن نما، نخست فراوانی دادهها را پیدا میکنیم و دادهای را که فراوانی آن بیشتر باشد، به عنوان نما اختیار میکنیم و اگر دو داده، دارای فراوانی یکسان و بیش از دیگر فراوانیها باشند، هر دو را به عنوان نما اختیار میکنیم و دادهها را دو نمایی میگوییم، به شرط آن که این دو داده در یک صف غیرنزولی، کنار هم نباشند. در صورتی که این دو داده در یک صف غیر نزولی، کنار هم باشند نصف مجموع آنها را به عنوان نما اختیار میکنیم. اگر تمام داده دارای فراوانی یکسان باشند،میگوییم دادهها بدون نما هستند. به یاد داشته باشید که نما، به عنوان یک معیار تمرکز در دادههای گروهی به کار گرفته میشود.
مثال: برای دادههای 2، 2، 5، 7، 9، 9، 9، 10، 10، 11، 12و 18 نما برابر 9=M است، زیرا فراوانی داده 9 بیش از فراوانی دیگر دادهها است.
مثال: برای دادهها 2، 3، 4، 4، 4، 5، 5، 7، 7، 7و 9، دو داده 4 و 7 به عنوان نما اختیار میشوند، زیرا فراوانی این دو داده، بیش از فراوانی دادههای دیگر است.
مثال: برای دادههای 3، 5، 8، 10، 12، 15و 16، نما وجود ندارد، زیرا تمام دادهها دارای فراوانی یکسان هستند.
مثال: برای دادهها 2، 3، 4، 4، 4، 5، 5، 5، 7، 7 و 9، 2 داده 4 و 5 را که دارای بیشترین فراوانی هستند به عنوان نما بر میگزینیم، اما از آنجا که این دو داده در یک صف غیر نزولی در کنار یکدیگر قرار دادند، نصف مجموف دو داده به عنوان نما اختیار میشود، یعنی 5/4=M.
محاسبه تما برای دادههای پیوسته:
برای محاسبه نما در این حالت ستون فراوانی را درنظر میگیریم و هر طبقهای که بیشترین فراوانی را داشته باشد، آن طبقه را به عنوان نما تعیین میکنیم. فرمول نما در این حالت به صورت زیر است:
که در آن:
LM: کران پایین رده نما
d1: اختلاف فراوانی رده نما با رده قبل از خودش
d2: اختلاف فراوانی رده نما با رده بعد از خودش
W: طول (فاصله) رده نما میباشد.
مثال: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار، به شرح زیر است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
نما را بدست آورید.
از روی جدول ملاحظه میشود که فراوانی رده 95/1_75/1 دارای بیشترین فراوانی است بنابراین به عنوان رده نما در نظر میگیریم.
چندکها
چندک یک معیار کلیتر از میانه است و درعنوان حالت خاص میانه را نیز در بر میگیرد. اگر p یک عدد حقیقی بین صفر و یک باشد، آنگاه عدد را چندک مرتبه p مینامیم. هرگاه p 100% دادهها سمت چپ و (p -1) 100% دادهها سمت راست باشند. چندکهای معروف عبارتند از:
چارکها
چارکها به ازای 75/0، 5/0، 25/0 =p به دست میآیند و آنها را به ترتیب با نماد (چارک اول)، (چارک دوم) و (چارک سوم) نشان میدهند.
دهکها
دهکها به ازای 9/0،;..،2/0،1/0=p به دست میآیند و آنها را به ترتیب با نماد (دهک اول)، (دهک دوم)، ;; و (دهک نهم) نشان میدهند.
صدکها
صدکها به ازای 99/0،;..02/0، 01/0=p به دست میآیند و آنها را به ترتیب با نماد (صدک اول)، (صدک دوم)،;..و (صدک نود و نهم) نشان میدهند.
محاسبه چندک برای دادههای گسسته
فرض کنید y1, y2, k, yn دادههای ما باشند و شکل مرتب شده آنها را با نمایش دهیم. برای محاسبه چندک
محاسبه چندک برای دادههای پیوسته
برای محاسبه چندک در فرمول میانه اولاً را به جای m و p را به جای 5/0 درنظر میگیریم. سپس سایر مراحل را مانند روش محاسبه میانه انجام میدهیم که فرمول آن به صورت زیر میشود:
که در آن:
: کران پایین رده چندک
n: تعداد دادهها
Fb: فراوانی انباشته قبل از رده چندک
: فراوانی رده چندک
w: طول (فاصله) رده چندک است.
مثال: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار، به شرح زیر است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
fi xi کلاس
4 145 135-155
6 165 155-175
12 185 175-195
9 205 195-215
8 225 215-235
6 452 235-255
2 265 255-275
3 285 275-295
50 — Sum
چندک مرتبه 25/0 را محاسبه کنید.
ستون فراوانی تجمعی را محاسبه میکنیم. با توجه به ستون فراوانی تجمعی در جدول فراوانی، کلاسی را که چندک در آن قرار دارد مشخص میکنیم. برای این کار np را محاسبه میکنیم. چون طبقه سوم بلافاصله بعد از 5/12 آمده است، بنابراین طبقه سوم (95-1-75/1) به عنوان چندک مرتبه 25/0 انتخاب میکنیم.
Fi fi xi کلاس
4 4 145 135-155
10 6 165 155-175
22 12 185 175-195
31 9 205 195-215
39 8 225 215-235
45 6 452 235-255
47 2 265 255-275
50 3 285 275-295
— 50 — Sum
مقایسه معیارهای مرکزی
داده پرت
دادهای که با سایر دادههای دیگر اختلاف زیادی داشته باشد، داده پرت نامیده میشود. در این حالت بایستی شاخص مرکزی مناسبی برای دادهها انتخاب و محاسبه شود.
مثال: دادههای زیر در خصوص تعداد ماموریت کارمندان یک اداره است. میانگین و میانه را محاسبه کرده و بیان کنید کدام شاخص مرکزی ماموریت دادهها را بهتر نشان دهد.
90 15 14 13 13 12 11 9 7 7 5 3 2 2 1
حل. محاسبه میانگین:
محاسبه میانه:
چون دادهها به صورت صعودی مرتب شدهاند و تعداد آنها (n) فرد است، بنابراین میانه است. در نتیجه میانه است. حال وضعیت مکانی داده پرت، میانگین و میانه را در دادهها که به صورت زیر است، درنظر میگیریم.
