معرفی چند کاربرد علم آمار در موسيقی

متن کامل

برگرفته از: نشریه دانشجویی ندا، دوره 8, شماره 2 - ( شماره دوم- سال هشتم 1389 ) نوشته خانم مریم غلامی

برنامه‌ی آموزشی پژوهشكده‌ی آمار در شش‌ماه دوم  سال 1391

برای آگاهی از برنامه‌ی آموزشی پژوهشكده‌ی آمار در شش‌ماه دوم  سال 1391  اینجا کلیک کنید.

 

احتمال فازی

در پرداختن به این موضوع، این فرض را در نظر می‌گیرم که دوستان به تعاریف ابتدایی در نظریه احتمالات همانند امید ریاضی، احتمال یک پیشامد، تابع چگالی احتمال و ... آشنایی لازم را دارند.

بحث خود را با یک نگاه شهودی به احتمال فازی آغاز می‌کنم:

در نظریه احتمال غیرفازی، برای بدست آوردن احتمال رخدادن یک پیشامد -همان (P(A -آزمایشی تصادفی انجام می‌دهیم که عبارتست از: یک انتخاب تصادفی از یک فضای نمونه...
اما در نظریه احتمال فازی این انتخاب تصادفی از فضای نمونه‌ای انجام می‌شود که شامل عناصر و اعضایی است که هرکدام با درجه‌ای مخصوص ، متعلق به این فضا هستند.

(مثلاً در پرتاب یک تاس پیشامدهای ۱ و ۲ و .. و ۶ بطور یکسان و قطعی عضو فضای نمونه ما هستند و یا مثلاً پیشامدهای ۷ و ۸ و ... بطور قطعی و یکسان عضو فضای ما نیستند.
اما در یک فضای نمونه‌ای فازی این
۱ و ۲ و ... و ۶ بطور یکسان و همگون در فضای ما حضور ندارند بلکه با یک درجه عضویتی متعلق به این فضا هستند.
مثلاً
۱ با درجه عضویت ۱ بطور کامل متعلق به این فضاست و ۲ با درجه عضویت ۳/۱ و ۳ با درجه عضویت ۲/۱ و مثلاً ۷ با درجه عضویت ۰ اصلاً تعلقی به این فضا ندارد و الی آخر...)

بنابراین در احتمال فازی، تعبیر زیبایی برای (P(A بدست می‌آید که عبارتست از انتظار ما از اینکه آن عضوی که به تصادف انتخاب شده است تا چه حد دارای ویژگی آن فضای نمونه‌ای است. (به بیان فازی، درجه عضویتش در آن مجموعه چند است؟)

اگر در وهله اول بخواهم به بیان شباهت ها و اشتراکات نظریه فازی و نظریه احتمال بپردازم باید بگویم که : «هم نظریه فازی و هم نظریه احتمال، برای بررسی پدیده‌هایی به کار می‌روند که شامل عدم قطعیت و نبود اطمینان در مورد جواب است.»

اما... عدم قطعیتی که در نظریه احتمال رخ می‌دهد، ناشی از عدم قطیعت آماری است و به پیشامدهای تصادفی ارتباط پیدا می‌کند.

مثلاً فکر کنید که اولین نفری هستید که می‌خواهید آزمایش پرتاب سکه را انجام بدهید. برای شما بدیهی است که نتیجه کار یا شیر است یا خط و با انجام آزمایش به دفعات بسیار زیاد، متوجه می‌شوید که احتمال هر دو طرف یکسان و ۵۰٪ است.
(اگر بخواهیم دقیق‌تر صحبت کنم باید بگویم که بعد از انجام آزمایش در دفعات بسیار زیاد، به عدد
۲/۱ نزدیک می‌شویم! و در ضمن این آزمایش مربوط به یک پخش خاص است و قطعا خودتان می‌توانید در پخش پواسون یا پخش گاما و ... موارد را مشابهاً پیش‌بینی کنید)

و اما... عدم قطعیتی که در نظریه مجموعه‌های فازی رخ می‌دهد، ناشی از عدم قطعیت در قضاوت‌های انسانی است.

یعنی اینجا دیگر برای ما بدیهی نیست که جواب نهایی ما شیر است یا خط و جواب ما به جای تغییر بین دو مقدار ۰ و ۱ (مثلاً شیر یا خط) در یک بازه به گستردگی [۱و۰] تغییر می‌کند و می‌تواند تمام مقادیر موجود در این بازه بسته را بگیرد.

مثلاً:

یک تپه شن را در نظر بگیرید. به آن یک «کپه شن» می‌گوییم. یک دانه از آن را برمی‌داریم و در گوشه‌ای می‌گذاریم. به آن یک دانه هیچ‌کس «کپه شن» نمی‌گوید... سپس دانه دیگری برمی‌داریم و کنار قبلی می‌گذاریم. باز هم این دو دانه را کسی «کپه شن» خطاب نمی‌کند... این کار را ادامه می دهیم...
وقتی کار تمام می‌شود اگر به حاصل کار نگاه کنیم کپه شن قبلی از بین رفته و در طرف دیگر یک «کپه شن» پدید آمده است اما هیچ‌کس نمی‌تواند بگوید که با برداشتن کدام دانه و قرار دادن آن در محل جدید، کپه شن قبلی از رسمیت افتاد و کپه شن جدید به رسمیت شناخته شد و نام «کپه» به آن اطلاق شد!!

نظریه مجموعه‌های فازی به دلیل تقریب بسیار خوبی که از پدیده‌های طبیعی اطراف ما ارائه می‌کند روزبروز کاربردهای وسیع‌تری می‌یابد...
وقتی پرفسور لطفی عسگرزاده این نظریه را در آمریکا ارائه کرد ماه‌ها طول کشید تا طرفداران نظریه فازی دولت را متقاعد به استفاده از آن کردند، در حالیکه در همان زمان ژاپنی‌ها با بکارگیری این نظریه در صنعت، درآمد بسیار عظیمی را از صادرات محصولات فازی خود بدست آوردند.
بقول یکی از اساتید، ژاپنی‌ها اگرچه ممکنست خلاقیت بالایی در ابداع نظریات جدید نداشته باشند اما سیمیولاتورهای خوبی هستند و فوری یک نظریه را به کاربرد آن نزدیک می‌کنند و از آن بهره و منفعت مادی می‌برند...
یکی از دوستان کارشناسی ارشد مهندسی صنایع دانشگاه شریف می‌گفتند: الان از بچه‌های مهندس ایرانی که برای ادامه تحصیل به خارج می‌روند تقریباً این انتظار دارد همه‌گیر می‌شود که در زمینه نظریه فازی تحقیق کنند و یا لااقل از نظریه فازی چیزی بدانند (بدلیل ارائه این نظریه توسط یک ایرانی)

در مورد تابع عضويت و درجه عضویت

 

من برای آنکه با خيال آسوده‌تری بتوانم مطالب فازی را دنبال کنم، تصميم گرفتم تا بطور تقريباً جامع به اين مفاهیم اوليه بپردازم تا همه در مورد آنها دیدگاه مشترک و يکسان داشته باشيم. سپس «احتمال فازی» را دنبال خواهیم کرد...

الف) از نگاه تابع مشخصه :

وقتی ما با یک مجموعه معمولی سر و کار داریم مثلاً مجموعه‌ی {A={1,2,3,4,5 (که زير مجموعه‌ای از اعداد طبيعی است) برای این مجموعه می‌توانیم یک تابع X به اسم تابع نشانگر یا تابع مشخصه (charactristic function) در نظر بگیریم که به اینصورت تعریف می شود:

اگر a عضو Aباشد                    آنگاه     X(a) =1
اگر 
a عضو Aنباشد                    آنگاه     0X(a) =

این تابع عدد دلخواه a را می‌گیرد. حالا اگر این عدد عضو مجموعه‌ی A بود به آن عدد ۱ را نسبت می‌دهد و اگر عضو مجموعه A نبود، عدد ۰ را... مثلاً برای مجموعه‌ی A که در بالا ذکر کردیم:

X(9)=0                         ولی                      X(2)=1

بدیهی است که یک مجموعه را می‌شود با کمک تابع مشخه‌اش کاملاً معلوم کرد. یعنی اگر من به شما بگویم که مجموعه‌ای دارم که تابع نشانگر آن برای اعداد ۱ و ۶ و ۹ و ۱۳ برابر ۱ است و برای سایر اعداد برابر ۰ است، شما سریعاً متوجه می‌شوید که منظور من مجموعه‌ای است با اعضای ۱ و ۶ و ۹ و ۱۳  بصورت روبرو :‌                 {A={1,6,9,13

حالا تفاوتی که یک مجموعه فازی با مجموعه معمولی دارد اینست که به جای اینکه تابع نشانگر ما اعدادی را که می‌گیرد فقط به دو عدد صفر و یک نسبت دهد، آنها را به تمام اعداد حقیقی‌ای که در بازه [۱و۰] قرار دارند می‌تواند نسبت دهد.

مثلاً می‌تواند یک عضو دلخواه را به ¾ نسبت دهد یا به ½ یا به ⅜ و غیره... یعنی دیگر اینجا محدود به دو عدد ۰ و ۱ نیستیم. بلکه دستمان بازتر شده و می‌توانیم آن عدد دلخواه را به هریک از اعداد حقیقی که از ۰ تا ۱ هستند نسبت دهیم.
در این حالت مجموعه
A را یک مجموعه فازی می‌نامند.

ب) از نگاه ویژگی‌های مجموعه

از سال اول دبیرستان برای مجموعه‌های معمولی خواندیم که مجموعه گردآیه‌ای از اشیاء مشخص و متمایز است که همه دارای یک صفت معین هستند. در واقع بدلیل آنکه همه‌ی آن اشیاء دارای آن خاصیت و صفت بوده‌اند آنها را در آن مجموعه قرار داده‌ایم. و در ضمن برای هر شی دلخواه هم می‌توانیم با قطعیت بگوییم که آیا به مجموعه ما تعلق دارد یا خیر؟ (یعنی بررسی می‌کنیم که آیا آن صفت مشترک در اعضای مجموعه که به خاطر آن این اعضا گردهم آمده‌اند را دارد یا نه؟ اگر داشت که در مجموعه هست و اگر نه که نیست. )

مثلاً مجموعه E مجموعه اعداد زوج باشد. برای هر عدد می‌شود بررسی کرد که آیا زوج است یا خیر و بعد با قطعیت گفت که پس آیا در E می‌تواند باشد یا نه؟

اما در مجموعه فازی صفت مورد نظر ما که اعضای مجموعه را گرد هم می‌آورد دیگر مثل قبل، حالت مشخص و معین ندارد. بلکه یک واژه توصیفی است. مثلاً «کوچک بودن»، «بزرگ بودن»، «سرد بودن» و ... این واژه‌ها : 
اولاً :‌ نزد همه دارای تعریف مشخص نیست. مثلاً اگر به یک نفر بگویم عدد زوج می‌تواند بفهمد که عدد
۳ زوج نیست. اما اگر بگوییم «بزرگ‌تر بودن» برایش واضح نیست و از ما می‌پرسد: نسبت به چی بزرگ‌تر است؟
ثانیاً: اگر در بین یکسری از اشیائی که در اختیار داریم مثلاً بخواهیم صفت سرد بودن را در نظر بگیریم. هرچه آن شی دلخواه سردتر باشد عدد بزرگتری (از مجموعه
۰ تا ۱) را به آن نسبت می‌دهیم و هرچه گرمتر باشد، عدد کوچکتری را...

این عدد نسبت داده شده را درجه عضویت آن شی در آن مجموعه می‌نامند. پس یعنی هرچه یک شی درجه عضویتش به ۱ نزدیک‌تر باشد سردتر است و هرچه درجه عضویتش به ۰نزدیک‌تر باشد گرمتر است.
تابعی که هر عضو را به درج عضویتش می‌برد و در واقع به هر عضو، وابسته به میزان دارا بودن آن صفت مورد نظر، درجه‌ای (عددی از
۰ تا ۱) را نسبت می‌دهد تابع عضویت نام دارد. معمولاً تابع عضويت را با حرف μ نشان می‌دهند. مثلاً به اين صورت:    5/0 = (۳)μ

يک مثال مهم:

مثلاً مجموعه مرجع را به اينصورت در نظر بگيريد: {5و4و3و2و1M={ و فرض کنید که زیر مجموعه‌ای مانند B از M را با صفت «بزرگ بودن» می‌خواهیم تشکیل بدهیم.

همانطور که قبلاً گفتیم می‌شود یک مجموعه را با تابع مشخصه‌اش کاملاً معلوم کرد. اینجا هم می‌توانیم از «درجه عضویت» کمک بگیریم و اعضای مجموعه B را با کمک میزان عضویت هر یک از اعداد ۱ و ۲ و ۳ و ۴ و ۵ در این مجموعه مشخص کنیم. (یعنی معلوم کنیم که هر عدد تا چه اندازه دارای صفت بزرگ بودن بوده و تا چه حد متعلق به B خواهد بود)

برای اینکار می‌شود درجه عضویت هر عضو را بصورت زیر تعریف کرد:

۰ = (۱)μ
25/0 = (۲)μ
5/0 = (۳)μ
75/0 = (۴)μ
۱ = (۵)μ

ذکر این نکته ضروریست که در مورد درجه‌های عضویت گفته شده، این اعداد منحصر به فرد نبوده و بر حسب نوع کاربردی که در نظر داریم تعریف می‌شود (که بحث‌اش مفصل است!) اما مثلاً اینجا می‌توانستیم به عدد ۲ درجه 3/0 و به عدد ۳ درجه 4/0 و ... را نسبت دهیم.
ضمناً این اعداد نشان می‌دهند که در مجموعه یاد شده، عدد
۵ دارای بیشترین مقدار بزرگی بوده و عدد ۱ دارای کمترین مقدار بزرگی است.

اکنون تابع عضویت ضابطه‌ای است که هر عضو را به درجه‌اش نسبت می‌دهد. یعنی به جای آنکه برای تک‌تک اعضا بیاییم درجه عضویت را مشخص کنیم، یک ضابطه‌ای را بنویسیم که هر عضو با قرار گرفتن در آن به درجه عضویتش نسبت داده شود. برای مثال بالا ضابطه این تابع اینگونه است:

μ = ( x - 1 ) / 4

نحوه مشخص کردن یک مجموعه فازی:

از آنجایی که اعضای یک مجموعه فازی، همه با یک نسبت عضو این مجموعه نیستند لازمست تا در هنگام مشخص کردن این مجموعه، به درجه عضویت اعضا نیز توجه شود. بنابراین یک مجموعه فازی را بدین صورت مشخص می‌کنند:

B = { ( x , μ(x) ) ;  x  M }

یعنی بصورت زوج مرتب‌هایی که مولفه اول آن عضو مربوطه و مولفه دوم آن درجه عضویت آن عضو می‌باشد.

به عنوان مثال مجموعه B چنین خواهد بود:

B = { ( 1 , 0 )  ,  ( 2 , 0.25 )  ,  ( 3 ,  0.5 )  ,  ( 4 , 0.75 )  ,  ( 5 , 1 ) }

مقدمه ای در مورد آمار فضایی

استقلال و يکسانی – مدل داده های توزيع شده:

تکنيک هاي آماري استاندارد به کار برده مي شوند تا يک مدل آماري را بسازند و پارامترهاي مدل را برآورد کنند. به عنوان مثال Heyl and Cook در ۱۹۳۶آزمايشات انجام شده بين مي ۱۹۳۴ و ژولاي ۱۹۳۵ را براي تعيين شتاب جاذبه زمين در يک آزمايشگاه از واشنگتن توصيف کرده اند. روش استفاده شده، استفاده از آونگ متحرک بوده و ترکيب هاي متفاوت قطر لوله آونگ و نوع لبه تيغه آن، بکار گرفته شده بود. يک ترکيب خاص که بعد از مي و قبل از ژوئن 1934 بدست آمده ( بعد از تعديلات مناسب براي خميدگي و سرعت ساعت) بصورت زير می باشد:

76،82،83،54،35،46،87،68

اين که اين داده ها را می توان به عنوان رويدادی از يک نمونه تصادفي مدل بندي کرد احتمالاً يک فرض روشن و بي عيب است. اما آزمايش بعدي انجام شده تحت يک ترکيب و شکل متفاوت، انحرافات را به ما مي دهد. ( بعد از تعديلات مناسب به دست آمده است)

76،76،78،79،72،68،75،78

دوباره اين ها مي توانند به عنوان يک نمونه تصادفي مدل بندي شوند. اما براي اينکه هر آزمايش سعي بر آن دارد که ثابت فيزيکي مشابه را اندازه بگيرد، داده ها بطور واضح بايد به چندين روش ترکيب شوند.

سوالی که مطرح می شود اين است که آيا عيبی ندارد که ۱۶ عدد قبلي را به عنوان مشاهدات يک نمونه تصادفي مدل بندي کنيم؟

مدل داده هاي ناهمگن:

عدم همگني در داده ها معمولاً در مدل هاي آماري با فرض داشتن ميانگين غيرثابت محاسبه مي شود، معمولاً ميانگين ، يک ترکيب خطي از چندين متغير توصيفي مي باشد. با اين وجود، حتي بعد از اين که تغييرات با مقياس محاسبه مي شوند دلايلی براي مظنون شدن به تغييرات کوچک ناممکن وجود دارد.

Cressie در ۱۹۸۲ فرض مي کند که داده هاي آزمايش فقط  تحقق های مستقل از توزيع هاي آماري که ميانگين هايشان ثابت ولي واريانس هايشان بطور محسوس متفاوت هستند، توصيف می کنند. تئوري يک نمونه استاندارد کاربرد زيادي ندارد. اما هنوز ساختن يک فاصله اطمينان براي ميانگين بر پايه آماره t وزني امکان پذير است.

فرض استقلال يک راه روشنتر براي تعميم مدل هاي آماري مي باشد. اما آيا مدل هاي کليتری براي هر مقدار علمي وجود دارد؟  اميدوارم که خواننده را متقاعد سازم که به اين سوال بطور قاطع پاسخ بلي دهد.

مدل داده هاي وابسته:

استقلال يک فرض خيلي راحت و مناسب است که بسياري از تئوري هاي آماري- رياضي را قابل فهم   مي کند. با اين وجود مدل هايی که وابستگی آماری را شامل می شوند اغلب واقعی تر هستند. دو دسته از مدل هايي که به طور مشترک مورد استفاده قرار مي گيرند شامل ساختارهاي همبستگي درون گروهی و ساختارهاي همبستگي جزء به جزء مي باشند. اين ها ميدان کوچکي براي داده هاي فضايي پيشنهاد  مي کنند که وابستگي در همه جهات از خودشان نشان می دهند.

ما تا کنون قادر به گريز از جهان سه بعدي که در آن زندگي مي کنيم نبوده ايم. مفهوم اينکه داده ها در زمان يا فضا به يکديگر نزديک باشند که به معنای همبستگی است، يک امر طبيعي است و بطور موفقيت آميزی توسط آماردانان مورد استفاده قرار گرفته است و توانسته اند پديده هاي فيزيکي و اجتماعي را مدل بندي کنند. مدل هاي  زمانی يا مدل هاي سري هاي زماني، از جمله مدلهاي مشهوری هستند که تاکنون شناخته  شده اند و معمولاً بر اساس هم توزيع بودن مشاهدات که وابسته به يکديگر و با يک وقفه زماني يکسان رخ مي دهند استوار هستند.

مدل هاي فضايي اخيراً به ادبيات آمار اضافه شده است. زمين شناسي، علم خاک، فرآيندهاي تصويري، اپيدميولوژي( علم بيماري هاي همه گير)، علم کشاورزي، زيست شناسی، علم جنگل، نجوم، هواشناسي يا هر رشته اي که با داده هاي جمع آوري شده از موقعيت هاي فضايي متفاوت کار مي کنند، نياز به گسترش مدل هايی دارند که نشان دهنده وجود وابستگی بين اندازه ها در موقعيت های مختلف می باشند. با اين وجود مدل هايي نياز است که تغييرپذيري بيشتري نسبت به همتاهاي زماني اشان داشته باشند. براي اينکه در گذشته و حال و آينده هيچ قياس و شباهتي در فضا نداشته ايم و علاوه بر اين منطقي نيست که فرض کنيم که موقعيت هاي فضايي داده ها به طور منظم رخ مي دهد (مانند اکثر مدل هاي سري زماني).

وقتي با داده هاي مربوط به فضا يا زمان سروکار داريم که نوع  وابستگي هايشان مشابه است، دو روش مي توان در نظر گرفت. ساختارهايي که از نمونه هاي مستقل مي توانند مدل بندي شوند.

مجموعه هاي داده هاي زمان- مکان هواشناسي به منظور بررسي مطالعات اثرات آلودگي هوايي جمع آوري شده اند، مثلاً باران اسيدي . مجموعه داده هاي روزانه يک تعداد از سال ها در موقعيت هاي متفاوت مثلاً شمالي ترين منطقه آمريکا، يک مجموعه داده ها ي چگال را بدست مي دهد. اما بيشتر آنها وابسته به زمانند، به زبان فضايي: داده ها هنوز نسبتاً  تنک و پراکنده اند. با اين وجود پيش بيني فضايي از لحاظ اهميت مشابه پيش بيني زماني است.

داده های فضايی و مدلهای فضايی:

اولين ظهور آمار در زمينه داده هاي فضايي با ايجاد فرمي از ترسيم داده ها پديد آمد. به عنوان مثال، Halley در ۱۶۸۶ ، براي يك ترسيم از فرم بادهاي زميني و تلاش براي ايجاد يك علامت فيزيكي براي جهت مسير بادها و بادهاي موسمي در بين و نزديك مدار راس السرطان روي هم گذاري کرده است.

مدلهاي فضايي بعدها بوجود آمدند. به عنوان مثال، Student در ۱۹۰۷ ، توزيع همه ذرات يك مايع  را بررسی کرده است. به جاي تحليل در مورد موقعيت فضايي آنها، او تراكم داده ها را بصورت تعداد ذرات در هر واحد مساحت حساب كرد. يک hemocytometer ( وسيله اندازه گيري تعداد گلبول هاي خون) که ۱mm2 را به ۴۰۰ مربع تقسيم می کند، براي شمارش گلبول ها مورد استفاده قرار گرفت.Student متوجه شد که توزيع تعداد گلبول ها در هر مربع از توزيع پواسن پيروي مي کند.

فيشر از وابستگي فضايي در آزمايش هاي ميداني در کشاورزي کاملاً آگاه بود، چون او از مدت ها قبل بدنبال اصلاح آن بود. او در دهه ۱۹۲۰ و ۱۹۳۰ در ايستگاه آزمايشي Rothamsted در انگلستان، اصولي از تصادف،‌ بلوکي و تکرار را ايجاد کرد. به هر حال بايد قبول کرد که تصادفي کردن، همبستگي فضايي را در مقياس هاي بزرگتر يا کوچکتر از بعد نمودارها از بين نمي برد.

Fairfield Smith در ارتباط با انتخاب بعد نمودارها  بود که هر افزايشي در بعد نمودارها بايد حاصل اندک کاهش در واريانس باشد. اگرچه تحليل او تجربي بود، اما خيلي از فرمول هاي مسائل حضور همبستگي فضايي در آزمايش هاي ميداني را تصديق مي کردند.

روشهاي نزديکترين همسايگي براي تحليل آزمايش هاي ميداني در کشاورزي تلاش هايي را براي گرفتن وابستگي فضايي بطور غيرمستقيم در تخمين ها دنبال مي کند، که بوسيله استفاده از باقيمانده ها براي نمودارهاي همسايگي به عنوان متغير کمکي، يا بوسيله اختلافشان انجام مي گيرد.

مدل فضايي کلي:

آمار در همه زمينه هايش برای تحليل داده هاي اکتشافي در کنار توزيع مجانبی  قضيه برآوردگرهای پارامتر روي چندين مدل تصادفي تکيه مي کند. بايد مدلي براي داده هاي فضايي ارائه کنيم که ساختار ساده آن به اندازه کافي تغييرپذيري را براي بکار بردن يک گروه بسيار بزرگ از مسائل  داشته باشد.  داده ها بايد گسسته يا پيوسته باشند.

آنها بايد تراکم هاي فضايي يا مشاهدات نقاطي در فضا باشند،  مکان هاي فضايي آنها بايد منظم يا غير منظم باشند، و آن مکان ها بايد بر يک مجموعه گسسته يا زنجيره فضايي باشند. در موارد نادر مدل هاي تصادفي براي خلاصه اي از داده هاي موجود يا پيش بيني داده هاي مشاهده نشده استفاده مي شوند. مدل بايد  بيان کند که چرا يک حادثه خاص اتفاق افتاده است، و همچنين بايد براي بيشتر پذيره هاي معمول استفاده از کلمه "مدل" را تشخيص دهيم.


منبع: وبلاگ statblue1

کنترل کیفیت آماری

کاربرد نمودار پارتو

این مساله ازآنجا ناشی می شود که کتابهای درسی تدوین شده در رابطه با آمار کاربردی باتوجه به تعداد نسبتا زیاد آنها، کمتر به کاربرد علم آمار و مسائل عملی آن پرداخته اند. به طور مثال می توان به این نکته توجه کرد که در بیشتر کتابهای درسی تحت عنوان آمار کاربردی به نمودار پارتو که یکی از مهم ترین و کاربردی ترین نمودارهای آماری است و امروزه در فرآیندهای تولیدی و غیرتولیدی مورد استفاده قرار می گیرد اشاره نشده و یا تنها به معرفی کوتاهی از آن اکتفا شده است 


تاریخچه 

در سال 1897 ویلفرد پارتو ''اقتصاددان ایتالیای1848-1923 فرمولی ارائه کرد که نشان می داد توزیع درآمد ناهموار است . او درآمد فردی را روی محور افقی و جمعیت رابر روی محور عمودی نشان داد و دریافت که تعداد اندکی از مردم دارای درآمد زیاد و اکثرافراد جامعه دارای درآمد اندکی هستند، نمودار زیر بیانگر این فرمول است .
براساس اصلی که وی در اقتصاد اجتماعی بیان کرد، حدود 80 درصد نتایج از20درصد علل ناشی می شود. به عبارت دیگر اگرچه برای مسائل موجود، علل بسیار زیادی وجود دارد ولی تعداد کمی حائز اهمیت است . آن چه پارتو روی این نکته توجه کرد، که اگر شما یک ، دو یا سه عامل اصلی را درنظر بگیرید درباره اکثریت عاملها فکر کرده اید،بدین طریق نمودار پارتو در سا1897 به وجود آمد، یک تئوری مشابه به صورت نموداری توسط لورنز ''اقتصاددان آمریکایی '' در سال 1907 ارائه شد. هردو محقق اشاره داشتند که بیشترین سهم درآمد یا ثروت توسط افراد بسیار کمی از مردم نگهداری می شود، بعدها در زمینه کیفیت دکتر ژوزف جوران در سال1954 روش نموداری لورنز رابه عنوان فرمولی برای تقسیم بندی مسائل کیفی به مشکلات اساسی معدود و مشکلات جزیی بسیار به کار گرفت و این روش را تجزیه و تحلیل پارتو نامید.

کاربرد نمودار پارتو


نمودار پارتو یک نمودار میله ای است که علل مشکلات به وجود آمده را با فراوانی آن مقایسه می کند، در نمودار پارتو از زوایای مختلف می توان به یک مساله نگاه کرد و سپس به حل آن پرداخت از جمله :
کیفیت : نواقص ، عیوب ، خرابیها، شکایات ، موارد برگشتی و تعمیرات ;
هزینه : مقدار زیان ، گرانی ;
خرید وفروش :انبارداری ، اشکال در پرداخت ، تاخیر در تحویل ;
ایمنی : حوادث ، اشتباهات ، شکستگی در حمل و نقل ;
اپراتور: شیفت ، گروه ، سن ، تجربه و مهارت ، اشخاص ;
ماشین : ماشینها، تجهیزات ، ابزار، ساختار، مدل ، اسبابها;
مواد خام : سازنده ، طرح ، مقدار و نوع ;
روش ساخت : شرایط، دستورالعمل ، ترتیب و روشها.
چگونگی رسم نمودار پارتو:
برای رسم نمودار پارتو انجام مراحل زیر ضروری است :
مرحله اول : ابتدا مشخص کنید که کدام مسائل برای رسیدگی هستند و چطور اطلاعات وداده ها را باید جمع آوری کرد.
الف - تصمیم بگیرید کدام مسائل را می خواهید رسیدگی و برطرف کنید، مثال مواردنقص ، زیانهای پولی ، حوادث قابل اتفاق .
ب - مشخص کنید که چه داده هایی لازم است جمع آوری شود و چطور آنها را طبقه بندی کنید، مثال باتوجه به موارد نقص ، فرآیند کار، ماشین ، کارگر و روش ، موارد غیرمهم وجزیی را تحت عنوان سایر طبقه بندی کنید.
ج - روش جمع آوری داده هاو دوره زمانی جمع آوری آن را مشخص کنید.
مرحله دوم : یک برگه کنترل ''برگه ثبت اطلاعات '' مناسب طراحی کنید.
مرحله سوم : بعد از علامت گذاری و ثبت موارد مشاهده شده در برگه کنترل فراوانی آنها رابه دست آورید.
مرحله چهارم : یک جدول توزیع فراوانی شامل تمام موارد فهرست شده ، ستونهای فراوانی ، فراوانی تجمعی ، درصد فراوانی و درصد فراوانی تجمعی تهیه کنید.
مرحله پنجم : جدول توزیع فراوانی را برحسب تعداد به ترتیب غیرنزولی مرتب کنید. لازم به ذکر است که مورد سایر، یا غیرو را در آخرین سطر جدول قرار دهید. مورد فوق نبایدخیلی بزرگتر از سایر موارد باشد.
مرحله ششم : یک محور افقی و دو محور عمودی رسم کنید:
الف - محور افقی : این محور را به تعدادی فواصل یکسان شامل تمام موارد، تقسیم بندی کنید.
ب - محور عمودی سمت چپ : این محور را از صفر تا n ''جمع کل داده ها'' مدرج کنید.
ج - محور عمودی سمت راست : این محور را از صفر ت100 ''درصد کل '' مدرج کنید.
مرحله هفتم : یک نمودار ستونی رسم کنید.
مرحله هشتم : منحنی فراوانی تجمعی ، منحنی پارتو را رسم کنید، برای این کار ارزشهای تجمعی را در بالای سمت راست ستون مربوط به هر طبقه با نقطه ای مشخص کرده وسپس این نقاط را به یکدیگر وصل کنید.
مرحله نهم : تمام اطلاعات ضروری را روی نمودار ثبت کنید:
الف - اطلاعات مربوط به نمودار شامل عنوان ، واحد، نام رسم کننده نمودار، موارد بامعنی و...
ب - اطلاعات مربوط به داده ها شامل دوره زمانی ، محل جمع آوری داده ها، موضوع ،جمع کل داده ها و...