כיצד לקבוע את סוג התפלגות ההסתברות לנתונים

תוכן עניינים:

Anonim

כאשר יש לך נתונים שנאספו על המערכת שלך או התהליך, השלב הבא הוא לקבוע איזה סוג של התפלגות הסתברות אחד יש. סוגי התפלגות ההסתברות הם: אחידות בדידים, ברנולי, בינומי, בינומי שלילי, פואסון, גיאומטרי, מדים מתמשכים, עקומת פעמון רגילה, מעריכי, גמא וביטא. צמצום אפילו כמה מתוך רשימה של אפשרויות עושה לקבוע איזה הוא הכי קרוב R ערך בריבועי הרבה יותר מהר.

פריטים שתצטרך

  • גרפים תוכנה

  • אמצעי חישוב הערך R squared (הניתוח המתאים ביותר)

חלק את הנתונים עבור ייצוג חזותי של סוג הנתונים.

אחד הצעדים הראשונים לקביעת מה שיש לחלוקת הנתונים - ולכן סוג המשוואה להשתמש בו כדי לדגמן את הנתונים - הוא לשלול מה זה לא יכול להיות. • אם יש פסגות במערך הנתונים, אין היא יכולה להיות חלוקה אחידה בדידים. • אם הנתונים כוללים יותר משיא אחד, הוא אינו Poisson או בינומי. • אם יש לו עקומה אחת, ללא פסגות משניות, ויש לו שיפוע איטי בכל צד, ייתכן שהוא פויסון או הפצה של גמא. אבל זה לא יכול להיות חלוקה אחידה בדידים. • אם הנתונים מופצים באופן שווה, וזה ללא נטיה לכיוון צד אחד, זה בטוח לשלול גמא או הפצה Weibull. • אם לפונקציה יש חלוקה שווה או פסגה באמצע תוצאות הגרפדים, היא אינה חלוקה גיאומטרית או חלוקה מעריכית. אם התופעה של גורם משתנה עם משתנה סביבתי, זה כנראה לא חלוקה Poisson.

לאחר שסוג ההתפלגות של ההסתברות צומצם, בצע ניתוח R של כל סוג אפשרי של התפלגות ההסתברות. אחד עם הערך הגבוה ביותר R שווה ערך סביר ביותר.

לחסל נקודת נתונים אחד outlier. ואז לחשב מחדש את R מרובע. אם סוג ההפצה ההסתברותי זהה לזה של ההתאמה הקרובה ביותר, אזי יש ביטחון רב כי מדובר בהפצת ההסתברות הנכונה לשימוש בקבוצת הנתונים.

טיפים

  • אם הנתונים מראה פסגות מרובות פיזור רחב, זה אפשרי כי שני תהליכים נפרדים קורה או המוצר להיות שנדגמו הוא מעורב. לשחזר את הנתונים ולאחר מכן לנתח מחדש.

אזהרה

אמת את המשוואות שנוצרו כנגד ערכות נתונים מאוחרות יותר כדי לוודא שהוא עדיין מדויק עבור קבוצת הנתונים. זה אפשרי כי גורמים סביבתיים תהליך להיסחף הפכו משוואות ומודלים הנוכחי שגוי.