כיצד לחשב דיוק של נתונים

תוכן עניינים:

Anonim

דיוק הנתונים הוא אחד השיקולים החשובים ביותר בעת ביצוע ניתוח מדעי או סטטיסטי. האנלוגיה של לוח החץ, המופיעה בתפיסת הדיוק החשובה לא פחות, מדגימה את הקשר: נקודות נתונים מדויקות ממוצעות לתוצאות שוות, ואילו נקודות נתונים מדויקות מקובצות יחד, גם אם הן אינן קרובות תוצאות צפויות. לדברי Dartmouth קולג ', דיוק היא מדידה של reproducibility של קבוצה של תוצאות. דיוק במערכות נתונים הוא מושג חשוב גם במאמצים הקשורים לטכנולוגיה, כפי שמוצג על ידי קנת א 'פוטה דונלד ג' יי Huebner עם אוניברסיטת טקסס אוסטין בניתוח של מערכות מידע גיאוגרפי. חישוב הדיוק הוא תרגיל פשוט למדי, אם כי סובייקטיבי.

פריטים שתצטרך

  • ייצוג גרפי של קבוצת נתונים

  • מידע על היחידות הרלוונטיות לידי ביטוי בנתונים

  • טעות מינימלית מותרת של שגיאה בניסוי

לפתח ייצוג חזותי של נקודות נתונים כגון מגרש פיזור. ייצוג ויזואלי פשוט מאוד כרוך בתכנון הערכים המשתנים התלויים והעצמאיים עבור כל נקודת נתונים במערכת קואורדינטות קרטזית.

להעריך את הקיבוץ של נקודות נתונים ולחפש דפוסים. נתונים מדויקים מתבטאים באשכולות של נקודות נתונים, דבר המצביע על כך שמשתני קלט דומים תואמים משתני פלט דומים.

החל מידע על יחידות המדידה המשמשות לאיסוף הנתונים כדי לקבוע את המרווח הממוצע בין נקודות נתונים. מדידה פשוטה השליט ניתן להשתמש כדי לקבוע את המרחק בין נקודות על הגרף, ולאחר מכן להמיר באמצעות שרירותי, בקנה מידה נוח המתאים יחידות של מדידות המשמשים ליצירת נקודות נתונים. זה יאפשר דיוק נקודות נקודות ביחס זה לזה להיות מחושב על ידי לקיחת הממוצע של המרחקים.

השווה את השוליים המינימליים של שגיאה המותרת בניסוי ואת הדיוק הממוצע של נקודות הנתונים כדי לקבוע את הדיוק הכולל היחסי של הניסוי. סוגים שונים של ניסויים יהיו סובלנות שגיאות גדולה יותר או פחות: פרויקט הנדסי צפוי לדרוש דיוק ליחידות קטנות מאוד, בעוד ניסוי חברתי סביר להניח לסבול יותר שונות.

טיפים

  • נסו להעריך את סולם יחידת סביר לפני יצירת ייצוג גרפי של נקודות הנתונים. זה יהיה להקל על הערכת דיוק חזותית על מנת לזהות את כל התחומים של דיוק בולט במיוחד או חוסר דיוק.

    נקה דפוסי נתונים המתרחשים על ייצוג חזותי מעידים מאוד על דיוק ועל הדירות של ניסוי. המשך הניסויים צריך להוסיף נקודות נתונים נוספים באשכולות מדויקים קרוב לאלה שכבר קיימים.

אזהרה

אל תבלבל דיוק עם דיוק. אם מטרת הניסוי היא להשיג ערך פלט ממוצע של מתן לכל התשומות, וזה מושג על ידי ערכים ממוצעים בטווח שבין 12 ל -14, אין זה סביר שיהיה מדידה מדויקת, אם כי ייתכן שהיא מדויקת. מדידה מדויקת עלולה לגרום לכל נקודות הנתונים להתקבץ סביב 17, אשר יהיה מדויק, אבל מדויק ולכן צפוי.