Page 74 - МІНІСТЕРСТВО АГРАРНОЇ ПОЛІТИКИ УКРАЇНИ
P. 74
74
Лекція 5
МЕТОДИ ОБРОБЛЕННЯ ТА АНАЛІЗУ
ЕКСПЕРИМЕНТАЛЬНИХ ДАНИХ
5.1. Методика оброблення масиву даних
Дуже часто мають місце випадки, коли вибіркова сукупність даних містить
дані, значини яких сильно (на перший погляд) відрізняються від інших. У зв’язки
з цим деякі дослідники приймають суб’єктивне і необґрунтоване рішення щодо
видалення «сумнівних» даних із статистичного обробітку.
Водночас, бракувати ті чи інші дані можна лише за умови наявності прямих
доказів того, що вони є результатом грубої помилки при їх отриманні.
Одним із механізмів такого аналізу є загальновідомий критерій Ірвіна ().
Дійсну його значину ( ) знаходять із виразу:
д
= (X – X )/,
n-1
n
д
де Х – максимальна «сумнівна» значина масиву даних;
n
X – значина із масиву даних, найближча до максимальної;
n-1
– середнє квадратичне відхилення масиву даних.
Табличну значину критерію Ірвіна ( ) визначають наступним чином:
т
- для довірчої ймовірності 90%:
2
т 0,60 ,
N
де N - кількість даних вибірки (масиву);
- для довірчої ймовірності 95%:
2,5
т 0,75;
N
- для довірчої ймовірності 99%:
3
т 1,15 .
N
«Сумнівну» величину масиву Х вибраковують тільки тоді, коли виявиться,
n
що > . Аналогічно перевіряють і «сумнівну» найменшу величину масиву екс-
д
т
периментальних даних.
Наприклад, нехай нами отримано десять (N = 10) вимірів якого-небудь па-
раметру: 5; 6; 5; 7; 8; 6; 5; 6; 7; 12.
Сумнів викликає остання значина масиву ‒ «12». Найближчою до неї є п’ята
значина параметру ‒ «8». Звідси X = 12, а X = 8.
n-1
n
Розрахувавши для даного масиву середнє квадратичне відхилення σ, знахо-
димо, що λ 1,89. Разом з цим, для довірчої ймовірності 95% λ = 1,54. Оскільки в
т
д
цьому випадку λ > λ , то вимір масиву, значина якого дорівнює 12, є сумнівним і
т
д
його слід вибракувати.
Натомість, у аналогічному масиві даних 5; 6; 5; 7; 8; 6; 5; 6; 7; 10 вимір зі
значиною 10 не може бути вибракуваним, оскільки тут λ = 1,26 < λ = 1,54.
т
д