Статистичний ряд, гістограма і порядок її побудови

Припустимо, що в результаті вимірювань параметрів досліджуваних об'єктів є статистична сукупність, що представляє собою безліч значень СВ Х, отримане в результаті вимірів (спостережень).

Побудова гістограми здійснюється в наступному порядку.

1. Весь діапазон вимірювань СВ () ділиться на інтервали і підраховується кількість значень. припадає на кожен -й інтервал. Це число ділиться на загальну кількість вимірювань (виробів) і визначається частота, що відповідає даному інтервалу.

Сума частот усіх розрядів очевидно повинна дорівнювати одиниці.

2. Будується таблиця 1.1. в якій наведено інтервали в порядку їх розташування уздовж осі абсцис і відповідні частоти. Ця таблиця називається статистичним рядом.

Статистичний ряд значень СВ

Тут -позначення i-го інтервалу; - його межі; k- число інтервалів.

При угрупованню спостережених значень СВ по інтервалах може виникнути ситуація, при якій значення потрапляє на межу інтервалу. У цьому випадку постає питання про те, до якого розряду віднести це значення. Рекомендується вважати дане значення належить в рівній мірі обом інтервалах і додавати до чисел того і іншого інтервалу по 0,5.

3. Визначення числа інтервалів.

Число інтервалів, на які слід групувати статистичний ряд, не повинно бути занадто великим, оскільки в цьому випадку ряд розподілу стає невиразним, і частоти в ньому виявляють незакономірні коливання. З іншого боку воно не повинно бути занадто малим, так як при малому числі інтервалів властивості розподілу описуються статистичним рядом занадто грубо.

Практика показує, що в більшості випадків раціонально вибирати число інтервалів в межах 10¸20. Чим більше і однорідніше статистичний матеріал, тим більшу кількість інтервалів можна вибирати при складанні статистичного ряду.

Ці вирази отримані для найбільш часто зустрічаються на практиці розподілів з ексцесом, що знаходяться в межах від 1,8 до 6, тобто від рівномірного до розподілу Лапласа.

Довжини інтервалів можуть бути як однаковими, так і різними. Очевидно, що простіше їх брати однаковими. Однак, при оформленні даних про СВ, розподілених занадто нерівномірно, іноді буває зручно вибирати в області найбільшої щільності розподілу інтервали вужчі, ніж в області малої щільності.

4. Оформлення гістограми графічно.

Статистичний ряд оформляється графічно у вигляді так званої гістограми (рис.1.1). Вона будується в такий спосіб. По осі абсцис відкладаються інтервали, а на кожному з інтервалів як підставі будується прямокутник, площа якого дорівнює частоті даного інтервалу. Для побудови гістограми потрібно частоту кожного інтервалу розділити на його довжину і отримане число взяти в якості висоти прямокутника. У разі рівних по довжині інтервалів висоти прямокутників пропорційні відповідним частотам. З способу побудови гістограми випливає, що повна площа її дорівнює одиниці.

Очевидно, що при збільшенні числа дослідів можна вибирати все більш дрібні інтервали, і при цьому верх гістограми буде все більше наближатися до кривої, що обмежує площу, рівну одиниці. Ця крива є графіком функції щільності розподілу ймовірності f (x) (диференціальна функція розподілу для неперервних СВ).

5. Статистична функція розподілу.

Користуючись даними статистичного ряду, можна побудувати і статистичну (емпіричну) функцію розподілу СВ Х. Для цього з ряду беруться точки xi кордонів інтервалів і відповідні їм суми частот pi. припадають на прямокутники гістограми, що лежать лівіше цих точок. Ці частоти і їх суми позначають як F (xi). Тоді отримаємо систему виразів, що визначають точки статистичної функції розподілу. Поєднуючи їх ламаною лінією або плавною кривою, одержимо наближений графік статистичної функції розподілу (інтегральної функції розподілу для неперервних СВ) F (x) (рис.1.2).