Элементы статистической обработки опытных данных

На практике при проведении научных исследований нередко приходится иметь дело со статистическим материалом весьма ограниченного объема. Это обычно связано с дороговизной; сложностью или временными затратами постановки каждого опыта. Результаты измерений опытных данных представляют собой случайные величины X из области определения переменной х. Различные части области для появления случайной величины не являются равновероятными, и поэтому для непрерывной величины X существует распределение вероятностей ее появления.

Для оценки этого распределения используют не вероятность наступления события X = х, а вероятность события X <х (рис. 11.4.1).

Геометрическая интерпретация функции распределения на числовой оси

Рис. 11.4.1. Геометрическая интерпретация функции распределения на числовой оси

Вероятность Р этого события зависит от положения х на числовой оси и таким образом является функцией от х, и называется функцией распределения случайной величины X

Согласно геометрической интерпретации функция распределения F(x) есть вероятность того, что случайная точка X в результате опыта

окажется левее точки х. Отсюда следуют основные свойства функции распределения:

  • 1. Вероятность попадания случайной величины на числовую ось не убывает с ростом х, т. е. F(x2)>F(xj) при x2>Xj, и F(+oo) = l.
  • 2. При х —> -оо вероятность попадания случайной величины на числовую будет стремиться к нулю, и F(-oo) = 0.

Функция распределения, приведенная на отрезке числовой оси (рис. 11.4.2), удовлетворяет свойствам 1 и 2.

Функция распределения случайной величины

Рис. 11.4.2. Функция распределения случайной величины

Пусть в результате измерения реакции цепи получена случайная величина Y, как правило, с неизвестной функцией распределения. При неизвестной функции распределения преимущество отдается нормальному закону распределения, так как это - предельный закон, к которому стремятся другие законы распределения случайной величины Y = {у/} при увеличении числа опытных данных. При этом задача обработки данных связана с определением двух параметров нормального закона распределения - математического ожидания т и дисперсии <т2.

Нормальный закон (закон Гаусса) распределения характеризуется функцией плотности вероятности

которая показывает, что вероятность появления значения у( в интервале у < yt < у + dy равна f(y)dy. Очевидно, что интегрирование f(y)dy

в области определения у дает функцию распределения случайной величины Г(у) - распределение вероятностей ее появления на числовой оси.

Графическая иллюстрация связи функции распределения случайной величины F(y) с функцией плотности вероятностей f(у)

Рис. 11.4.3. Графическая иллюстрация связи функции распределения случайной величины F(y) с функцией плотности вероятностей f(у),

т =40, (7=10

Случайная величина Y определена на отрезке [-20,100]. Вероятность события P(Y < У/) равна площади под кривой/(у), ограниченной справа ординатой fiyA, а вся площадь под кривой на отрезке [-20,100] равна единице. Графики показывают, что максимум функции плотности вероятности f(y) приходится на момент (у = = w = 40),

когда скорость изменения F(_y) - «накопления» вероятности выпадения случайной величины Y наибольшая.

Физическая интерпретация может быть найдена в различных областях. В механике плотность распределения непрерывной случайной величины - плотность вероятности f(y) можно трактовать как плотность распределения масс по оси абсцисс - линейную плотность. Функция Р(у) сводится к распределению единичной массы непрерывно по оси, каждая точка которой не имеет конечной массы.

В некоторой мере в электронике аналогом функции плотности вероятности является функция спектральной плотности амплитуд, к примеру одиночного прямоугольного импульса, имеющего непрерывный (сплошной) спектр бесконечно малых амплитуд (п. 7.2). В силу непрерывности этих функций одна указывает плотность бесконечно малых вероятностей на бесконечно малом интервале изменении случайной величины, другая - плотность спектральных составляющих бесконечно малых амплитуд на бесконечно малом интервале изменения частоты. Первая оценивает вероятность попадания случайной величины в заданный конечный интервал ее значений. Вторая дает оценку, например, полосы частот, значимых для передачи энергии в импульсе, сохранения его формы или выполнения операции его дифференцирования.

В нормальном законе распределения случайной величины функции F(^) и f{y) равнозначно определяют его содержание. Функция плотности вероятности является производной от функции распределения случайной величины Y, принимающей значения ух, у2,..., уп,... в интервале ее возможных значений от -оо до -юо. Следовательно, сама функция распределения случайной величины Y определяется интегралом

Она определяет вероятность Р того, что наблюдаемое значение у{ будет меньше у. Вероятностные функции имеют следующие свойства:

  • 1. f(y)z0.
  • 2. F(oo) = 1. Вероятность того, что случайная величина окажется в интервале {-оо, +оо|, равна единице.
  • 3. Вероятность попадания случайной величины Y на участок от у до у + Ау, равна приращению функции распределения на этом участке.

4. Среднее значение - математическое ожидание, которое определяет локализацию функции /(у), находится из выражения

а дисперсия а2, являющаяся мерой разброса вокруг среднего значения, определяется по формуле

Поскольку по определению функция плотности вероятности есть производная от функции распределения, то последняя будет выражена интегралом

Интеграл не выражается через элементарные функции. После замены переменной (у>-т)/а = г он приводится к интегралу

который не выражается элементарными функциями. Его вычисляют через специальную функцию, определяемую так называемым интегралом вероятности

для вычисления которого составлены таблицы. Отметим, что для т. н. стандартной функции распределения случайной величины (11.4.8) с параметрами т = 0 и с = 1. Р = F(m +jo)-F{m-jo)= 0,683; 0,955; 0,997 соответственно для j = 1, 2, 3, т. е. вероятность отклонения случайной величины от среднего значения за границы За равна 0,003.

Стандартное нормальное распределение

Рис. 11.4.4. Стандартное нормальное распределение

Согласно свойству (3), вероятность попадания случайной величины Y на участок от а до Ь, равна приращению функции распределения на этом участке.

Выразим функцию распределения (11.4.7) величины 7 с параметрами т и а через нормальную функцию распределения Ф (у)

и найдем вероятность попадания случайной величины 7 на участок от а до b

Таким образом, мы выразили вероятность попадания в заданный интервал случайной величины 7, распределенной по нормальному закону с любыми параметрами т и а через стандартную функцию распределения Ф(у), которая соответствует нормальному закону с параметрами т = 0, <т = 1. Аргументы функции есть расстояния до центра рассеяния т от правой границы интервала b и левой границы а. Как любая функция распределения она имеет свойства:

  • 1. Ф (у) - неубывающая функция.
  • 2. ф(-оо) = 0.
  • 3. Ф(+оо) = 1.
  • 4. Из симметрии нормального распределения с параметрами т-0, а = 1 относительно начала координат следует, что

Доверительный интервал и доверительная вероятность

Постановка задачи. Производится измерение, например, АЧХ электронной цепи в N точках по оси частот. Получаем набор случайных величин 7,, 72,..., 7дг. При повторных измерениях в п независимых опытах каждая из этих величин 7, в свою очередь, будет представлена набором случайных величин ух, у2,..., уп. В частности, подобная задача возникает также при статистическом анализе работоспособности математической модели электронного устройства на ЭВМ методом Монте- Карло. Анализ необходим в силу того, что в процессе производства изделия компоненты его составляющие имеют технологический разброс от номинальных значений величин их параметров, которые были приняты за основу при синтезе и расчете характеристик изделия. В процессе анализа величины параметров компонентов меняются в каждом очередном тесте случайным образом согласно функции их распределения в пределах технологического допуска, указанного в спецификации на компоненты изделия.

Решение задачи заключается в получении статистической оценки работоспособности изделия по основным характеристикам, указанным в техническом задании, по результатам многократной прогонки его модели на ЭВМ. При этом должны быть найдены оценки для математического ожидания т и дисперсии а заданной характеристики, например, значения АЧХ на частоте ее среза. С увеличением числа прогонок эти оценки приближаются к их теоретическим значениям для заданной функции распределения случайных величин. Поэтому, как и для любых других опытов, необходимо определить минимально необходимое число прогонок (опытов) п с тем, чтобы с заданной вероятностью оценка некоторого параметра, например математического ожидания, уложилась в доверительный интервал.

Если даны значения у2,..., у„, принятые в п независимых опытах случайной величиной Y с неизвестным математическим ожиданием и дисперсией, то для определения этих параметров следует пользоваться приближенными значениями (оценками).

В качестве оценки для математического ожидания принимается среднее арифметическое наблюденных значений в п опытах

Для оценки дисперсии принимается выражение

Очевидно, что эти оценки параметров нормального распределения будут сами являться случайными величинами.

Рассмотрим задачу о доверительном интервале для оценки т, взятой в качестве исследуемой случайной величины с соответствующей ей дисперсией. Требуется знать, к каким ошибкам может привести замена значения т на его оценку т при ограниченном числе опытов. Будем исходить из того, что величина т распределена по нормальному закону. Согласно закону больших чисел и предельным теоремам теории вероятностей среднее значение с увеличением числа опытов т —> т,

Я—>00

а среднее квадратичное отклонение оценки т будет jD / п —» а —> 0.

П—>00

Для установления ошибки назначим достаточно большую вероятность Р>0,9, такую, что событие с вероятностью Р можно считать практически достоверным, и найдем такое значение е, для которого

Тогда диапазон практически возможных значений ошибки, возникающей при замене т на т, будет +е; большие по абсолютной величине ошибки будут появляться только с малой вероятностью а = 1 -13. Величина (1 — ос) называется доверительным уровнем.

Перепишем (11.3.15) в виде

Равенство (11.4.16) означает, что с вероятностью Р неизвестное значение параметра т попадет в интервал

Случайный интервал (11.4.17) как бы накрывает неслучайную точку т и называется доверительным интервалом.

В предположении, что величина D известна, с учетом определения интеграла вероятности (11.4.8), его свойства (11.4.12) и формулы вычисления вероятности (11.4.11), левая часть уравнений (11.4.15), (11.4.16) может быть записана через нормальную функцию распределения

где & = Jd/h - среднее квадратичное отклонение оценки т.

Таким образом, уравнение (11.3.16) запишется соотношением

из которого определяется е.

где argO(x) - функция, обратная Ф(х), дает значение, при котором нормальная функция распределения равна х. В данном случае х = т.

Таким образом, приближенно (т. к. вместо а взята ее оценка д) решена задача построения доверительного интервала (11.4.17). Чтобы при вычислении его границ +е не выполнять обратного интерполирования в таблицах для Ф(х), имеется таблица, фрагмент которой приведен (табл. 11.4.2), где приводится значение величины ^ = arg Ф (1 -I- р)/2 в зависимости от вероятности р. Тогда через величину /р формула (11.4.18) запишется в виде

и соответственно этому доверительный интервал (11.4.17) определится соотношением

Пример 11.4.1. Произведем статистический анализ работоспособности математической модели ФНЧ 3-го порядка методом Монте-Карло в среде ППП PSpice (п. 10.7).

ФНЧ с частотой среза 169 Гц

Рис. 11.4.5. ФНЧ с частотой среза 169 Гц

Величины параметров пассивных элементов схемы имеют технологический допуск 5 %. Усилители выполнены на ОУ со 100%-й отрицательной обратной связью, имеют стабильный единичный коэффициент передачи и поэтому исключены из статистического анализа.

Тестирование ФНЧ

Рис. 11.4.6. Тестирование ФНЧ: а - 20; 6-80 прогонок с допуском 5 %

Выполнено 20 прогонок, в каждой из которых величины параметров компонентов схемы случайным образом распределялись по нормальному закону в пределах задаваемых технологических допусков.

Требуется найти оценку т для математического ожидания величины Y = {>’/}, полученной в п опытах, табл. 11.4.1, и построить доверите льный интервал, соответствующий доверительной вероятности (3 = 0,9.

В качестве случайной величины Y взяты значения АЧХ на частоте среза /с = 159 Гц (табл. 11.4.1).

Решение. Имеем для п = 20.

При неограниченном увеличении числа прогонок полученная оценка среднего значения АЧХ на частоте среза будет приближаться к ее математическому ожиданию - значению АЧХ при номинальных параметрах, которое известно. Поэтому в формулах в качестве начала отсчета принимаем величину т- 0,707 согласно определению частоты среза фильтра.

Таблица 11.4.1

i

У1

i

Я

i

Я

/

Т/

*

У,

1

0,704

5

0,735

9

0,635

13

0,693

17

0,675

2

0,706

6

0,696

10

0,748

14

0,703

18

0,690

3

0,630

7

0,675

11

0,704

15

0,735

19

0,635

4

0,693

8

0,690

12

0,706

16

0,696

20

0,701

Найдем оценку дисперсии D относительно этого числа

и среднее квадратичное отклонение а = ]f)/n = 7,759 • 10_3.

По заданной доверительной вероятности |3 = 0,9 (табл. 11.4.2) находим fp =1,643.

Таблица 11.4.2

Р

Ч

Р

ч

Р

Ч

Р

Ч

0,80

1,282

0,86

1,475

0,92

1,750

0,98

2,325

0,81

1,310

0,87

1513,

0,93

1,810

0,99

2,576

0,82

1,340

0,88

1,554

0,94

1,880

0,9973

3,000

0,83

1,371

0,89

1,597

0,95

1,960

0,999

3,290

0,84

1,404

0,90

1,643

0,96

2,053

0,85

1,439

0,91

1,694

0,97

2,109

По формуле (11.4.19) определяем значениев = а/р =0,013.

По формуле (11.4.20) находим доверительные границы:

  • • левая- та = т -е = 0,694;
  • • правая- ть = in + е = 0,720.

Таким образом, доверительный интервал по формуле (13.4.17)

Значения т, лежащие в этом интервале, являются совместимыми с опытными данными (табл. 11.4.1).

Другой стороной рассмотренной выше задачи является определение минимально необходимого числа тестов, достаточного для получения достоверных результатов при статистической обработке опытных данных, т. е. необходимо найти число п, достаточное для попадания среднего значения случайной величины с заданной доверительной вероятностью в установленный доверительный интервал.

В этом случае по формуле (11.4.13) определяется оценка среднего по выборкам значения in и по формуле (11.4.14) определяется оценка дисперсии D случайной величины. Согласно закону больших чисел и предельным теоремам теории вероятностей среднее значение с увеличением числа опытов in —и среднее квадратичное отклонение

Л—X»

оценки т: п —»С7—>0, (стр. 284). С учетом соотношения (11.4.15)

Л—>00

для достаточно больших п можно записать доверительный интервал в виде формулы

Обычно в инженерной практике используется 95%-й доверительный уровень (l-а), соответствующий ^ =1,96. (см. табл, для р = 0,95). В этом случае вероятность того, что выборочное и действительное средние значения отличаются не более чем на 1,96 g/у/п, равна 95 %.

Таким образом, отклонение уменьшается как l/yfn, и потребуется, например, в четыре раза большее число выборок для уменьшения отклонения вдвое.

Рассмотрим еще один пример применения статистической обработки для расчета многопараметрической чувствительности электронных схем. Формула (8.3.4)

для определения относительного изменения характеристики схемы F в наихудшем случае получена при условия, что все параметры элементов схемы имеют относительное изменение 8/г, = Д/г,//г,-, соответствующее заданному технологическому допуску t. Эта формула дает пессимистическую оценку работоспособности схемы. На самом деле наступление наихудшего случая - событие маловероятное. МЧНС получена (8.3.3) из условия максимума алгебраической суммы чувствительностей, взятых по модулю. Формула не учитывает случайный характер отклонения 8/г,-= Д/г,//г,- и его знак. Результаты статистических испытаний схемы (рис. 11.4.6) также свидетельствуют о малой вероятности наихудшего случая. С увеличением числа прогонок графики АЧХ все в большей степени концентрируются около АЧХ при номинальных параметрах схемы, а максимальный выброс становится все более редким событием.

Величина 5/г,- следует статистическому распределению, которое определяет вероятность появления конкретного значения 5/г,. Относительное изменение 5F также является случайной величиной. При условии независимости событий 5/г, распределение 8F можно аппроксимировать нормальным законом распределения с дисперсией

Полученная формула является аналогом формулы (8.3.2), полученной без учета случайного характера величин параметров.

Если допуски для всех элементов схемы одинаковы и вариации их параметров распределены по нормальному закону, то

Следовательно, статистическую многопараметрическую чувствительность можно определить формулой

которая позволяет давать более объективную оценку работоспособности схемы при анализе ее чувствительности.

Пример 11.4.2. Найдем статистическую многопараметрическую чувствительность (СМЧ) для примера 8.3.1, в котором была рассчитана МЧНС = 2. Допуск для всех элементов t = 0,1.

Рассчитаем по формуле (11.4.21) статистическую многопараметрическую чувствительность добротности Q при найденных Sf к отдельным элементам.

Для вероятности 0,95 при нормальном распределении разброса параметров получим:

Для приращения добротности цепи при заданной Q = 100 получим

Таким образом, в 95 % случаев величина добротности будет изменяться в интервале от 95 до 105, что значительно меньше интервала (80... 120), полученного в примере 8.3.1 для наихудшего случая.

Замечание. При малом числе параметров оценка a5F не вполне достаточна для использования нормального закона распределения. Тем не менее при вполне корректной оценке ст§А полученные результаты позволяют судить об эффективности применения статистики для приближения к более объективному результату.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >