Познакомимся с вычислением ошибки опыта, или, как ее часто называют, ошибки воспроизводимости.
Ошибки параллельных опытов
Каждый эксперимент содержит элемент неопределенности вследствие ограниченности экспериментального материала. Постановка повторных (или параллельных) опытов не дает полностью совпадающих результатов, потому что всегда существует ошибка опыта (ошибка воспроизводимости). Эту ошибку и нужно оценить по параллельным опытам. Для этого опыт воспроизводится по возможности в одинаковых условиях несколько раз и затем берется среднее арифметическое всех результатов. Среднее арифметическое равно сумме всех п отдельных результатов, деленной на количество параллельных опытов п
.
Отклонение результата любого опыта от среднего арифметического можно представить как разность где – результат отдельного опыта. Наличие отклонения свидетельствует об изменчивости, вариации значений повторных опытов. Для измерения этой изменчивости чаще всего используют дисперсию. Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения. Дисперсия обозначается s 2 и выражается формулой
.
где ( n – 1) – число степеней свободы, равное количеству опытов минус единица. Одна степень свободы использована для вычисления среднего.
Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратическим отклонением, стандартом или квадратичной ошибкой
Стандарт имеет размерность той величины, для которой он вычислен. Дисперсия и стандарт – это меры рассеяния, изменчивости. Чем больше дисперсия и стандарт, тем больше рассеяны значения параллельных опытов около среднего значения.
Ошибка опыта являемся суммарной величиной, результатом многих ошибок: ошибок измерений факторов, ошибок измерений параметра оптимизации и др. Каждую из этих ошибок можно, в свою очередь, разделить на составляющие.
Вопрос о классификации ошибок довольно сложный и вызывает много дискуссий. В качестве примера одной из возможных схем классификации мы приведем схему из книги Ю. В. Кельница «Теория ошибок измерений» (М., изд-во «Недра», 1967).
Все ошибки принято разделять на два класса: систематические и случайные.
Систематические ошибки порождаются причинами, действующими регулярно, в определенном направлении. Чаще всего эти ошибки можно изучить и определить количественно.
Систематические ошибки находят, калибруя измерительные приборы и сопоставляя опытные данные с изменяющимися внешними условиями (например, при градуировке термопары по реперным точкам, при сравнении с эталонным прибором).
Если систематические ошибки вызываются внешними условиями (переменной температуры, сырья и т. д.), следует компенсировать их влияние. Как это делать, будет показано ниже.
Случайными ошибками называются те, которые появляются нерегулярно, причины возникновения которых неизвестны и которые невозможно учесть заранее.
Систематические и случайные ошибки состоят из множества элементарных ошибок. Для того, чтобы исключать инструментальные ошибки, следует проверять приборы перед опытом, иногда в течение опыта и обязательно после опыта. Ошибки при проведении самого опыта возникают вследствие неравномерного нагрева реакционной среды, разного способа перемешивания и т.п. При повторении опытов такие ошибки могут вызвать большой разброс экспериментальных результатов.
Очень важно исключить из экспериментальных данных грубые ошибки, так называемый брак при повторных опытах. Для отброса ошибочных опытов существуют правила. Для определения брака используют, например, критерий Стьюдента
.
Дисперсия параметра оптимизации
Дисперсия всего эксперимента получается в результате усреднения дисперсий всех опытов. По терминологии, принятой в планировании эксперимента, речь идет о подсчете дисперсии параметра оптимизации или, что то же самое, дисперсии воспроизводимости эксперимента
При подсчете дисперсии параметра оптимизации квадрат разности между значением yq в каждом опыте и средним значением из n повторных наблюдений y нужно просуммировать по числу опытов в матрице N, а затем разделить на N ( n— 1):
,
Такой формулой можно пользоваться в случаях, когда число повторных опытов одинаково во всей матрице.
Дисперсию воспроизводимости проще всего рассчитывать, когда соблюдается равенство числа повторных опытов во всех экспериментальных точках. На практике весьма часто приходится сталкиваться со случаями, когда число повторных опытов различно. Это происходит вследствие отброса грубых наблюдений, неуверенности экспериментатора в правильности некоторых результатов (в таких случаях возникает желание еще и еще раз повторить опыт) и т.п.
Тогда при усреднении дисперсий приходится пользоваться средним взвешенным значением дисперсий, взятым с учетом числа степеней свободы
,
Число степеней свободы средней дисперсии принимается равным сумме чисел степеней свободы дисперсий, из которых она вычислена.
Случай с неравным числом наблюдений, который мы рассмотрели выше, связан с нарушением ортогональности матрицы. Поэтому здесь нельзя использовать расчетные формулы для коэффициентов, приведенные ранее. Этот вопрос будет рассмотрен ниже.
Экспериментатору не следует забывать о проверке однородности дисперсий, неоднородные дисперсии усреднять нельзя. Прежде чем пользоваться приведёнными выше формулами, нужно убедиться в однородности суммируемых дисперсий.
Проверка однородности дисперсий
Если полученное значение дисперсионного отношения больше приведенного в таблице для соответствующих степеней свободы и выбранного уровня значимости, это означает, что дисперсии значимо отличаются друг от друга, т. е. что они неоднородны.
Если сравниваемое количество дисперсий больше двух и одна дисперсия значительно превышает остальные, можно воспользоваться критерием Кохрена. Этот критерий пригоден для случаев, когда во всех точках имеется одинаковое число повторных опытов. При этом подсчитывается дисперсия в каждой горизонтальной строке матрицы
,
а затем из всех дисперсий находится наибольшая которая делится на сумму всех дисперсий. Критерий Кохрена – это отношение максимальной дисперсии к сумме всех дисперсий
.
Гипотеза об однородности дисперсий подтверждается, если экспериментальное значение критерия Кохрена не превышает табличного значения. Тогда можно усреднять дисперсии и пользоваться формулой
.
Если возникает предположение о наличии неоднородности дисперсий для случая, когда число повторных опытов неодинаково во всех точках, можно воспользоваться критерием Бартлета. По уже знакомой формуле подсчитывается дисперсия воспроизводимости
.
Далее находится величина
,
.
Здесь число степеней свободы равно N –1, где N – число сравниваемых дисперсий. При планировании эксперимента типа 2 k это число равно числу опытов в матрице.
Бартлет показал, что величина приближенно подчиняется – распределению с ( N –1) степенями свободы. Значимость критерия Бартлета проверяется обычным способом.
Критерий Бартлета базируется на нормальном распределении. Если имеются отклонения от нормального распределения, то проверка неоднородности дисперсий может привести к ошибочным результатам.
Рандомизация
Чтобы исключить влияние систематических ошибок, вызванных внешними условиями (переменой температуры, сырья, лаборанта и т. д.), рекомендуется случайная последовательность при постановке опытов, запланированных матрицей. Опыты необходимо рандомизировать во времени. Термин «рандомизация» происходит от английского слова random – случайный.
Разбиение матрицы типа 2 k на блоки
Если экспериментатор располагает сведениями о предстоящих изменениях внешней среды, сырья, аппаратуры и т. п., то целесообразно планировать эксперимент таким образом, чтобы эффект влияния внешних условий был смешан с определенным взаимодействием, которое не жалко потерять. Так, при наличии двух партий сырья матрицу 2 3 можно разбить на два блока таким образом, чтобы эффект сырья сказался на величине трехфакторного взаимодействия. Тогда все линейные коэффициенты и парные взаимодействия будут освобождены от влияния неоднородности сырья.
Кроме основных факторов, влияние которых на объект исследования изучается при проведении эксперимента, действуют случайные факторы. Неидеальные условия проведения опытов приводят к наличию двух групп погрешностей: систематических и случайных.
Случайные погрешности характеризуются тем, что их значение различно даже для измерений, выполненных в одинаковых условиях. К случайным погрешностям, например, можно отнести округление доли деления прибора экспериментатором, производящим измерение.
С целью учёта случайных погрешностей определяется ошибка воспроизводимости опытов, которая в зависимости от располагаемых экспериментатором ресурсов может быть оценена различными путями:
1. Путем постановки параллельных (дублирующих) опытов в одинаковых условиях nраз.
2. Неравномерным дублированием опытов в различных точках плана.
3. Проведением по одному опыту в каждой точке плана эксперимента и проведением опытов-дублей в центре плана при нулевых значениях всех факторов. При этом предполагается, что случайная погрешность проведения опытов и, соответственно, дисперсия определения величины yiодинакова во всём факторном пространстве.
Например, при равномерном дублировании опытов среднее значение замеряемого параметра равно
, (3.9)
где уi–значение параметра в i –том опыте,
n – число опытов параллельных опытов (дублей).
Дисперсия воспроизводимости случайной величины определяется выражением
, (3.10)
где – среднеквадратичное отклонение случайной величины .
Параллельные опыты должны быть проанализированы на наличие грубых ошибок. Для исключения ошибочных опытов используются специальные методы математической статистики. В первом приближении при параллельных испытаниях можно считать ошибочными результаты, выходящие за пределы двух среднеквадратических отклонений
. (3.11)
Если число экспериментальных точек в плане эксперимента равно N и в каждой проводится по n параллельных опытов, то дисперсия параметра определяется по формуле
. (3.12)
Такой поход к определению дисперсии воспроизводимости справедлив, если выполняется условие однородности дисперсий в каждой j–той точке плана эксперимента.Задача проверки однородности дисперсий относится к задачам статистической проверки гипотез. Общая схема решения таких задач состоит в следующем.
1. Выбирается критерий проверки гипотезы – функция случайных аргументов с известным законом распределения. Это могут быть критерии Фишера F, Кохрена Gили другие.
2. Выбирается уровень значимости критерия — вероятность того, чтобы принять верную гипотезу неверной. Обычно уровень значимости принимается 1%, 2% или 5% (=0,01; 0,02; 0,05).С увеличением величины растет вероятность ошибки. В технике часто принимается равным 0,05.
3. С помощью таблиц распределения критерия находится область допускаемых значений (предельное значение выбранного критерия).
4. По опытным данным вычисляется значение критерия и сравнивается с предельным значение выбранного критерия. Если найденное значение критерия, найденного по опытным данным меньше предельного, то гипотеза принимается, в противном случае гипотеза считается неверной.
Для проверки гипотезы об однородности двух дисперсий используется критерий Фишера F, который представляет собой отношение максимальной дисперсии к минимальной для соответствующих чисел степеней свободы и уровней значимости (см. приложение 2)
. (3.13)
Распределение критерия Фишера зависит от двух степеней свободы: – для n1параллельных опытов, в которых дисперсия оказалась максимальной, и – для n2параллельных опытов, в которых дисперсия оказалась минимальной.
При равномерном дублировании опытов (одинаковое число опытов в каждой точке плана эксперимента) однородность дисперсий проверяется с помощью критерия Кохрена G, который определяется как отношение максимальной дисперсии к сумме всех других дисперсий
. (3.14)
Дисперсии однородны, если расчётное значение критерия Кохрена Gp
не превышает табличное значения критерия Gт.Значения Gтприведены в табл. 3.1.
Построчная дисперсия для каждого эксперимента определяется по формуле:
(1)
(2)
Число степеней свободы – понятие, учитывающее в статистических ситуациях связи, ограничивающие свободу изменения случайных величин. Это число определяется как разность между числом выполненных опытов и числом констант (средних, коэффициентов и пр.), подсчитанных по результатам тех же опытов.
(3)
Результаты расчета построчной дисперсии
Номер опыта, u
Номер дубля, g
Удельная потеря массы, , г/см 2
Среднее арифметическое значение интенсивности изнашивания, , г/см 2
Построчная дисперсия,
регрессия дисперсия дублирование
Приведем пример расчета построчной дисперсии в первом опыте (u = 1):
После определения построчных дисперсий производят проверку воспроизводимости экспериментальных данных. Проверка выполняется в том случае, если имеет место дублирование опытов, что является обязательным правилом при проведении планированного эксперимента. На этой стадии проверяется гипотеза о постоянстве дисперсии шума с использованием критерия Кохрена. Проверка данной гипотезы позволяет судить об однородности или неоднородности ряда дисперсий. Если ряд дисперсий однороден, различные значения функции отклика (y) определяются с одинаковой точностью. Если ряд дисперсий неоднороден, различные значения функции отклика (y) определяются с разной точностью.
Процедура проверки статистических гипотез в общем случае формально предусматривает сравнение некоторого критерия, рассчитанного по экспериментальным данным, с его табличным значением при выбранном заранее уровне значимости a. Уровень значимости a определяет наибольшую вероятность отвергнуть правильную гипотезу, т. е. наибольшую вероятность предположения о том, что экспериментальный результат ошибочен. Например, если уровень значимости выбирают равным 0,05 (что, очень часто делается в технических задачах), то это означает, что допускается 5%-ная вероятность неверного решения и доверительная 95%-ная вероятность верного.
Если найденное по экспериментальным данным значение критерия попадает в область, соответствующую уровню значимости, то проверяемая гипотеза неверна и ее следует отвергнуть, совершив ошибку с вероятностью a. Если же экспериментальное значение критерия попадает в область, соответствующую вероятности (1-a), то проверяемую гипотезу принимают, совершив ошибку, связанную уже с альтернативной гипотезой.
Расчетное значение критерия Кохрена рассчитывается по формуле:
, (4)
Из табл. 4 находим максимальную построчную дисперсию и Тогда G pacч = 27,93/78,4 = 0,356.
Приняв значение уровня значимости a = 0,05, для числа степеней свободы fu = 2 и числа опытов N = 8 получим следующее табличное значение G-критерия: .
Если G pacч pacч > , ряд дисперсий неоднороден.
В рассматриваемом примере G pacч > , т.е. ряд дисперсий неоднороден. Обычно такая ситуация возникает, если среди анализируемых экспериментальных данных имеются грубые ошибки или промахи, связанные с ошибками, допущенными при проведении эксперимента. В таком случае эксперимент следует повторить, тщательно проанализировав его с методологической точки зрения и уделив особое внимание методике сбора и обработки экспериментальных данных. Если при тщательном анализе экспериментальных данных грубых ошибок и промахов не выявлено, неоднородность ряда дисперсий означает, что значения функции отклика (y) действительно определены с разной точностью, однако в каждом отдельном опыте уровень шумов (ошибок) не выходит за границы допустимых значений. Именно такой вывод справедлив для результатов измерений и расчетов, представленных в табл. 4. Во всех дублях значения функции отклика очень плотно группируются относительно средних значений .
10. Основная и альтернативная статистическая гипотеза.
11. Дисперсионный анализ. Методика проведения однофакторного дисперсионного анализа.
12. Дисперсионный анализ. Методика проведения двух-, многофакторного дисперсионного анализа.
13. Математическая модель эксперимента. Классификация математических моделей.
14. Алгоритм построения регрессионной модели.
15. Форма представления полинома регрессии.
16. Полный факторный эксперимент.
17. Построение регрессионной модели методом полного факторного эксперимента.
18. Оценка значимости коэффициентов регрессии и адекватности построенной модели.
19. Дробный факторный эксперимент. Разработка матрицы плана.
20. Построение регрессионной модели методом дробного факторного эксперимента.
21. Матрицы плана рационального планирования эксперимента различной сложности.
22. Методика построения комбинационного квадрата при варьировании факторов на 3-х и более уровнях.
23. Аппроксимация результатов эксперимента полиномиальной функциональной зависимостью
1. Основные понятия и определения, используемые при планировании экспериментов
Эксперимент – целенаправленное воздействие на объект исследования с целью получения достоверной информации.
План эксперимента – совокупность данных, определяющих число, условия и порядок реализации опытов.
Планированием эксперимента называется выбор плана эксперимента, удовлетворяющего поставленным требованиям.
Современные методы планирования эксперимента и обработки его результатов, разработанные на основе математической статистики и теории вероятностей, позволяют существенно сократить число необходимых для проведения опытов. Знание и использование этих методов делает работу экспериментатора целенаправленной и повышает надёжность получаемых им результатов.
Опыт – воспроизведение исследуемого явления в определённых условиях проведения эксперимента при возможности регистрации его результатов.
2. Эксперимент. Типы экспериментов
Эксперимент – целенаправленное воздействие на объект исследования с целью получения достоверной информации.
По цели проведения и форме представления полученных результатов различают качественные и количественные эксперименты. Качественный эксперимент устанавливает только сам факт существования какого-либо явления, но при этом не даёт никаких количественных характеристик объекта исследования.
Количественный эксперимент не только фиксирует факт существования того или иного явления, но и позволяет установить соотношения между количественными характеристиками явления и количественными характеристиками способов внешнего воздействия на объект исследования.
По способу проведения различают пассивные и активные эксперименты.
Пассивный эксперимент основан на регистрации входных и выходных параметров, характеризующих объект исследования, без вмешательства в эксперимент в процессе его проведения. Обработка экспериментальных данных осуществляется только после окончания эксперимента.
При использовании методов активного эксперимента математическое описание строится в виде совокупности статических и динамических выходных характеристик объекта, которые регистрируются при подаче на его входы специальных возмущающих воздействий по заранее спланированной программе.
По условиям проведения эксперименты делят на лабораторные и промышленные.
В лабораторном эксперименте меньше влияние случайных погрешностей, проще обеспечить запланированные условия проведения опытов, большая возможность варьировать входные переменные.
В промышленных условиях усложняются измерения и сбор информации, значительно большее влияние на объект исследования и средства измерений оказывают различного рода помехи, поэтому в промышленном эксперименте необходимо использовать специальные статистические методы обработки результатов
3. Этапы проведения экспериментальных исследований
В общем случае планирование и организация эксперимента включают в себя следующие последовательно выполняемые этапы:
* постановка задачи (определение цели эксперимента, выявление исходной ситуации, оценка допустимых затрат времени и средств, установление типа задачи);
* сбор априорной информации об исследуемом объекте (изучение литературы, опрос специалистов и т.п.);
* выбор способа решения и стратегии его реализации (установление типа модели, выявление возможных влияющих факторов, выявление параметров, выбор целевых функций);
* проверка выбранного способа решения задачи (предварительные эксперименты с целью проверки экспериментальной установки и методики, а также предварительной оценки качества модели);
* реализация выбранного способа решения задачи (уточнение типа экспериментальной установки, определение значения целевой функции и факторов, объемов выборки, кратности повторения опытов и т. д.; завершается этап проведением экспериментов);
* анализ и интерпретация результатов, их представление (получение оценок интересующих экспериментатора величин и определение степени достоверности этих оценок, выражение результатов анализа в терминах и понятиях той области науки или техники, в интересах которой был проведен эксперимент).
4. Требования к условиям проведения опытов.
Воспроизводимость – степень близости друг к другу независимых результатов измерений, полученных одним и тем же методом.
Сходимость – отображает близость друг к другу результатов измерений выполненных в одних и тех же условиях.
5. Функция отклика. Геометрическое представление функции отклика.
Отклик – результат воздействия на обьект одного или нескольких факторов.
Функция отклика – зависимость математического ожидания отклика от факторов: 𝑌𝑗=𝑓(𝑥1,𝑥2,…𝑥𝑛)
Геометрическое представление функции отклика называется поверхностью отклика. Если каждому фактору соответствует координатная ось, образованное пространство называется n-мерным факторным пространством.
Пространство, в котором строится поверхность отклика, называется факторным пространством.
Часть факторного пространства, в которой находятся точки, отвечающие условиям проведения опыта, называется областью планирования
6.Законы распределения. Выбор закона распределения.
Нормальный закон распределения.(Гаусса)
Распределение Фишера (F-распределение)
f ® ¥ распределение стремится к нормальному с параметрами (0,1)
Дисперсия. Расчет дисперсии воспроизводимости результатов эксперимента.
Дисперсия воспроизводимости случайной величины определяется выражением
Параллельные опыты должны быть проанализированы на наличие грубых ошибок. Для исключения ошибочных опытов используются специальные методы математической статистики. В первом приближении при параллельных испытаниях можно считать ошибочными результаты, выходящие за пределы двух среднеквадратических отклонений
.
Если число экспериментальных точек в плане эксперимента равно Nи в каждой проводится по n параллельных опытов, то дисперсия параметра определяется по формуле
.
Дата добавления: 2019-02-26 ; просмотров: 1209 ; Мы поможем в написании вашей работы!