Обработка результатов эксперимента

ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА в химии, заключается в применении методов мат. статистики для оценки значений разл. физ. величин (св-ва соед., параметры химико-технол. процессов и др.), характеризующих изучаемые объекты, и (или) зависимости этих величин от одного либо нсск. изменяемых внеш. условий (напр., т-ра, давление, тип катализатора). Обработка результатов эксперимента включает, как правило, также и определение точности данных, полученных при его проведении.

Результаты измерений обычно содержат случайные ошибки, поэтому статистич. оценки выполняют только при наличии серии измерений - т. наз. случайной выборки. Для оценки измеряемого значения к.-л. величины или исследуемой зависимости ее от внеш. условий по данным выборки рассчитывают т. наз. выборочные параметры, характеризующие статистич. распределение ошибок в проведенном эксперименте. Такое распределение, как правило, подчиняется т. наз. нормальному закону, конкретный вид к-рого определяют два параметра - выборочное среднее и выборочная дисперсия (см. ниже).

Точность получаемых оценок устанавливают с помощью статистич. критериев Стьюдента (t-критерий), Фишера (F-критерий) и т. д. При этом количеств, мерами служат т. наз. доверит. вероятность 3501-6.jpg и уровень значимости статистич. критерия р = 1 —3501-7.jpg. При заданных требованиях на точность результатов измерений доверит. вероятность (уровень значимости) определяет надежность полученной оценки.

Обработка результатов измерений значения физической величины. Проводится, если условия опыта не изменяются или их возможные изменения не учитываются. Такая обработка результатов состоит в оценке значения выборочного среднего (среднего арифметического) и определении ее точности. При этом различают обработку результатов прямых и косвенных измерений.

Прямые измерения. При таких измерениях числовое значение определяемой величины непосредственно считывается с показаний прибора (напр., весов). Если при повторных измерениях одной и той же величины а получаются неразличимые результаты х для принятой градуировки шкалы прибора, то в этом случае в качестве абс. погрешности измерений м. б. принята цена деления шкалы. Если же при п повторных измерениях регистрируются разл. отсчеты по шкале прибора, то их совокупность может рассматриваться как выборка случайных величин x t x2, ..., хп. В качестве наиб. вероятной оценки значения измеряемой величины в этом случае обычно полагают выборочное среднее

3501-8.jpg

к-рое принимают за приближенное значение а, т.е. 3501-9.jpg

Т.к. ошибки измерений случайны, полученная оценка результата 3501-10.jpgтакже случайна. Мерой ее погрешности служит т. наз. выборочный стандарт среднего

3501-11.jpg

где S2x - выборочная дисперсия, к-рая может вычисляться на основании той же выборки:

3501-12.jpg

Значение погрешности найденной оценки 3501-13.jpg определяется величиной т. наз. доверит. интервала3501-14.jpg, к-рый "накрывает" истинное значение а с заданной доверит. вероятностью, т. е.

3501-15.jpg

Величина доверит. интервала при достаточно больших объемах выборки (п3501-16.jpg30 — 50) зависит только от принимаемого значения 3501-17.jpg, напр.:

3501-18.jpg

При значениях п < 30, что наиб. характерно для эксперимента, существенна зависимость3501-19.jpg также и от числа опытов. В этом случае для вычисления 3501-20.jpg в качестве коэф. используют табл. значение t-критерия (см. табл. на форзаце в конце тома), соответствующее уровню значимости р = 1 —3501-21.jpg и числу степеней свободы выборочной дисперсии f = n— 1 :


3501-22.jpg

Если значения границ доверит. интервала 3501-23.jpg и 3501-24.jpg имеют разные знаки, оценка результата незначима, и с вероятностью3501-25.jpg можно полагать, что3501-26.jpg. Обычно принимают3501-27.jpg = 0,95, реже 0,99 и 0,999.

Пример 1. При взвешивании образца анализируемого в-ва получены след. результаты: 47,12; 47,08; 47,13 г. Оценить истинную массу образца и определить точность этой оценки для 3501-28.jpg= 0,95. В данном случае п = 3; р = 1 —3501-29.jpg = = 1 - 0,95 = 0,05; f= п - 1 = 3 - 1 = 2. По ф-лам (1)-(3) вычисляют выборочные среднее и дисперсию:

3501-30.jpg

Далее по таблицам распределения Стьюдента находят величину t(p,f) = = t(0,05; 2) = 4,30 и по ф-ле (6) рассчитывают величину доверит. интервала:

3501-31.jpg

Оценка массы образца по ф-ле (4) составляет 47,11 3501-32.jpg0,07 г. С увеличением числа измерений eb уменьшается. Так, если дополнить проведенные измерения результатами еще двух взвешиваний (47,09 и 47,13 г), то п = 5, f = п — I =5 — 1 = 4, и аналогично предыдущему определяют: 3501-33.jpg =47,11 г; S2x = 0,00055 г2; t(0,05; 4) = = 2,78; 3501-34.jpg= 0,03 г. Т.обр., точность оценки массы возрастает более чем в два раза; 47,11 3501-35.jpg0,03 г.

Косвенные измерения. Таким измерением наз. расчет величины у по результатам прямых измерений xl, x2, ..., xk неск. величин a1, a2, ..., ak. В общем случае вычислит, процедура определения у представляется в виде ф-ции k переменных:

3501-36.jpg

Тогда выборочное среднее находят подстановкой в расчетные ф-лы выборочных средних прямо измеренных величин:

3501-37.jpg

Выборочную дисперсию вычисляют по ф-ле:

3501-38.jpg

где 3501-39.jpg - частная производная ф-ции у по прямо измеренной величине Xi. При определении доверит. интервала для результата косвенного измерения общее число опытов nпринимается равным 3501-40.jpg, где ni,—число измерений xi ; число степеней свободы f=n — k.

Последовательность расчетов: 1) вычисляют выборочные средние и дисперсии прямо измеренных величин. 2) По ф-лам (8) и (9) находят выборочные среднее и дисперсию искомой величины. 3) По табл. распределения Стьюдента находят значение t-критерия и вычисляют доверит. интервал полученной оценки измерения.

Обработка результатов исследования зависимости физической величины от изменяющихся условий опытов (построение математической модели). Проводится с целью построения аналит. (в виде ур-ния) зависимости значения величины у, характеризующей изучаемый объект и наз. откликом, от одного либо ряда изменяющихся внеш. условий, или факторов, x1, x2,..., xk, к-рые образуют т. наз. факторное пространство.

Введем нек-рые понятия матричной алгебры, используемые при получении оценок зависимостей и определении их точности. Матрицей А называют нек-рую таблицу чисел; порядок, или размер, матрицы т x п определяют число ее строк т и число столбцов п. Элементы матрицы А обозначают через аij, где первый индекс указывает на его принадлежность к i-и строке, второй -j-му столбцу (для матрицы В-элементы bij , для матрицы D-dij. и т.д.). Матрицу, состоящую из одного столбца, называют вектором а, матрицу, содержащую одинаковое число строк и столбцов (при т — п),-квадратной матрицей. Элемент матрицы, у к-рого значения индексов равны (i=j), называют диагональным. Матрицу, все элементы к-рой, кроме диагональных, равны нулю, называют диагональной; если все ее диагональные элементы равны 1, матрицу называют единичной и обозначают через Е. Матрицу, у к-рой строки заменены столбцами, а столбцы-строками, называют транспонированной и обозначают через А'. Если А = А', такую матрицу называют симметричной. Сумма двух матриц А и В одинакового порядка т х n -матрица D = А + В того же порядка, для к-рой dij =aij + bij (i= 1, 2, ..., т; j = 1, 2, ..., п). Произведение матрицы U порядка m x s на матрицу V порядка s х n-матрица Q = UV порядка т х п, где

3501-41.jpg

Произведением матрицы U порядка т х s на вектор v порядка s служит вектор q = Ui, порядка т, где

3501-42.jpg

Обратной матрицей по отношению к данной матрице А называют такую матрицу А-1, произведением к-рой на исходную является единичная матрица АА-1 = A-1A = Е.

Далее в тексте вводятся матрицы Ф, N и С, а также векторы х, у, уp, и t, принятые в мат. статистике.

В зависимости от организации опытов принято различать пассивный и активный эксперименты. При проведении пассивного эксперимента для каждого измерения значения отклика yi (i= 1,2,..., n) регистрируется совокупность значений факторов xi = (x1i, x2i, ..., хki), представляющая собой точку в факторном пространстве с соответствующими значениями координат. Ценность пассивного эксперимента существенно зависит от того, насколько широки пределы изменения факторов; как правило, область его применения - действующие хим. произ-ва. Активный эксперимент (см. Планирование эксперимента)отличается возможностью целенаправленного изменения значений факторов по заранее выбранному плану со стабилизацией этих значений в каждом опыте, что позволяет постановку т. наз. параллельных опытов, т.е. воспроизведение опытов для многократных измерений отклика в одних и тех же точках факторного пространства. Построение мат. модели (ур-ния регрессии)

3502-1.jpg

состоит в нахождении значений ее параметров - выборочных коэф. регрессии b = (b0, b1,b2, ..., bт)и проводится обычно т. наз. методом наим. квадратов. Последний обеспечивает минимизацию суммы квадратов отклонений (остаточной суммы квадратов) результатов расчета по ур-нию регрессии 3502-2.jpg от соответствующих эксперим. значений отклика yi во всех зарегистрированных точках факторного пространства (i = 1, 2,..., n), отвечающих условиям опытов:

3502-3.jpg

Наиб. просто задача определения параметров решается для линейных по ним мат. моделей. При обработке результатов пассивного эксперимента такие модели в общем случае представляют в виде суммы l = m + 1 базовых ф-ций от факторов - т. наз. рег-рессоров - с коэф., к-рые и являются искомыми параметрами:

3502-4.jpg

где 3502-5.jpg -регрессоры; bj.-параметры модели.

Конкретный вид регрессоров подбирают так, чтобы достигнуть удовлетворительной точности описания эксперим. данных. Напр., при описании исследуемого св-ва соед. многочленом (полиномом) второго порядка от двух переменных (т-ры и давления) ур-ние мат. модели (12) примет вид:

3502-6.jpg

В данном случае регрессорами являются след. ф-ции факторов:

3502-7.jpg

Самый простой вид имеет линейная ф-ция одной переменной - прямая линия на плоскости x — у:

3502-8.jpg

Для мат. моделей этого класса вычислит. процедура метода наим. квадратов сводится к решению системы линейных алгебраич. ур-ний порядка l относительно вектора неизвестных параметров модели b. Эту систему ур-ний составляют след. образом:

1) формируют матрицу Ф порядка n х l, столбцы к-рой представляют собой значения регрессоров для каждого опыта

3502-9.jpg

2) эту матрицу транспонируют и умножают на исходную, получая в результате симметричную матрицу (порядка l) коэф., или параметров, системы ур-ний:

3502-10.jpg

3) умножают транспонированную матрицу на вектор значений отклика у = (у1, у2, ..., уn), получая вектор правых частей (порядка l) системы ур-ний;

4) составляют т. наз. систему нормальных ур-ний, к-рую принято записывать в виде:

3502-11.jpg

В частном случае при построении модели в виде линейной ф-ции одной переменной в соответствии с ур-нием (15) решение системы (18) сводится к вычислению значений параметров b1 и b0 по ф-лам:

3502-12.jpg

Практич. применение ф-л (18) и (19) может потребовать предварит. изменения масштаба факторов из-за возможной значит. погрешности в расчете параметров модели, обусловленной вычислит. св-вами этих ф-л. Если порядок значений элементов в столбцах матрицы Ф превышает 101, то выполняют пересчет значений соответствующих факторов либо путем перехода к др. единицам измерения (напр., от секунд к часам), либо их преобразованием к безразмерному виду с размещением на интервале от — 1 до 1 (т. наз. нормирование) по ф-ле:

3502-13.jpg

где 3502-14.jpg -миним. и макс. значения u-го фактора в опытах.

Лучшие по точности значения параметров модели получают при нормировании всех факторов хи(х), и = 1, 2, ..., k, поскольку в данном случае они приводятся к величинам одного масштаба. Для восстановления ур-ния мат. модели в исходных единицах измерения и масштабах факторов в ф-ле (12) осуществляют обратную подстановку согласно ф-ле (20).

Анализ точности построенной таким образом модели проводят разными методами в зависимости от характера и св-в факторов и отклика. Наиб. распространен т. наз. регрессионный анализ, к-рый состоит в выделении относительно значимых факторов сопоставлением их вклада с погрешностью эксперимента и в проверке мат. модели на адекватность описания изучаемого объекта исходным данным путем сравнения погрешности вычисления значений отклика по полученному ур-нию регрессии с воспроизводимостью опытов. Использование регрессионного анализа требует выполнения след. условий, предъявляемых к обрабатываемым эксперим. данным: а) ошибки измерений факторов пренебрежимо малы в сопоставлении с ошибкой измерения отклика; б) ошибки измерений отклика распределены по нормальному закону; в) выборочные дисперсии откликов во всех опытах однородны (соизмеримы).

При проведении пассивного эксперимента обычно не удается полностью удовлетворить перечисленным условиям или получить необходимые данные в достаточном объеме. Поэтому на практике при обработке результатов принимают нек-рые допущения или ограничиваются неполным использованием этой методики. В осн. ее сводят к расчету т. наз. остаточной дисперсии:

3502-15.jpg

в к-ром для определения остаточной суммы квадратов R по ф-ле (11) результаты вычислений 3502-16.jpg получают при умножении матрицы Ф на вектор параметров модели b:

3502-17.jpg

а также к попытке упрощения вида мат. модели исключением относительно незначимых регрессоров, для чего находят вектор t:

3502-18.jpg

где 3502-19.jpg-диагональные элементы т. наз. ковариационной матрицы:

3502-20.jpg

Регрессор, к-рому соответствует миним. значение tj, исключают из модели, составляют и решают новую систему ур-ний. Рассчитывают новое значение остаточной дисперсии, и если оно оказывается меньше, чем для исходной модели, принимают упрощенную модель. Процедура после-доват. исключения регрессоров может продолжаться, пока уменьшается остаточная дисперсия.

Если дисперсия отклика известна и рассчитана по специально поставленным параллельным опытам (что часто исключается в условиях пассивного эксперимента), мат. модель м. б. проверена на адекватность описания объекта исходным данным с использованием F-распределения Фишера. Для этого вычисляют отношение остаточной дисперсии к выборочной дисперсии отклика (большей по значению к меньшей). Если это отношение оказывается меньше табличного значения F-критерия:

3502-21.jpg

где f1, f2 - число степеней свободы соотв. большей и меньшей дисперсий, то различие этих дисперсий принимается незначимым, ошибка определения значений отклика по ур-нию регрессии - сравнимой с воспроизводимостью опытов, а мат. модель - адекватно описывающей экспериментально исследованный объект. Причиной неадекватности модели объекту м. б. неучтенные существ. факторы или неправильный выбор ее вида.

Пример 2. Найти аналит. зависимость вязкости азота3502-22.jpgот давления Р при 25 °С по след. данным:

3502-23.jpg

Использование этих данных в качестве координат для изображения соответствующих точек на плоскости Р - 3502-24.jpgпозволяет сделать вывод о том, что упомянутая зависимость в рассматриваемом интервале давлений близка к линейной [см. ф-лу (15)]:

3502-25.jpg

Параметры b1 и b0 м. б. определены по ф-лам (19) с использованием результатов вычислений, сведенных в табл. (i - номер опыта):

i

Pi

3502-26.jpg

3502-27.jpg

P2i

3502-28.jpg

3502-29.jpg

1

3,50

0,0185

0,0647

12,25

0,0177

-0,0007

2

6,90

0,0190

0,1311

47,61

0,0189

-0,0001

3

13,71

0,0208

0,2852

187,96

0,0215

0,0007

4

34,12

0,0286

0,9758

1164,10

0,0288

0,0003

5

68,15

0,0415

2,8282

4644,40

0,0413

-0,0002

S

126,38

0,1284

4,2850

6056,32

-

-

3502-30.jpg

Полученная модель имеет вид:

3502-31.jpg

В последнем столбце табл. приведены отклонения расчетных значений 3502-32.jpg от исходных 3502-33.jpg.

В общем последовательность действий при построении аналит. зависимости, описывающей эксперим. данные, включает след. этапы: 1) результаты опытов сводят в табл., строки к-рой соответствуют экспериментам, а столбцы-наблюдаемым значениям факторов. 2) Задают вид искомой зависимости (параметры к-рой подлежат определению), включающей необходимые регрессоры. 3) Для каждого рс-грессора в полученной табл. вводят дополнит, столбец, в к-рый заносят значение регрессора в каждом опыте. 4) Составляют систему нормальных ур-ний (18). 5) Решением этой системы определяют оценки параметров искомой зависимости. 6) По соотношению (25) проверяют адекватность полученной зависимости эксперим. данным. 7) Определяют по ф-ле (23) для каждого найденного параметра значения t. 8) Делают попытку упрощения указанной зависимости путем исключения из нее регрессора с параметром, имеющим наименьшее значение t. 9) Повторяют процедуру с п. 2 по п. 6. 10) Сделанное упрощение принимают и вычислит, процедуру продолжают с п. 7, если рассчитываемая по ф-ле (21) остаточная дисперсия для упрощенной модели будет меньше, чем для исходной.

Лит.: Химмельблау Д., Анализ процессов статистическими методами, пер. с англ., М., 1973; Крамер Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; Ахназарова С. Л., Кафаров В. В., Оптимизация эксперимента в химии и химической технологии, М., 1978; Себер Дж., Линейный регрессионный анализ, пер. с англ., М., 1980; Форсайт Дж., Машинные методы математических вычислений, пер. с англ., М., 1980; Мэйндональд Дж., Вычислительные алгоритмы в прикладной статистике, пер. с англ., М., 1988; Эберт К.. Компьютеры. Применение, пер. с нем., М., 1988. Ю.К. Щипин.