ОБРАБОТКА
РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА в химии, заключается в применении методов мат.
статистики для оценки значений разл. физ. величин (св-ва соед., параметры химико-технол.
процессов и др.), характеризующих изучаемые объекты, и (или) зависимости этих
величин от одного либо нсск. изменяемых внеш. условий (напр., т-ра, давление,
тип катализатора). Обработка результатов эксперимента включает, как
правило, также и определение точности данных, полученных при его проведении.
Результаты измерений обычно
содержат случайные ошибки, поэтому статистич. оценки выполняют только при наличии
серии измерений - т. наз. случайной выборки. Для оценки измеряемого значения
к.-л. величины или исследуемой зависимости ее от внеш. условий по данным выборки
рассчитывают т. наз. выборочные параметры, характеризующие статистич. распределение
ошибок в проведенном эксперименте. Такое распределение, как правило, подчиняется
т. наз. нормальному закону, конкретный вид к-рого определяют два параметра -
выборочное среднее и выборочная дисперсия (см. ниже).
Точность получаемых оценок
устанавливают с помощью статистич. критериев Стьюдента (t-критерий),
Фишера (F-критерий) и т. д. При этом количеств, мерами служат т. наз. доверит.
вероятность
и уровень значимости статистич. критерия р = 1 —.
При заданных требованиях на точность результатов измерений доверит. вероятность
(уровень значимости) определяет надежность полученной оценки.
Обработка результатов измерений значения
физической величины. Проводится, если условия опыта не изменяются или их
возможные изменения не учитываются. Такая обработка результатов состоит в оценке значения выборочного
среднего (среднего арифметического) и определении ее точности. При этом различают
обработку результатов прямых и косвенных измерений.
Прямые измерения. При таких
измерениях числовое значение определяемой величины непосредственно считывается
с показаний прибора (напр., весов). Если при повторных измерениях одной и той
же величины а получаются неразличимые результаты х для принятой
градуировки шкалы прибора, то в этом случае в качестве абс. погрешности измерений
м. б. принята цена деления шкалы. Если же при п повторных измерениях
регистрируются разл. отсчеты по шкале прибора, то их совокупность может рассматриваться
как выборка случайных величин x t x2, ..., хп.
В качестве наиб. вероятной оценки значения измеряемой величины в этом случае
обычно полагают выборочное среднее
к-рое принимают за приближенное
значение а, т.е.
Т.к. ошибки измерений случайны,
полученная оценка результата также
случайна. Мерой ее погрешности служит т. наз. выборочный стандарт среднего
где S2x
- выборочная дисперсия, к-рая может вычисляться на основании той же выборки:
Значение погрешности найденной
оценки
определяется величиной т. наз. доверит. интервала,
к-рый "накрывает" истинное значение а с заданной доверит.
вероятностью, т. е.
Величина доверит. интервала
при достаточно больших объемах выборки (п30
— 50) зависит только от принимаемого значения ,
напр.:
При значениях п <
30, что наиб. характерно для эксперимента, существенна зависимость
также и от числа опытов. В этом случае для вычисления
в качестве коэф. используют табл. значение t-критерия (см. табл. на форзаце
в конце тома), соответствующее уровню значимости р = 1 —
и числу степеней свободы выборочной дисперсии f = n— 1 :
Если значения границ доверит.
интервала
и имеют
разные знаки, оценка результата незначима, и с вероятностью
можно полагать, что.
Обычно принимают
= 0,95, реже 0,99 и 0,999.
Пример 1. При взвешивании
образца анализируемого в-ва получены след. результаты: 47,12; 47,08; 47,13 г.
Оценить истинную массу образца и определить точность этой оценки для =
0,95. В данном случае п = 3; р = 1 —
= = 1 - 0,95 = 0,05; f= п - 1 = 3 - 1 = 2. По ф-лам (1)-(3) вычисляют
выборочные среднее и дисперсию:
Далее по таблицам распределения
Стьюдента находят величину t(p,f) = = t(0,05; 2) = 4,30 и по ф-ле
(6) рассчитывают величину доверит. интервала:
Оценка массы образца по
ф-ле (4) составляет 47,11 0,07
г. С увеличением числа измерений eb уменьшается. Так, если дополнить
проведенные измерения результатами еще двух взвешиваний (47,09 и 47,13 г), то
п = 5, f = п — I =5 — 1 = 4, и аналогично предыдущему определяют:
=47,11
г; S2x = 0,00055 г2; t(0,05;
4) = = 2,78; =
0,03 г. Т.обр., точность оценки массы возрастает более чем в два раза; 47,11
0,03 г.
Косвенные измерения. Таким
измерением наз. расчет величины у по результатам прямых измерений xl,
x2, ..., xk неск. величин a1,
a2, ..., ak. В общем случае вычислит,
процедура определения у представляется в виде ф-ции k переменных:
Тогда выборочное среднее
находят подстановкой в расчетные ф-лы выборочных средних прямо измеренных величин:
Выборочную дисперсию вычисляют
по ф-ле:
где
- частная производная ф-ции у по прямо измеренной величине Xi.
При определении доверит. интервала для результата косвенного измерения общее
число опытов nпринимается
равным ,
где ni,—число измерений xi ; число степеней
свободы f=n — k.
Последовательность расчетов:
1) вычисляют выборочные средние и дисперсии прямо измеренных величин. 2) По
ф-лам (8) и (9) находят выборочные среднее и дисперсию искомой величины. 3)
По табл. распределения Стьюдента находят значение t-критерия и вычисляют
доверит. интервал полученной оценки измерения.
Обработка результатов исследования зависимости
физической величины от изменяющихся условий опытов (построение математической
модели). Проводится с целью построения аналит. (в виде ур-ния) зависимости
значения величины у, характеризующей изучаемый объект и наз. откликом,
от одного либо ряда изменяющихся внеш. условий, или факторов, x1,
x2,..., xk, к-рые образуют т. наз. факторное
пространство.
Введем нек-рые понятия
матричной алгебры, используемые при получении оценок зависимостей и определении
их точности. Матрицей А называют нек-рую таблицу чисел; порядок, или размер,
матрицы т x п определяют число ее строк т и число столбцов
п. Элементы матрицы А обозначают через аij, где первый
индекс указывает на его принадлежность к i-и строке, второй -j-му
столбцу (для матрицы В-элементы bij , для матрицы D-dij.
и т.д.). Матрицу, состоящую из одного столбца, называют вектором а, матрицу,
содержащую одинаковое число строк и столбцов (при т — п),-квадратной
матрицей. Элемент матрицы, у к-рого значения индексов равны (i=j), называют
диагональным. Матрицу, все элементы к-рой, кроме диагональных, равны нулю, называют
диагональной; если все ее диагональные элементы равны 1, матрицу называют единичной
и обозначают через Е. Матрицу, у к-рой строки заменены столбцами, а столбцы-строками,
называют транспонированной и обозначают через А'. Если А = А', такую матрицу
называют симметричной. Сумма двух матриц А и В одинакового порядка т х
n -матрица D = А + В того же порядка, для к-рой dij =aij
+ bij (i= 1, 2, ..., т; j = 1, 2, ..., п). Произведение
матрицы U порядка m x s на матрицу V порядка s х
n-матрица Q = UV порядка т х п, где
Произведением матрицы U
порядка т х s на вектор v порядка s служит вектор
q = Ui, порядка т, где
Обратной матрицей по отношению
к данной матрице А называют такую матрицу А-1, произведением к-рой
на исходную является единичная матрица АА-1 = A-1A = Е.
Далее в тексте вводятся
матрицы Ф, N и С, а также векторы х, у, уp, и t,
принятые в мат. статистике.
В зависимости от организации
опытов принято различать пассивный и активный эксперименты. При проведении пассивного
эксперимента для каждого измерения значения отклика yi (i= 1,2,...,
n) регистрируется совокупность значений факторов xi = (x1i,
x2i, ..., хki), представляющая собой
точку в факторном пространстве с соответствующими значениями координат. Ценность
пассивного эксперимента существенно
зависит от того, насколько широки пределы изменения факторов; как правило, область
его применения - действующие хим. произ-ва. Активный эксперимент (см. Планирование
эксперимента)отличается возможностью целенаправленного изменения значений
факторов по заранее выбранному плану со стабилизацией этих значений в каждом
опыте, что позволяет постановку т. наз. параллельных опытов, т.е. воспроизведение
опытов для многократных измерений отклика в одних и тех же точках факторного
пространства. Построение мат. модели (ур-ния регрессии)
состоит в нахождении значений
ее параметров - выборочных коэф. регрессии b = (b0,
b1,b2, ..., bт)и
проводится обычно т. наз. методом наим. квадратов. Последний обеспечивает минимизацию
суммы квадратов отклонений (остаточной суммы квадратов) результатов расчета
по ур-нию регрессии
от соответствующих эксперим. значений отклика yi во всех зарегистрированных
точках факторного пространства (i = 1, 2,..., n), отвечающих условиям
опытов:
Наиб. просто задача определения
параметров решается для линейных по ним мат. моделей. При обработке результатов пассивного эксперимента
такие модели в общем случае представляют в виде суммы l = m +
1 базовых ф-ций от факторов - т. наз. рег-рессоров - с коэф., к-рые и являются
искомыми параметрами:
где
-регрессоры; bj.-параметры модели.
Конкретный вид регрессоров
подбирают так, чтобы достигнуть удовлетворительной точности описания эксперим.
данных. Напр., при описании исследуемого св-ва соед. многочленом (полиномом)
второго порядка от двух переменных (т-ры и давления) ур-ние мат. модели (12)
примет вид:
В данном случае регрессорами
являются след. ф-ции факторов:
Самый простой вид имеет
линейная ф-ция одной переменной - прямая линия на плоскости x — у:
Для мат. моделей этого
класса вычислит. процедура метода наим. квадратов сводится к решению системы
линейных алгебраич. ур-ний порядка l относительно вектора неизвестных
параметров модели b. Эту систему ур-ний составляют след.
образом:
1) формируют матрицу Ф
порядка n х l, столбцы к-рой представляют собой значения регрессоров
для каждого опыта
2) эту матрицу транспонируют
и умножают на исходную, получая в результате симметричную матрицу (порядка l)
коэф., или параметров, системы ур-ний:
3) умножают транспонированную
матрицу на вектор значений отклика у = (у1, у2,
..., уn), получая вектор правых частей (порядка l)
системы ур-ний;
4) составляют т. наз. систему
нормальных ур-ний, к-рую принято записывать в виде:
В частном случае при построении
модели в виде линейной ф-ции одной переменной в соответствии с ур-нием (15)
решение системы (18) сводится к вычислению значений параметров b1
и b0 по ф-лам:
Практич. применение ф-л
(18) и (19) может потребовать предварит. изменения масштаба факторов из-за возможной
значит. погрешности в расчете параметров модели, обусловленной вычислит. св-вами
этих ф-л. Если порядок значений элементов в столбцах матрицы Ф превышает 101,
то выполняют пересчет значений соответствующих факторов либо путем перехода
к др. единицам измерения (напр., от секунд к часам), либо их преобразованием
к безразмерному виду с размещением на интервале от — 1 до 1 (т. наз. нормирование)
по ф-ле:
где
-миним. и макс. значения u-го фактора в опытах.
Лучшие по точности значения
параметров модели получают при нормировании всех факторов хи(х),
и = 1, 2, ..., k, поскольку в данном случае они приводятся к величинам
одного масштаба. Для восстановления ур-ния мат. модели в исходных единицах измерения
и масштабах факторов в ф-ле (12) осуществляют обратную подстановку согласно
ф-ле (20).
Анализ точности построенной
таким образом модели проводят разными методами в зависимости от характера и
св-в факторов и отклика. Наиб. распространен т. наз. регрессионный анализ, к-рый
состоит в выделении относительно значимых факторов сопоставлением их вклада
с погрешностью эксперимента и в проверке мат. модели на адекватность описания
изучаемого объекта исходным данным путем сравнения погрешности вычисления значений
отклика по полученному ур-нию регрессии с воспроизводимостью опытов. Использование
регрессионного анализа требует выполнения след. условий, предъявляемых к обрабатываемым
эксперим. данным: а) ошибки измерений факторов пренебрежимо малы в сопоставлении
с ошибкой измерения отклика; б) ошибки измерений отклика распределены по нормальному
закону; в) выборочные дисперсии откликов во всех опытах однородны (соизмеримы).
При проведении пассивного
эксперимента обычно не удается полностью удовлетворить перечисленным условиям
или получить необходимые данные в достаточном объеме. Поэтому на практике при
обработке результатов принимают нек-рые допущения или ограничиваются неполным использованием
этой методики. В осн. ее сводят к расчету т. наз. остаточной дисперсии:
в к-ром для определения
остаточной суммы квадратов R по ф-ле (11) результаты вычислений
получают при умножении матрицы Ф на вектор параметров модели b:
а также к попытке упрощения
вида мат. модели исключением относительно незначимых регрессоров, для чего находят
вектор t:
где -диагональные
элементы т. наз. ковариационной матрицы:
Регрессор, к-рому соответствует
миним. значение tj, исключают из модели, составляют и решают
новую систему ур-ний. Рассчитывают новое значение остаточной дисперсии, и если
оно оказывается меньше, чем для исходной модели, принимают упрощенную модель.
Процедура после-доват. исключения регрессоров может продолжаться, пока уменьшается
остаточная дисперсия.
Если дисперсия отклика
известна и рассчитана по специально поставленным параллельным опытам (что часто
исключается в условиях пассивного эксперимента), мат. модель м. б. проверена
на адекватность описания объекта исходным данным с использованием F-распределения
Фишера. Для этого вычисляют отношение остаточной дисперсии к выборочной дисперсии
отклика (большей по значению к меньшей). Если это отношение оказывается меньше
табличного значения F-критерия:
где f1,
f2 - число степеней свободы соотв. большей и меньшей
дисперсий, то различие этих дисперсий принимается незначимым, ошибка определения
значений отклика по ур-нию регрессии - сравнимой с воспроизводимостью опытов,
а мат. модель - адекватно описывающей экспериментально исследованный объект.
Причиной неадекватности модели объекту м. б. неучтенные существ. факторы или
неправильный выбор ее вида.
Пример 2. Найти аналит.
зависимость вязкости азотаот
давления Р при 25 °С по след. данным:
Использование этих данных
в качестве координат для изображения соответствующих точек на плоскости Р
- позволяет
сделать вывод о том, что упомянутая зависимость в рассматриваемом интервале
давлений близка к линейной [см. ф-лу (15)]:
Параметры b1
и b0 м. б. определены по ф-лам (19) с использованием
результатов вычислений, сведенных в табл. (i - номер опыта):
i |
Pi |
|
|
P2i |
|
|
||
1 |
3,50 |
0,0185 |
0,0647 |
12,25 |
0,0177 |
-0,0007 |
||
2 |
6,90 |
0,0190 |
0,1311 |
47,61 |
0,0189 |
-0,0001 |
||
3 |
13,71 |
0,0208 |
0,2852 |
187,96 |
0,0215 |
0,0007 |
||
4 |
34,12 |
0,0286 |
0,9758 |
1164,10 |
0,0288 |
0,0003 |
||
5 |
68,15 |
0,0415 |
2,8282 |
4644,40 |
0,0413 |
-0,0002 |
||
S |
126,38 |
0,1284 |
4,2850 |
6056,32 |
- |
- |
||
Полученная модель имеет
вид:
В последнем столбце табл.
приведены отклонения расчетных значений
от исходных .
В общем последовательность
действий при построении аналит. зависимости, описывающей эксперим. данные, включает
след. этапы: 1) результаты опытов сводят в табл., строки к-рой соответствуют
экспериментам, а столбцы-наблюдаемым значениям факторов. 2) Задают вид искомой
зависимости (параметры к-рой подлежат определению), включающей необходимые регрессоры.
3) Для каждого рс-грессора в полученной табл. вводят дополнит, столбец, в к-рый
заносят значение регрессора в каждом опыте. 4) Составляют систему нормальных
ур-ний (18). 5) Решением этой системы определяют оценки параметров искомой зависимости.
6) По соотношению (25) проверяют адекватность полученной зависимости эксперим.
данным. 7) Определяют по ф-ле (23) для каждого найденного параметра значения
t. 8) Делают попытку упрощения указанной зависимости путем исключения
из нее регрессора с параметром, имеющим наименьшее значение t. 9) Повторяют
процедуру с п. 2 по п. 6. 10) Сделанное упрощение принимают и вычислит, процедуру
продолжают с п. 7, если рассчитываемая по ф-ле (21) остаточная дисперсия для
упрощенной модели будет меньше, чем для исходной.
Лит.: Химмельблау Д., Анализ процессов статистическими методами, пер. с англ., М., 1973; Крамер Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; Ахназарова С. Л., Кафаров В. В., Оптимизация эксперимента в химии и химической технологии, М., 1978; Себер Дж., Линейный регрессионный анализ, пер. с англ., М., 1980; Форсайт Дж., Машинные методы математических вычислений, пер. с англ., М., 1980; Мэйндональд Дж., Вычислительные алгоритмы в прикладной статистике, пер. с англ., М., 1988; Эберт К.. Компьютеры. Применение, пер. с нем., М., 1988. Ю.К. Щипин.