Uploaded by mamrukeskermes

основы анализа

advertisement
Основы количественного
анализа и статобработки для
школьных проектов
Булгакова Анастасия Евгеньевна
Методические требования к
опытам
1)
типичность – соответствие условий
проведения опыта почвенноклиматическим и агротехническим
условиям данной зоны;
2)
принцип единственного различия –
варианты опыта должны отличаться
друг от друга только по одному
изучаемому параметру (признаку).
3)
точность опыта – доля ошибки
репрезентативности по отношению к
средней арифметической,
выраженная в процентах (не более
8%) в пределах варианта.
Основные понятия экспериментальных
исследований
• Репликация, повторение измерений обычно означает повторение эксперимента,
но в более конкретном смысле —
возвращение к первоначальным условиям.
Если, например, вентилятор работает при
некоторых значениях скорости, давления и
расхода воздуха, а затем возвращается к
первоначальным условиям и при этом снова
снимаются отсчеты, то в этом случае имеет
место повторение первого эксперимента
(репликация).
Скорость
• Переменная - означает любую варьируемую
физическую величину. Измерения могут
быть точными или неточными.
Количество оборотов
Основные понятия экспериментальных
исследований
• Ошибка – отклонение измеренного значения от
точного, выражается некоторым числом,
например 2 об/мин, 0,6°С, 15 Ом и т. д.,
определяется как разность между калиброванным
или известным отсчетом и отсчетом, снятым с
прибора. Ошибку можно знать или предсказать,
если удается прокалибровать или каким-либо
другим способом проверить испытательную
аппаратуру.
• Систематическая ошибка при измерениях представляет собой фиксированную величину
отклонения отсчета относительно известного или
калиброванного значения измеряемой величины,
независимо от того, сколько раз производится
измерение. Таким образом, систематическая
ошибка имеет постоянную величину.
Чем длиннее линейка, тем больше приборная погрешность.
Основные понятия экспериментальных
исследований
• Серии испытаний - проведение испытаний на
испытательной аппаратуре, она устанавливается в
определенное фиксированное состояние или
включается по определенной схеме, производится
запись всех измерений. В результате каждого
испытания получают определенную точку или
экспериментальный отсчет.
• Данные – результаты эксперимента, представляют
собой записанные или запоминаемые величины,
характеризующие результат испытаний.
• Необработанные данные — это информация,
записанная в символическом виде, получаемая
непосредственно с измерительных приборов.
• Обработанные данные — это та же информация
после выполнения над ней некоторых
математических операций, таких, как внесение
исправлений с помощью калибровочной кривой или
построение графика.
Обработанные данные, нанесенные на график, образуют
кривую зависимости; они могут привести к получению
функционального соотношения между независимыми и
зависимыми переменными, обычно записываемого в
виде формулы.
Методология
эксперимента
1. Разработка плана-программы
эксперимента
2. Оценка измерений и выбор
средств для проведения
эксперимента
3. Проведение эксперимента
4. Обработка и анализ
экспериментальных данных
Методика эксперимента
Основные характеристики, влияющие на
исследуемый процесс
1. Выбор варьирующих факторов
Нахождение зависимости
Второстепенные характеристики, влияющие на
исследуемый процесс
2. Анализ расчетных (теоретических) схем процесса. Классификация всех факторов и
составление из них убывающего по
важности для данного эксперимента
ряда
Основным принципом установления степени
важности характеристики является ее роль в
исследуемом процессе.
Для этого изучают процесс в зависимости от
какой-то одной переменной при остальных
постоянных. Такой принцип проведения
эксперимента оправдывает себя лишь в тех
случаях, когда переменных характеристик мало —
1—3.
Если трудно сразу выявить роль
основных и второстепенных факторов,
выполняют небольшой по объему
поисковый эксперимент
Методика эксперимента
Обоснование средств измерений — это
выбор необходимых для наблюдений и
измерений приборов, оборудования, машин,
аппаратов и пр. Средства измерения могут
быть выбраны стандартные или в случае
отсутствия таковых — изготовлены
самостоятельно.
Очень ответственной частью является
установление точности измерений и
погрешностей!!! Методы измерений
должны базироваться на законах
специальной науки — метрологии.
Метрология – наука об измерениях и путях
достижения необходимого уровня их
точности.
Обработка результата эксперимента
Математические методы обработки и анализ опытных данных
Установление
эмпирических
зависимостей
Аппроксимации связей между
варьируемыми
характеристиками
Установление
критериев и
доверительных
интервалов
Результаты экспериментов должны отвечать трем статистическим
требованиям:
• эффективности оценок, т.е. минимальность дисперсии
отклонения относительно неизвестного параметра;
• требование состоятельности оценок, т.е. при увеличении
числа наблюдений оценка параметра должна стремиться
к его истинному значению;
• требование несмещенности оценок - отсутствие
систематических ошибок в процессе вычисления
параметров.
Выборочный метод
Генеральная совокупность – группа объектов,
подлежащая изучению
Выборочная совокупность – доступная для
изучения часть генеральной совокупности
Репрезентативность (представительность)
выборки – способность выборки наследовать
основные черты генеральной совокупности
Выборочный метод –
метод изучения ГС через
выборку
Чем больше выборка, тем
лучше ее распределение
приближается к
распределению генеральной
совокупности.
В практических наблюдениях мы обычно имеем
совокупность наблюдений, на основе которых
требуется сделать те или иные выводы.
Как представить полученные
данные?
Описательная статистика
Если у нас несколько выборок данных, то прежде чем
переходить к их сравнению надо описать каждую из них по
критериям
Центральной тенденции
Изменчивости
Размер листа, см
Центральная тенденция
Упорядочим все измерения вдоль оси
Размер листа, см
Минимальное
значение
Медиана
Максимальное
значение
Медиана – измерение, которое соответствует среднему элементу ряда,
это значение признака, справа и слева от которого находится равное число
наблюдений (по 50%).
Центральная тенденция
Размер листа, см
Минимальное
значение
Максимальное
значение
Среднее по выборке – сложить все значения и
поделить на количество измерений.
Что применять медиану или среднее?
Давайте посмотрим зарплаты сотрудников школы
Количеств Зарплата,
о человек тыс. руб.
10
10
3
3
2
10
15
20
50
80
Среднее = 22 тыс. руб
Медиана = 15 тыс. руб
Что ближе к понятию
«средняя зарплата»?
Что применять медиану или среднее?
Распределение
нормальное?
Да
среднее
Нет
медиана
Для выборки с нормальным распределением медиана и
среднее совпадают
Что такое нормальное распределение?
Ненормаль
ное
распределе
ние
Для выборки с нормальным распределением медиана и среднее совпадают!!!
Что такое нормальное распределение?
Ненормаль
ное
распределе
ние
Для выборки с нормальным распределением медиана и среднее совпадают!!!
Что такое нормальное распределение?
Ненормальное
распределение
Выбросы!!!
Для выборки с нормальным распределением медиана и среднее совпадают!!!
Меры изменчивости
Упорядочим все измерения вдоль оси
Размер листа, см
Минимальное
значение
Размах – разность между максимальным и
минимальным значениями
Максимальное
значение
Меры изменчивости
Чтобы «выбросы» не искажали описание
используют
Минимальное
значение
Размер листа, см
Максимальное
значение
Межквартильный размах – разность между максимальным и
минимальным значениями, после отсечения 25% самых
маленьких и 25% самых больших значений.
Меры изменчивости
Выбросы – это точки, выходящиее за пределы
1,5 межквартильных размаха. Максимум и минимум
определяются уже без них.
Для ненормальных
распределений!!!
Данные представлять
в виде «боксплот»
(«ящик с усами»).
Меры изменчивости при нормальном
распределении
✔ Отклонение каждого значения от среднего
✔ Может быть больше и меньше нуля, поэтому
значение отклонения возводят в квадрат.
✔ Дисперсия – мера разброса данных от
среднего арифметического. Среднее от
квадратов отклонений (суммируем все
отклонения, возведенные в квадрат и делим
на количество измерений).
✔ Среднеквадратическое отклонение (S) –
квадратный корень из дисперсии.
Среднеквадратическое отклонение в
описании выборки
Среднеквадратическое = стандартное
отклонение!!!
Обозначается буквой S или SD.
Описание выборки с
нормальным
распределением
Среднее ± SD.
Стандартная ошибка средней
Не путайте со среднеквадратичным отклонением!!!
Формула для определения
стандартной ошибки средней
(m)
Стандартная ошибка
средней измеряет
изменчивость или
отклонение средних
значений выборок от
истинной (популяционной
или генеральной) средней.
Представление данных по
выборке
Указывайте меры центральной тенденции
и меры изменчивости
Нормальная выборка
Ненормальная выборка
Представление данных - таблица
Предпочтительно в тексте.
В презентации, если мало строк, но
несколько столбцов (несколько
данных для одной выборки).
✔ Заголовок должен содержать информацию о данных в таблице.
✔ Строки и столбцы должны иметь заголовок, в котором указана единица
измерения. Желательно приводить суммарные данные по строкам или
столбцам, если значения в них являются частью совокупности.
✔ Сноски используются для объяснены кодовых названий, сокращений и
символов.
✔ Если данные заимствованы, указать источник.
Представление данных – столбчатая диаграмма
Для сравнения двух-трех
выборок по одному
показателю.
✔ Заголовок должен содержать информацию о закономерности, которую вы
демонстрируете данной диаграммой.
✔ Оси должны быть подписаны, с указанием единиц измерения.
✔ Ось ОY должна начинаться с 0. Если в шкале есть разрывы, то их надо указывать
волнистой чертой.
✔ Оси должны иметь большую толщину, чем все остальные линии диаграммы.
✔ Ряды данных должны быть подписаны в легенде (при наличии данных для 2-3
выборок)
✔ Сноски используются для объяснены кодовых названий, сокращений и символов.
✔ Если данные заимствованы, указать источник.
Представление данных – график
Для показа тенденции (чем
крупнее котики, тем их меньше
встречается) или временных
изменений
✔ Заголовок должен содержать информацию о закономерности, которую вы
демонстрируете данным графиком.
✔ Оси должны быть подписаны, с указанием единиц измерения.
✔ Линии графика должны быть четко видны.
✔ Если в одной плоскости представлено сразу несколько графиков, необходимо чтобы
они четко различались и имели легенду с описанием каждого
✔ Сноски используются для объяснены кодовых названий, сокращений и символов.
✔ Если данные заимствованы, указать источник.
Представление данных – круговая диаграмма
Идеально для представления
частей общей совокупности.
При небольшом количестве
секторов!
Но сравнение двух
совокупностей лучше
проводить диаграммой!
✔ Заголовок должен содержать информацию о принципе деления на части для данной
диаграммы.
✔ В каждом секторе должно быть проставлено числовое значение (процент)
выражающее долю данного сектора на круге
✔ Наличие цветовой легенды
✔ Если у вас есть много мелких значений, желательно объединить их в один сектор
«другие…»
✔ Сноски используются для объяснены кодовых названий, сокращений и символов.
✔ Если данные заимствованы, указать источник.
Представление данных – точечные или
пузырьковые диаграммы
Позволяет отобразить
сразу два свойства
Диаграмма рассеяния
• Диаграмма рассеяния визуализирует зависимость между двумя переменными
x и y. Данные изображаются точками в двумерном пространстве, где оси
соответствуют переменным x – горизонтальной, а y – вертикальной оси.
• Проведенная прямая называется прямой регрессии или прямой, построенной
методом наименьших квадратов. Последний термин связан с тем, что сумма
квадратов расстояний (вычисленная по оси y) от наблюдаемых точек до
прямой является минимальной из всех возможных.
Аппроксимация
• Аппроксимация – описание массива данных какой-либо известной формулой,
которая ставит целью определение численных коэффициентов. Главное отличие
аппроксимации от регрессии – то, что формула имеет какой-то физический смысл,
по полученным коэффициентам можно судить о протекающих внутри чего-либо
процессах.
• Способы аппроксимации:
• 1. Графический способ – самый старый – строится график функции и его
сравнивают с набором заранее построенных кривых, шаблонов. Недостаток этого
метода – субъективность, поэтому все построения нужно проводить с
использованием специальных компьютерных программ.
• 2. Способы приведения сложных кривых к линейному виду:
Пример: способ функциональных шкал (вместо у на шкале ставится ln(у) или а/у (а –
коэффициент)). Функциональные шкалы используют для того, чтобы привести
зависимость сложного вида к линейному виду.
• 3. Аналитические методы:
Пример: компьютерный подбор; в MathCAD – «Регрессия общего вида». Заключается в
том, что в ЭВМ вводится массив исходных данных – координаты экспериментальных
точек по х и по у, и аналитическая зависимость (формула с неизвестными
коэффициентами). Компьютер путём подбора неизвестных коэффициентов пытается
наиболее точно описать массив исходных данных.
Теория подобия
• При планировании экспериментов,
анализе и обобщении полученных
результатов экспериментов широко
используется теория подобия.
• Теория подобия – это учение о подобии
явлений. Теория подобия позволяет
сократить количество переменных,
описывающих явление, процесс, объект
исследования, вводя обобщенные
безразмерные переменные.
• Все явления, входящие в одну группу с
одинаковыми значениями критериев
однозначности, подобны и отличаются
только масштабом.
Критерий Фишера
• Содержательный смысл F-критерия Фишера в общих словах: это критерий
для оценки значимости различия дисперсий двух случайных выборок.
Для этого вычисляется F-статистика, равная F = D1/D2, где D1 – большая дисперсия,
D2 – меньшая дисперсия. Если полученное значение F-статистики больше
критического для определенного уровня значимости и числа факторов, то
регрессия признаётся статистически недостоверной.
Степени свободы:
Ƒ1 = n 1 - 1
Ƒ2 = n 2 - 1
n – объем выборки
(количество
полученных данны)
Fэксперимент. ≤ Fтаблич., то значения можно
Fэксперимент. ≥ Fтаблич.объединять
,то значения объединять нельзя
Критерий Стьюдента
• t-статистика позволяет проверить значимость отдельных переменных
моделей. Она определяется в зависимости от числа степеней свободы
уравнения и уровня значимости уравнения. Степень свободы – это число
наблюдений выборки минус 2.
• По таблице «Критические значения t-критерия Стьюдента»:
http://psystat.at.ua/Articles/Table_t_Student.pdf определяют значение tстатистики. Если какая-то переменная имеет t-статистику меньше этого
показателя (по модулю), то этот фактор не значим, и может быть исключён
из модели.
Методы количественного определения
Спектрофотометрические
методы
Основаны на способности
отдельных химических групп
белков и пептидов
поглощать лучи света
прежде всего в
ультрафиолетовой области
спектра
Колориметрические
методы
Основаны на образовании
окрашенных комплексов с
белком, причём интенсивность
окраски прямо пропорциональна
концентрации белка в растворе
Биохимический анализ. Фотометрия.
Основные принципы.
Фотометрические методы (Дополнительное применение)
Нефелометрия Турбидемитрия
Изучение
способности
веществ
рассеивать
излучение
Изучение
способности
веществ
пропускать
излучение
Флуометрия
Поляриметрия
Изучение
способности
веществ
переизлучать
поглощенное
излучение
Изучение
изменения
степени
поляризации
излучения, при
прохождении его
через оптически
активные
вещества
Биохимический анализ. Фотометрия.
Основные принципы.
Измерение на оптимальной длине волны.
Если в многокомпонентной системе два или
более компонентов имеют максимум
поглощения в одной области, то часто
измерение проводиться на оптимальной
длине волны, на которой существенно
различаются оптические плотности рабочего
раствора (бланка) и исследуемого вещества.
Пример: При определении магния методом с
ксилидиловым синим, максимум поглощения
реагента отмечается при длине волны 540 нм,
а комплекса с магнием при длине волны 520
нм. В случае измерения при длине волны 545
(546) нм (часто устанавливаемый фильтр на
фотометрах и б/х анализаторах) на фоне ОП
рабочего реагента (бланк) будет слабо
различима ОП анализируемого образца.
Биохимический анализ. Фотометрия.
Основные принципы.
Закон Бугера-Ламберта-Бера
ɛ - коэффициент поглощения (экстинкции), л /(моль · см)
ɭ- толщина поглощающего слоя раствора ( обычно ширина кюветы), см
С – концентрация раствора, моль/л
Биохимический анализ. Фотометрия.
Основные принципы.
Измерение по калибровочной кривой.
Возможны 3 варианта калибровочного
графика:
Для построения калибровочного
графика на оси абсцисс откладывается
концентрация С, а на оси ординат
плотность D. На оси D откладывают все
полученные значения Di,
соответствующие концентрациям Сi.
1.
Вариант А. Калибровочный график
имеет вид прямой и проходит через
точку 0. В этом случае F=Ci/Di
2.
Вариант Б. Имеется систематическая
ошибка, которую следует учитывать
при расчете фактора. F=Ci/(Di-a).
Желательно измерение с холостой
пробой, в которой данная ошибка
учитывается.
3.
Вариант В. Данным калибровочным
графиком пользоваться нельзя, так
как не определяются низкие
концентрации калибратора.
Колориметрические методы
Биуретовая реакция – стандартная
качественная реакция на пептидную
связь в белках. При добавлении к
сильно щелочному раствору белка
сульфата
меди,
образуются
комплексные соединения меди,
окрашенные в красно-фиолетовый
или
сине-фиолетовый
цвет.
Интенсивность окраски зависит от
длины пептида.
Биуретовый метод
Метод основан на образовании в щелочной
среде окрашенного в фиолетовый цвет
комплекса пептидных связей белков с ионами
двухвалентной меди.
Чувствительность метода: от 2 до 10 мг белка в
пробе.
Колориметрический
анализ
проводят
сравнением поглощения света исследуемым
раствором с поглощением проб стандартного
ряда. В качестве стандарта используют раствор
бычьего сывороточного альбумина (БСА).
Проба белка
Биуретовый
реактив
Развитие
окрашивания 30
мин
Специфичность аналитического метода
- способность достоверно определять вещество в
присутствии примесных соединений, продуктов деградации
и вспомогательных веществ
Специфичность оценивается при валидации методов,
применяемых для:
- идентификации лекарственных веществ,
- определения примесей (родственные соединения,
тяжелые металлы, летучие органические примеси),
- установления количественного содержания вещества в
образце и лекарственной форме.
Предел обнаружения
Минимальное количество аналита в пробе,
которое может быть обнаружено, но не
обязательно
определено
в
количественном
отношении при заданных условиях эксперимента.
Предел
обнаружения
выражается
как
концентрация аналита в пробе, например, в
процентах, частях на миллион (ррт) или частях на
миллард (ррb).
Линейность аналитической методики
это способность (в рамках заданного диапазоне)
получать результаты испытаний в виде переменных
(например, величины поглощения и площади под
кривой), прямо пропорциональных концентрации
(количеству анализируемого вещества) пробы.
Переменные, которые могут использоваться для
количественного
определения
анализируемого
вещества, - это площади пиков, высота пиков и
отношение площадей (высот) пиков анализируемого
вещества к пику внутреннего стандарта.
Прецизионность (precision)
• аналитической методики выражает близость
результатов (степень разброса) серий измерений,
полученных на множестве проб одного образца при
заданных условиях.
• Обычно исследуют 3 уровня прецизионности:
- Повторяемость - мера прецизионности при
одинаковых условиях эксплуатации в течение короткого
промежутка времени
- Промежуточную прецизионность – вариабельность
внутри одной лаборатории.
- Воспроизводимость – измеряет межлабораторную
прецизионность.
Download