(по пособию Чернова Н.М. , Математическая обработка экспериментальных данных. Часть 2 (введение в регрессионный и корреляционный анализ): Метод. Руководство / Международный педагогический университет. - Магадан.: Изд. МПУ, 1996. - 28 с. )
ПОСТРОЕНИЕ ЭМПИРИЧЕСКИХ ЛИНЕЙНЫХ ЗАВИСИМОСТЕЙ И МЕТОДЫ УТОЧНЕНИЯ ИХ ПАРАМЕТРОВ
Будем считать, что некоторое явление характеризуется двумя величинами {Х} и {Y}, связанными между собой некоторой неизвестной экспериментатору функциональной зависимостью. Любую из этих величин с одинаковой степенью можно считать независимой, тогда как другая будет считаться зависимой. Пусть, например, независимой положим переменную {X}. Тогда говорят, что переменная Y связана с {X} некоторой зависимостью, которую без ограничения общности можно представить: Y = F(Х), где F - некоторый неизвестный оператор, связывающий множество Х со множеством Y. Для простоты можно считать преобразование взаимно однозначным, хотя на практике это выполняется далеко не всегда.
Теперь математически задача сводится к построению явного вида оператора F и затем его уточнению. Методов решения указанной задачи существует достаточно много. Рассмотрим методы линейного регрессионного анализа.
Одним из самых простых операторов F является линейный, определяющий линейную зависимость вида Y = АХ + В. Положим В = 0 и определим связи между переменными Х и Y, вычислив параметр А.
МЕТОД ВЫБРАНЫХ ТОЧЕК
Проведем прямую как можно ближе к нанесенным точкам (рис. 1) и выберем на этой прямой произвольную точку М(Х, Y).
Рис.1 Экспериментальные точки с выбранной точкой M
Тогда параметр А определится из отношения А=у/х. Преимущество этого метода перед всеми состоит в его наглядности. Но заметим, что значения А могут колебаться довольно значительно, так как прямая строится произвольно и в выборе точек, через которые проводится прямая, нет однозначности.
МЕТОД СРЕДНИХ
Этот метод дает лучшие результаты по сравнению с методом выбранных точек. Если предположим, что зависимость построена, тогда yi = aхi даст приближенные значения yi. Определим параметр a из условия минимума средней ошибки
Перепишем последнее выражение в виде
откуда получаем выражение для
.
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Этот
метод дает еще более точные результаты по сравнению с двумя рассмотренными
выше. В этом методе параметр а определяется из условия минимальной
суммы квадратов отклонений табличных значений уi
от полученных уi* :. Условие минимума F, как известно, дает равенство нулю ее первой производной, т.е.
. Продифференцировав F по а,
получим
,
откуда находим
.
Каждый из приведенных выше методов является более точным (по порядку возрастания). Поэтому рекомендуется сначала воспользоваться методом выбранных точек, а затем - одним из двух оставшихся (для уточнения параметра а).
Пусть теперь В ≠ 0. Посмотрим, как изменятся методы. Общий вид зависимости теперь Yi = АХi + В.
Для уточнения параметров А и В воспользуемся тремя уже рассмотренными ранее методами.
МЕТОД ВЫБРАННЫХ ТОЧЕК
Выберем на построенном графике две произвольные точки М1(х1,у1) и М2(х2,у2). Из аналитической геометрии известно, что уравнение прямой будет
,
откуда получаем
.
Тогда выражения для параметров А и В можно определить явно как
.
МЕТОД СРЕДНИХ
Согласно этому методу, А и В ищутся такими, чтобы алгебраическая сумма всех уклонений от вычисленных значений была бы равна нулю
.
Для определения А и В разобьем все данные на две группы так, чтобы сумма алгебраических уклонений каждой группы от среднего была бы равна нулю. Иными словами среднее для одной группы точек было бы равным (или не очень сильно отличалось) среднему другой группы точек. Тогда для каждой группы запишем
где L - число элементов в I группе. Из последней системы найдем А и В:
.
Выполнив над последними выражениями элементарные алгебраические преобразования, получим окончательно выражения для коэффициентов А и В
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ.
Согласно этому методу, ищем минимум функции
.
Используя условие экстремума функции F, найдем
От последней системы можно перейти к более простой, выполнив над ней элементарные алгебраические преобразования:
Решая последнюю систему относительно А и В, получим