Исследование физических свойств теплоизоляционного кирпича методом линейной регрессии
Выпуск:
ART 85474
Библиографическое описание статьи для цитирования:
Абдрахимов
В.
З.,
Колпаков
А.
В.,
Кайракбаев
А.
К. Исследование физических свойств теплоизоляционного кирпича методом линейной регрессии // Научно-методический электронный журнал «Концепт». –
2015. – Т. 13. – С.
2366–2370. – URL:
http://e-koncept.ru/2015/85474.htm.
Аннотация. Исследована зависимость между содержанием в керамических образцах на основе межсланцевой глины отощающей и выгорающей добавки в виде горелых пород и основных физических свойств керамического теплоизоляционного кирпича (средняя плотность, водопоглощение, морозостойкость) методом линейной регрессии. Модель зависимости строится на основании результатов фактического эксперимента и аналитически описывает зависимость результатов опытов.
Ключевые слова:
межсланцевая глина, горелые породы, теплоизоляционный кирпич, метод линейной регрессии, средняя плотность, водопоглощение, морозостойкость
Текст статьи
Абдрахимов Владимир Закирович,доктор технических наук, профессор «Самарского государственного экономического университета», г. Самара3375892@mail.ru
Колпаков Александр Викторович,старший преподаватель «Самарского государственного экономического университета», г. Самараroland.alex@mail.ru
Кайракбаев Аят Крымович,кандидат физикоматематических наук, доцент «Казахскорусского международного университета», Казахстан, г. Актобеkairak@mail.ru
Исследование физических свойств теплоизоляционного кирпича методом линейной регрессии
Аннотация.Исследована зависимость между содержанием в керамических образцах на основе межсланцевой глины отощающей ивыгорающей добавки в виде горелых пород и основных физических свойств керамического теплоизоляционного кирпича(средняя плотность, водопоглощение, морозостойкость)методом линейной регрессии. Модель зависимости строится на основании результатов фактического эксперимента и аналитически описывает зависимость результатов опытов.Ключевые слова:межсланцевая глина, горелые породы, теплоизоляционный кирпич, метод линейной регрессии, средняя плотность, водопоглощение, морозостойкость.
По данным Министерства природных ресурсов, в России накоплено больше 31 млрд. отходов, связанных с прошлой экономической деятельностью •1․.Печальным следствием всего этого становится неизменное ухудшение экологической обстановки, снижение качества жизни человека.Несмотря на то, что технологии топливноэнергетического комплекса постоянно совершенствуются, они пока не достигли уровня безотходного производства •2․. Учитывая большое количество отходов, образующихся на предприятиях топливноэнергетического комплекса, и негативное влияние их на биосферу, разработка новых методов утилизации отходов является актуальной задачей. Большие возможности утилизации отходов имеются у предприятий по производству теплоизоляционных материалов •3․. Это объясняется многотонажностью и материалоемкостью производства строительного комплекса, а также широкой номенклатурой выпускаемых изделий.В работах •46․ была показана принципиальная возможность использования в производстве керамических материалов отходов при добыче горючих сланцев:межсланцевой глины и горелых пород, химический состав которых представлен в таблице 1.
Таблица 1 Химический состав исследуемых компонентов
КомпонентСодержание оксидов, мас. %SiO2Al2O3+TiO2Fe2O3CaOMgOR2OSO3п.п.п.Межсланцевая глина45471314561113233412920Горелые породы394012137817181212451415
В качестве глинистого компонента для производства керамических материалов в данной работе использовалась межсланцевая глина •4․, которая образуется при добыче горючих сланцев на сланцеперерабатывающих заводах и является отходом. По числу пластичности межсланцевая глина относится к высокопластичному глинистому сырью (число пластичности 2732) с истинной плотностью 2,552,62 г/см3. Минералогический состав межслацевых глин разнообразен, однако общим для них является наличие кремнезема, гидрослюды, монтмориллонита и кальцита.Для производства керамических теплоизоляционных материалов в качестве отощителя и выгорающей добавки нами использовались горелые породы •5, 6], химический состав которых представлен в таблице 1.Образуются горелые породы в местах добычи сланцев. По основным физическим и химическим свойствам они близки к глинам, обожженным при 8001000°С.Горелые породы, хотя и является отходами производства, но по химическому составу идентичны алюмосиликатному природному сырью для производства стеновых керамических материалов, что позволяет использовать их в производстве легковесного кирпича как основного компонента шихты.Повышенные содержания в горелых породах: 1) органических веществ способствует обжигу кирпича;
2) оксидов железа и кальция спеканию при относительно невысоких температурах (10001050°С); 3) оксида алюминия повышению прочности и морозостойкости.При исследовании зависимости между содержанием горелых пород и основными физическимихарактеристиками керамического теплоизоляционного кирпича(средняя плотность, водопоглощение, морозостойкость)использовался достаточно распространенный метод линейной регрессии. Этот метод позволяет выявить, как изменения одной переменной влияют на другие •7, 8․. Модель строится на основании результатов фактического эксперимента и аналитически описывает зависимость результатов опытов.Определяющим фактором качества керамического материала является единственный показатель –процентное содержание горелых пород в массе. Эксперимент состоял из девяти опытов. В первом опыте независимая переменная Х принимала минимальное значение, равное 0 %. В каждом последующем опыте содержание горелых пород увеличивали, ив последнем опыте Х приняла максимальное значение, равное 50 % (таблица 2).
Таблица 2Составы керамическихмасс
КомпонентыСодержание компонентов, %123456789Межсланцевая глина1008580757065605550Горелые породы01520253035404550
Составы керамических масс готовили пластическим способом формования при влажности шихты 2228 % (в зависимости от содержания горелых пород). Сформованные образцы, высушенные до остаточной влажности не более 8 %, обжигались при температуре 1050°С. Механические показатели керамической массы и образцов приведены в таблица 3.Таблица 3Физические свойстватеплоизоляционного кирпича
ПоказателиСостав123456789Средняя плотность обожженных образцов, кг/м3(Y1)190018501800175016501550142012401100Водопоглощение, % (Y2)10,412,212,813,313,714,215,316,417,2Морозостойкость, циклы (Y3)484340352925221815
При проведении экспериментов такие факторы, как давление прессования и температура обжига не изменяли своих значений. Поэтому влияния на полученные результаты они не оказывали. Таким образом, определяющим фактором качества образца является показатель процентного содержания горелых пород в массе. Регрессивный анализ проводился в два этапа: на первом этапе анализировалось влияние содержания горелых пород на пластичность керамической массы, на втором –влияние содержания горелых пород на прочность при сжатии.Составленное линейное уравнение модели первого порядка имело вид:Y= aX+ b, (1)где, а–коэффициент при независимой переменной X1; b–свободный член регрессии. Для определения коэффициентов был применен метод наименьших квадратов. Расчеты проводились по методикам, приведенным в работах •7, 8․:a= n(xy) –(x)(y)/n(x2) –(x)2 (2)b= (x)(x2) –(x)(xy)/n(x2) –(x2), (3)где n–количество опытов; х–известное содержание горелых пород; y–известные значения функции отклика.При выполнении регрессионного анализа были получены значения коэффициентов аи b, приведенные в таблице 4.Таблица 4 Значение коэффициентов аи bуравнения регрессии
КоэффициентыДля уравнения регрессии по:Средней плотности (Y1)Водопоглощению (Y2)Морозостойкости (Y3)Значение коэффициента а–16,64530,1327–0,7237Значение коэффициента b2065,307310,110651,4637
Модельное уравнение приняло вид:для средней плотности Y1 = –16,6453 X+ 2065.3073,
(4)для водопоглощения Y2= 0,1327X+ 10,1106,
(5)для морозостойкости Y3= –0,7237X+ 51,4637,
(6)где Х–содержание горелых пород, Y–значение соответствующих их величин.Для оценки величины корреляции с моделью определили коэффициент детерминированности (Rквадрат), получаемый при сравнении фактических и предсказанных значений Y. Этот коэффициент при расчетах нормируется от 0 до 1, и в случае если он равен единице, можно сделать вывод, что имеется полная корреляция модели с экспериментом. Значения коэффициентов детерминированности приведены в таблице 5.Таблица 5 Значения величин регрессионного анализа
ЗначенияДля уравнения регрессии по:Средней плотности(Y1)Водопоглощению(Y2)Морозостойкости (Y3)R20,87490,97510,9698Стандартной ошибки106,080,364,63Ошибки для коэффициента а2,380,0080,0483Ошибки для свободного члена b77,280.261,57tкритерия для коэффициента а716,5614,99tкритериядля свободного члена b26,7238,8332,82Нижней границы (95%) для коэффициента а22,270,110,84Верхней границы (95%) для коэффициента а11,020,150,61Нижней границы (95%) для свободного члена b1882,549,4947,76Верхней границы (95%) для свободного члена b2248,0810,7355,17Fнаблюдаемое значение48,97274,18224,84Средний коэффициент эластичности0,30,270,68Средняя ошибка аппроксимации5,471,884,58Границы интервала Y(1447,22;1618,1)(14,07;14,65)(26,57;30,04)Для оценки статистической надежности уравнения регрессии использовали критерий Фишера. Определили наблюдаемое значение Fкритерия по формулеܨ=ܴ21−ܴ2(݊−݉−1)݉где m=1 для парной регрессии (см. таблицу 5). Затем определяли табличное значение по таблицам распределения Фишера для заданного уровня значимости (0,05), принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n–2. В нашем случае Fтабличное равно 5,59•9․. Если фактическое значение Fкритерия меньше табличного, то уравнение в целом статистически незначимо, т.е. делается вывод о возможности случайного характера взаимосвязи между переменными. В противном случае, с вероятностью 0,95 утверждаем, что коэффициент детерминации статистически значим и найденная оценка уравнения регрессии статистически надежна. Таким образом, все уравнения регрессии (4)(5) статистически надежны с вероятностью 0,95. Далее была рассчитана стандартная ошибка, определяемая в простых случаях по формуле:ܵ=√1(−2)·ሼΣ௬2−(Σ௬)2−ሾ(Σ௫௬−Σ௫)(Σ௬)ሿ2ȀΣ௫2−(Σ௫)2ሽ(6)Значения стандартных ошибок по каждому из этапов анализа и для констант уравнений приведены в таблице 5. Более того, рассчитаны границы интервала, в котором будет сосредоточено 95% возможных значений † (для каждого уравнения) при неограниченно большом числе наблюдений. Найдены средний коэффициент эластичности и средняяошибка аппроксимации (см. таблицу 5).Таблица 6 Рассчитанные значения Yи остатки
ОпытДля уравнения регрессии по:Средней плотности (Y1)Водопоглощению (Y2)Морозостойкости (Y3)Предсказанное YОстаткиПредсказанное YОстаткиПредсказанное YОстатки115,36–0,95910,11–0,28951,46–3,46213,510,4912,10,09940,612,39312,890,30512,760,03536,993,01412,280,5213,43–0,12833,371,63511,660,43614,09–0,38729,75–0,75611,050,34614,76–0,55726,13–1,13710,43–0,33215,42–0,11922,51–0,5189,82–0,41216,080,31618,9–0,999,2–0,416,750,45815,28–0,28
В качестве примера приведем алгоритм расчета величин регрессионного анализа для средней плотности, так как он практически идентичен расчету величинрегрессионного анализа для водоплоглощения и морозостойкости.Таблица 7 Зависимость средней плотностиYот количества горелых пород X
i123456789xi01520253035404550yi190018501800175016501550142012401100
Вычислим коэффициентыaиbуравнения линейной регрессии Y= bX+ aпо известным формулам:ܾ=ΣݔΣݕ−݊Σݔݕ(Σݔ)2−݊Σݔ2=−16ǡ6453ܽ=ΣݔΣݕݔ−݊ΣݕΣݔ2(Σݔ)2−݊Σݔ2=2065ǡ3073Сделаем общий чертёж диаграммы рассеяния и графика уравнения регрессии (рисунок 13).
Рис. 1. Зависимость средней плотности изделия от содержания горелых пород
Рис.2.Зависимость водопоглощения изделия от содержания горелых пород
Рис.3.Зависимость морозостойкости изделия от содержания горелых пород
Уравнение регрессии (эмпирическое уравнение регрессии):
y= –16,6453x+ 2065,3073
Эмпирические коэффициенты регрессии aи bявляются лишь оценками теоретических коэффициентова само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Для расчета параметров регрессии построим расчетную таблицу8.Таблица 8 Расчетная таблица параметров регрессии
xyx2y2x·y01900036100000151850225342250027750201800400324000036000251750625306250043750301650900272250049500351550122524025005425040142016002016400568004512402025153760055800501100250012100005500026014260950023224000378850
Параметры уравнения регрессии.
Выборочные средние: ݔ̅=Σ௫=2609=28ǡ89;ݕ̅=Σ௬=142609=1584ǡ44;ݔݕ̅̅̅=Σ௫௬=3788509=42094ǡ44.Выборочные дисперсии: ܵ2(ݔ)=Σ௫2−ݔ2̅̅̅=95009−28ǡ892=220ǡ99;ܵ2(ݕ)=Σ௬2−ݕ2̅̅̅=232240009−1584ǡ442=69980ǡ25.Среднеквадратическое отклонение ܵ(ݔ)=√ܵ2(ݔ)=√220ǡ99=14ǡ87;ܵ(ݕ)=√ܵ2(ݕ)=√69980ǡ25=264ǡ54.Коэффициент корреляции
Ковариация. ܿ(ݔǡݕ)=ݔ·ݕ̅̅̅̅̅̅−ݔ̅·ݕ̅=42094ǡ44−28ǡ89·1584ǡ44=−3678ǡ4Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле: ௫௬=ݔ·ݕ̅̅̅̅̅̅−ݔ̅·ݕ̅ܵ(ݔ)·ܵ(ݕ)=42094ǡ44−28ǡ89·1584ǡ4414ǡ87·264ǡ54=−0ǡ94Линейный коэффициент корреляции принимает значения от –1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0,1 rxy 0,3–слабая; 0,3 rxy 0,5–умеренная;
0,5 rxy 0,7–заметная;
0,7 rxy 0,9–высокая; 0,9 rxy 1–весьма высокая.
В нашем примере связь между признаком Yфактором X весьма высокая и обратная. Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b: ௫௬=ܾܵ(ݔ)ܵ(ݕ)Уравнение регрессии(оценка уравнения регрессии)
ݕ௫=௫௬ݔ−ݔ̅ܵ(ݔ)ܵ(ݕ)+ݕ̅=−0ǡ94ݔ−28ǡ8914ǡ87264ǡ54+1584ǡ44==−16ǡ65ݔ+2065ǡ31Линейное уравнение регрессии имеет вид y= –16,65x+ 2065,31
Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент регрессии b= –16,65показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора хна единицу его измерения. В данном примере с увеличением на 1 единицу yпонижается в среднем на –16,65. Коэффициент a= 2065,31формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями. Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо. Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения. Связь между уи хопределяет знак коэффициента регрессии b(если b 0 –прямая связь, иначе –обратная). В нашем примере связь обратная.Коэффициент эластичности
Коэффициенты регрессии (здесь b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя уи факторного признака х. Для этих целей вычисляются коэффициенты эластичности и бетакоэффициенты. Средний коэффициент эластичности Eпоказывает, на сколько процентов в среднем по совокупности изменится результат уот своей средней величины при изменении фактора xна 1% от своего среднего значения. Коэффициент эластичности находится по формуле: ܧ=ݕݔݔݕ=ܾݔ̅ݕ̅=−16ǡ6528ǡ891584ǡ44=−0ǡ3Коэффициент эластичности меньше 1. Следовательно, при изменении Хна 1%, Yизменится менее чем на 1%. Другими словами –влияние Хна Yне существенно. Бетакоэффициент
Бетакоэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:
β=βܵ(ݔ)ܵ(ݕ)=−16ǡ6514ǡ87264ǡ54=−0ǡ94Т.е. увеличение xна величину среднеквадратического отклонения Sxприведет к уменьшению среднего значения Yна 0,94среднеквадратичного отклонения Sy. Средняя ошибка аппроксимацииОценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации –среднее отклонение расчетных значений от фактических: ̅=Σȁݕ−ݕ௫ȁǣݕ݊100%Ошибка аппроксимации в пределах 57% свидетельствует о хорошем подборе уравнения регрессии к исходным данным. ̅=0ǡ499100%=5ǡ47%Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии. Эмпирическое корреляционное отношение
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах •0;1․. η=√Σ(ݕ̅−ݕ௫)2Σ(ݕ−ݕ̅)2=√551050ǡ29629822ǡ22=0ǡ94где (ݕ̅−ݕ௫)2=629822ǡ22−78771ǡ93=551050ǡ29Индекс корреляции
Для линейной регрессии индекс корреляции равен коэффициенту корреляции
rxy= –0,94. Полученная величина свидетельствует о том, что фактор xсущественно влияет на y.Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции: ܴ=√1−Σ(ݕ−ݕ௫)2Σ(ݕ−ݕ̅)2Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy. В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах •0;1․. Теоретическое корреляционное отношениедля линейной связи равно коэффициенту корреляции rxy. Коэффициент детерминации
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах:
R2= –0,942= 0,8749, т.е. в 87,49% случаев изменения хприводят к изменению y. Другими словами,точность подбора уравнения регрессии –высокая. Остальные 12,51% изменения Yобъясняются факторами, не учтенными в модели.
Для оценки качества параметров регрессии построим расчетную таблицу9.
Таблица 9 Расчетная таблица оценки качества параметров регрессии
xyy(x)(yi–ycp)2(y–y(x))2(xi–xcp)2|y–yx|:y019002065,3199575,3127326,49834,570,0871518501815,6370519,751181,4192,90,01862018001732,446464,24569,4679,010,03762517501649,1827408,6410165,4815,120,05763016501565,954297,537064,451,230,05093515501482,721186,424526,1337,350,04344014201399,527041,98420,36123,460,01444512401316,27118641,985817,26259,570,06155011001233,04234686,4217700,89445,680,122601426014260629822,2278771,931988,890,49
Значимость коэффициента корреляции
Для того чтобы приуровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1≠ 0, надо вычислить наблюдаемое значение критерия набл=௫௬√݊−2√1−௫௬2и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k= n–2 найти критическую точку tкритдвусторонней критической области. Если tнаблtкрит, нет оснований отвергнуть нулевую гипотезу. Если ⁃tнабл| tкрит–нулевую гипотезу отвергают. набл=0ǡ94√7√1−0ǡ942=7ǡ29По таблице Стьюдента с уровнем значимости α=0,05 и степенями свободы k=7 находим tкрит: tкрит(n–m–1;α/2) = (7;0,025) = 2,365 где m= 1 –количество объясняющих переменных. Если tнабл tкрит, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). Поскольку tнабл tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически значим.
В парной линейной регрессии t2r= t2bи тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии. Интервальная оценка для коэффициента корреляции (доверительный интервал)
(−крит1−2√݊Ǣ+крит1−2√݊)Доверительный интервал для коэффициента корреляции (0ǡ94−2ǡ3651−0ǡ942√9Ǣ0ǡ94+2ǡ3651−0ǡ942√9)r(0,85;1,03)Анализ точности определения оценок коэффициентов регрессии
Несмещенной оценкой дисперсии возмущений является величина: ܵ௬2=Σ(ݕ−ݕ௫)2݊−݉−1=78771ǡ937=11253ǡ13S2y= 11253,13–необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии). ܵ௬=√ܵ௬2=√11253ǡ13=106ǡ08
Sy= 106,08–стандартная ошибка оценки (стандартная ошибка регрессии). Sa–стандартное отклонение случайной величины a. ܵ=ܵ௬√Σx2݊ܵ(ݔ)=106ǡ08√95009·14ǡ87=77ǡ28Sb–стандартное отклонение случайной величины b. ܵ=ܵ௬√݊ܵ(ݔ)=106ǡ08√9·14ǡ87=2ǡ38Доверительные интервалы для зависимой переменной
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя. (a+ bxp± ε) где ε=критܵ௬√1݊+(ݔ̅−ݔр)2Σ(ݔ−ݔ̅)2tкрит(n–m–1;α/2) = (7; 0,025) = 2,365
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Yпри неограниченно большом числе наблюдений и Xp= 32 ε=2ǡ365·106ǡ08√19+(28ǡ89−32)21988ǡ89=85ǡ44(2065,31–16,65·32 ± 85,44)(1447,22;1618,1)С вероятностью 95% можно гарантировать, что значения Yпри неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. Индивидуальные доверительные интервалы для † при данном значении ‟
(a+ bxi± ε) где ε=критܵ௬√1+1݊+(ݔ̅−ݔ)2Σ(ݔ−ݔ̅)2=2ǡ365·106ǡ08√1+19+(28ǡ89−ݔ)21988ǡ89tкрит(n–m–1; α/2) = (7; 0,025) = 2,365Таблица 10 Индивидуальные доверительные интервалы для † при данном значении ‟
xiy= 2065,31–16,65xiεiymin= y–εiymax= y+ εi02065,31310,41754,912375,7151815,63275,751539,882091,38201732,4269,141463,262001,54251649,18265,361383,821914,53301565,95264,531301,421830,48
351482,72266,681216,051749,4401399,5271,741127,761671,24451316,27279,551036,721595,82
С вероятностью 95% можно гарантировать, что значения Yпри неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) tстатистика. Критерий Стьюдента. Спомощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений xи y). Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются tкритерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0о случайной природе показателей, т.е. о незначимом их отличии от нуля. Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности,используют статистические методы проверки гипотез. В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности. Проверим гипотезу H0о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1неравно) на уровне значимости α=0,05. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется tкритерий Стьюдента. Найденное по данным наблюдений значение tкритерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения. Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессииравно (n–2), n–число наблюдений. Если фактическое значение tкритерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1–α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля. Если фактическое значение tкритерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимостиα. tкрит(n–m–1; α/2) = (7; 0,025) = 2,365=ܾܵ=Ȃ16ǡ652ǡ38=7Поскольку 7 2,365, то статистическая значимость коэффициента регрессии bподтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). =ܾܵ=2065ǡ3177ǡ28=26ǡ72Поскольку 26,72 2,365, то статистическая значимость коэффициента регрессии aподтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Верхний и нижний границы для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими: (b–tкритSb; b+ tкритSb) (–16,65–2,365·2,38; –16,65+ 2,365·2,38) (–22,27;–11,02) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. (a–tкритSa; a+ tкритSa) (2065,31–2,365·77,28; 2065,31 + 2,365·77,28) (1882,54;2248,08) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. 2) Fстатистика. Критерий Фишера. Коэффициент детерминации R2используется для проверки существенности уравнения линейной регрессии в целом. Проверка значимости модели регрессии проводится с использованием Fкритерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели. Если расчетное значение с k1=(m) и k2=(n–m–1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой. ܴ2=1−Σ(ݕ−ݕ௫)2Σ(ݕ−ݕ̅)2=1−78771ǡ93629822ǡ22=0ǡ8749
где m–число факторов в модели. Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму: 1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо,H0: R2=0 на уровне значимости α. 2. Далее определяют фактическое значение Fкритерия:ܨ=ܴ21−ܴ2(݊−݉−1)݉=0ǡ87491−(9−1−1)1=48ǡ97(ܨнабл)где m=1 для парной регрессии. 3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n–2. Fтабл–это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α –вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01. 4. Если фактическое значение Fкритерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1–α) принимается альтернативная гипотеза о статистической значимости уравнения в целом. Табличное значение критерия со степенями свободы k1=1 и k2=7, Fтабл=5,59.
Поскольку фактическое значение F Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Связь между Fкритерием Фишера и ※статистикой Стьюдента выражается равенством: 2=2=√ܨТаблица 11Показатели качества уравнения регрессии
ПоказательЗначениепоказателей по Средней плотностиВодопоглощениюМорозостойкостиКоэффициент детерминации0,870,980,97Средний коэффициент эластичности–0,30,27–0,68Средняяошибка аппроксимации5,471,884,58
Выводы 1. Исследована зависимость между содержанием в керамических образцах на основе межсланцевой глины отощающейи выгорающей добавки в виде горелых пород и основных физических свойств теплоизоляционного кирпича методом линейной регрессии. 2. Модель зависимости строится на основании результатов фактического эксперимента и аналитически описывает зависимость результатов опытов.3. Приведенный регрессионный анализ позволяет получить математические модели, делающие возможным предсказание свойств керамических масс в точках, не вошедших в серию эксперимента, а также определить область оптимальных с точки зрения использования отходов топливноэнергетического комплекса.
Ссылки на источники1. Донской С.Е. О механизмах ликвидации экологического ущерба, связанного с прошлой деятельностью // Экология производства. –2013. –№ 3. –С. 311.2. Абдрахимова Е.С., Абдрахимов В.З.Использование нефтяного кека в производстве теплоизоляционных материалов на основе жидкостекольных композиций // Промышленный сервис. –2012. –№ 2. –С. 3639.3. Абдрахимов В.З., Хасаев Г.Р., Колпаков А.В., Абдрахимова Е.С. Использование углеродосодержащих отходов топливноэнергетического комплекса в производстве керамических материалов различного назначения // Экология и промышленность России. –2013. –№ 9. –С. 3033.4. АбдрахимовВ.З, Колпаков А.В.Исследование тепломассообменных процессов при обжиге легковесного кирпича на основе межсланцевой глины и нефтяного кека // Огнеупоры и техническая керамика. –2011. –№ 1112. –С. 2428.5. АбдрахимовВ.З., Белякова Е.А., Денисов Д.Ю.Экспериментальное исследование теплопроводности легковесного кирпича наоснове бейделлитовой глины и горелых пород // Огнеупоры и техническая керамика. –2010. –№ 1112. –С. 4952.6. АбдрахимовВ.З., Рощупкина И.Ю., Абдрахимова Е.С., Колпаков А.В. Использование отходов горючих сланцев в производстве теплоизоляционных материалов без применения природного сырья // Экология и промышленность России. –2012. –№ 3. –С. 2831.7. АбдрахимовВ.З. Оптимизация состава керамических масс по физикомеханическим свойствам // Известия вузов. Строительство. –2003. –№ 1. –С. 4547.8. КовковИ.В.,Абдрахимов В.З.Исследование регрессивным методом анализа влиянияшлака от выплавки ферросплава на физикомеханические показатели кирпича // Известия вузов. Строительство. –2006. –№9. –С. 1051109. АбдрахимоваЕ.С., Бердов Г.И.Оптимизациясостава керамических масс по физикомеханическим свойствам кислотоупорной // Известия вузов. Строительство. –2000. –№ 12. –С. 5458.
Колпаков Александр Викторович,старший преподаватель «Самарского государственного экономического университета», г. Самараroland.alex@mail.ru
Кайракбаев Аят Крымович,кандидат физикоматематических наук, доцент «Казахскорусского международного университета», Казахстан, г. Актобеkairak@mail.ru
Исследование физических свойств теплоизоляционного кирпича методом линейной регрессии
Аннотация.Исследована зависимость между содержанием в керамических образцах на основе межсланцевой глины отощающей ивыгорающей добавки в виде горелых пород и основных физических свойств керамического теплоизоляционного кирпича(средняя плотность, водопоглощение, морозостойкость)методом линейной регрессии. Модель зависимости строится на основании результатов фактического эксперимента и аналитически описывает зависимость результатов опытов.Ключевые слова:межсланцевая глина, горелые породы, теплоизоляционный кирпич, метод линейной регрессии, средняя плотность, водопоглощение, морозостойкость.
По данным Министерства природных ресурсов, в России накоплено больше 31 млрд. отходов, связанных с прошлой экономической деятельностью •1․.Печальным следствием всего этого становится неизменное ухудшение экологической обстановки, снижение качества жизни человека.Несмотря на то, что технологии топливноэнергетического комплекса постоянно совершенствуются, они пока не достигли уровня безотходного производства •2․. Учитывая большое количество отходов, образующихся на предприятиях топливноэнергетического комплекса, и негативное влияние их на биосферу, разработка новых методов утилизации отходов является актуальной задачей. Большие возможности утилизации отходов имеются у предприятий по производству теплоизоляционных материалов •3․. Это объясняется многотонажностью и материалоемкостью производства строительного комплекса, а также широкой номенклатурой выпускаемых изделий.В работах •46․ была показана принципиальная возможность использования в производстве керамических материалов отходов при добыче горючих сланцев:межсланцевой глины и горелых пород, химический состав которых представлен в таблице 1.
Таблица 1 Химический состав исследуемых компонентов
КомпонентСодержание оксидов, мас. %SiO2Al2O3+TiO2Fe2O3CaOMgOR2OSO3п.п.п.Межсланцевая глина45471314561113233412920Горелые породы394012137817181212451415
В качестве глинистого компонента для производства керамических материалов в данной работе использовалась межсланцевая глина •4․, которая образуется при добыче горючих сланцев на сланцеперерабатывающих заводах и является отходом. По числу пластичности межсланцевая глина относится к высокопластичному глинистому сырью (число пластичности 2732) с истинной плотностью 2,552,62 г/см3. Минералогический состав межслацевых глин разнообразен, однако общим для них является наличие кремнезема, гидрослюды, монтмориллонита и кальцита.Для производства керамических теплоизоляционных материалов в качестве отощителя и выгорающей добавки нами использовались горелые породы •5, 6], химический состав которых представлен в таблице 1.Образуются горелые породы в местах добычи сланцев. По основным физическим и химическим свойствам они близки к глинам, обожженным при 8001000°С.Горелые породы, хотя и является отходами производства, но по химическому составу идентичны алюмосиликатному природному сырью для производства стеновых керамических материалов, что позволяет использовать их в производстве легковесного кирпича как основного компонента шихты.Повышенные содержания в горелых породах: 1) органических веществ способствует обжигу кирпича;
2) оксидов железа и кальция спеканию при относительно невысоких температурах (10001050°С); 3) оксида алюминия повышению прочности и морозостойкости.При исследовании зависимости между содержанием горелых пород и основными физическимихарактеристиками керамического теплоизоляционного кирпича(средняя плотность, водопоглощение, морозостойкость)использовался достаточно распространенный метод линейной регрессии. Этот метод позволяет выявить, как изменения одной переменной влияют на другие •7, 8․. Модель строится на основании результатов фактического эксперимента и аналитически описывает зависимость результатов опытов.Определяющим фактором качества керамического материала является единственный показатель –процентное содержание горелых пород в массе. Эксперимент состоял из девяти опытов. В первом опыте независимая переменная Х принимала минимальное значение, равное 0 %. В каждом последующем опыте содержание горелых пород увеличивали, ив последнем опыте Х приняла максимальное значение, равное 50 % (таблица 2).
Таблица 2Составы керамическихмасс
КомпонентыСодержание компонентов, %123456789Межсланцевая глина1008580757065605550Горелые породы01520253035404550
Составы керамических масс готовили пластическим способом формования при влажности шихты 2228 % (в зависимости от содержания горелых пород). Сформованные образцы, высушенные до остаточной влажности не более 8 %, обжигались при температуре 1050°С. Механические показатели керамической массы и образцов приведены в таблица 3.Таблица 3Физические свойстватеплоизоляционного кирпича
ПоказателиСостав123456789Средняя плотность обожженных образцов, кг/м3(Y1)190018501800175016501550142012401100Водопоглощение, % (Y2)10,412,212,813,313,714,215,316,417,2Морозостойкость, циклы (Y3)484340352925221815
При проведении экспериментов такие факторы, как давление прессования и температура обжига не изменяли своих значений. Поэтому влияния на полученные результаты они не оказывали. Таким образом, определяющим фактором качества образца является показатель процентного содержания горелых пород в массе. Регрессивный анализ проводился в два этапа: на первом этапе анализировалось влияние содержания горелых пород на пластичность керамической массы, на втором –влияние содержания горелых пород на прочность при сжатии.Составленное линейное уравнение модели первого порядка имело вид:Y= aX+ b, (1)где, а–коэффициент при независимой переменной X1; b–свободный член регрессии. Для определения коэффициентов был применен метод наименьших квадратов. Расчеты проводились по методикам, приведенным в работах •7, 8․:a= n(xy) –(x)(y)/n(x2) –(x)2 (2)b= (x)(x2) –(x)(xy)/n(x2) –(x2), (3)где n–количество опытов; х–известное содержание горелых пород; y–известные значения функции отклика.При выполнении регрессионного анализа были получены значения коэффициентов аи b, приведенные в таблице 4.Таблица 4 Значение коэффициентов аи bуравнения регрессии
КоэффициентыДля уравнения регрессии по:Средней плотности (Y1)Водопоглощению (Y2)Морозостойкости (Y3)Значение коэффициента а–16,64530,1327–0,7237Значение коэффициента b2065,307310,110651,4637
Модельное уравнение приняло вид:для средней плотности Y1 = –16,6453 X+ 2065.3073,
(4)для водопоглощения Y2= 0,1327X+ 10,1106,
(5)для морозостойкости Y3= –0,7237X+ 51,4637,
(6)где Х–содержание горелых пород, Y–значение соответствующих их величин.Для оценки величины корреляции с моделью определили коэффициент детерминированности (Rквадрат), получаемый при сравнении фактических и предсказанных значений Y. Этот коэффициент при расчетах нормируется от 0 до 1, и в случае если он равен единице, можно сделать вывод, что имеется полная корреляция модели с экспериментом. Значения коэффициентов детерминированности приведены в таблице 5.Таблица 5 Значения величин регрессионного анализа
ЗначенияДля уравнения регрессии по:Средней плотности(Y1)Водопоглощению(Y2)Морозостойкости (Y3)R20,87490,97510,9698Стандартной ошибки106,080,364,63Ошибки для коэффициента а2,380,0080,0483Ошибки для свободного члена b77,280.261,57tкритерия для коэффициента а716,5614,99tкритериядля свободного члена b26,7238,8332,82Нижней границы (95%) для коэффициента а22,270,110,84Верхней границы (95%) для коэффициента а11,020,150,61Нижней границы (95%) для свободного члена b1882,549,4947,76Верхней границы (95%) для свободного члена b2248,0810,7355,17Fнаблюдаемое значение48,97274,18224,84Средний коэффициент эластичности0,30,270,68Средняя ошибка аппроксимации5,471,884,58Границы интервала Y(1447,22;1618,1)(14,07;14,65)(26,57;30,04)Для оценки статистической надежности уравнения регрессии использовали критерий Фишера. Определили наблюдаемое значение Fкритерия по формулеܨ=ܴ21−ܴ2(݊−݉−1)݉где m=1 для парной регрессии (см. таблицу 5). Затем определяли табличное значение по таблицам распределения Фишера для заданного уровня значимости (0,05), принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n–2. В нашем случае Fтабличное равно 5,59•9․. Если фактическое значение Fкритерия меньше табличного, то уравнение в целом статистически незначимо, т.е. делается вывод о возможности случайного характера взаимосвязи между переменными. В противном случае, с вероятностью 0,95 утверждаем, что коэффициент детерминации статистически значим и найденная оценка уравнения регрессии статистически надежна. Таким образом, все уравнения регрессии (4)(5) статистически надежны с вероятностью 0,95. Далее была рассчитана стандартная ошибка, определяемая в простых случаях по формуле:ܵ=√1(−2)·ሼΣ௬2−(Σ௬)2−ሾ(Σ௫௬−Σ௫)(Σ௬)ሿ2ȀΣ௫2−(Σ௫)2ሽ(6)Значения стандартных ошибок по каждому из этапов анализа и для констант уравнений приведены в таблице 5. Более того, рассчитаны границы интервала, в котором будет сосредоточено 95% возможных значений † (для каждого уравнения) при неограниченно большом числе наблюдений. Найдены средний коэффициент эластичности и средняяошибка аппроксимации (см. таблицу 5).Таблица 6 Рассчитанные значения Yи остатки
ОпытДля уравнения регрессии по:Средней плотности (Y1)Водопоглощению (Y2)Морозостойкости (Y3)Предсказанное YОстаткиПредсказанное YОстаткиПредсказанное YОстатки115,36–0,95910,11–0,28951,46–3,46213,510,4912,10,09940,612,39312,890,30512,760,03536,993,01412,280,5213,43–0,12833,371,63511,660,43614,09–0,38729,75–0,75611,050,34614,76–0,55726,13–1,13710,43–0,33215,42–0,11922,51–0,5189,82–0,41216,080,31618,9–0,999,2–0,416,750,45815,28–0,28
В качестве примера приведем алгоритм расчета величин регрессионного анализа для средней плотности, так как он практически идентичен расчету величинрегрессионного анализа для водоплоглощения и морозостойкости.Таблица 7 Зависимость средней плотностиYот количества горелых пород X
i123456789xi01520253035404550yi190018501800175016501550142012401100
Вычислим коэффициентыaиbуравнения линейной регрессии Y= bX+ aпо известным формулам:ܾ=ΣݔΣݕ−݊Σݔݕ(Σݔ)2−݊Σݔ2=−16ǡ6453ܽ=ΣݔΣݕݔ−݊ΣݕΣݔ2(Σݔ)2−݊Σݔ2=2065ǡ3073Сделаем общий чертёж диаграммы рассеяния и графика уравнения регрессии (рисунок 13).
Рис. 1. Зависимость средней плотности изделия от содержания горелых пород
Рис.2.Зависимость водопоглощения изделия от содержания горелых пород
Рис.3.Зависимость морозостойкости изделия от содержания горелых пород
Уравнение регрессии (эмпирическое уравнение регрессии):
y= –16,6453x+ 2065,3073
Эмпирические коэффициенты регрессии aи bявляются лишь оценками теоретических коэффициентова само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных. Для расчета параметров регрессии построим расчетную таблицу8.Таблица 8 Расчетная таблица параметров регрессии
xyx2y2x·y01900036100000151850225342250027750201800400324000036000251750625306250043750301650900272250049500351550122524025005425040142016002016400568004512402025153760055800501100250012100005500026014260950023224000378850
Параметры уравнения регрессии.
Выборочные средние: ݔ̅=Σ௫=2609=28ǡ89;ݕ̅=Σ௬=142609=1584ǡ44;ݔݕ̅̅̅=Σ௫௬=3788509=42094ǡ44.Выборочные дисперсии: ܵ2(ݔ)=Σ௫2−ݔ2̅̅̅=95009−28ǡ892=220ǡ99;ܵ2(ݕ)=Σ௬2−ݕ2̅̅̅=232240009−1584ǡ442=69980ǡ25.Среднеквадратическое отклонение ܵ(ݔ)=√ܵ2(ݔ)=√220ǡ99=14ǡ87;ܵ(ݕ)=√ܵ2(ݕ)=√69980ǡ25=264ǡ54.Коэффициент корреляции
Ковариация. ܿ(ݔǡݕ)=ݔ·ݕ̅̅̅̅̅̅−ݔ̅·ݕ̅=42094ǡ44−28ǡ89·1584ǡ44=−3678ǡ4Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле: ௫௬=ݔ·ݕ̅̅̅̅̅̅−ݔ̅·ݕ̅ܵ(ݔ)·ܵ(ݕ)=42094ǡ44−28ǡ89·1584ǡ4414ǡ87·264ǡ54=−0ǡ94Линейный коэффициент корреляции принимает значения от –1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0,1 rxy 0,3–слабая; 0,3 rxy 0,5–умеренная;
0,5 rxy 0,7–заметная;
0,7 rxy 0,9–высокая; 0,9 rxy 1–весьма высокая.
В нашем примере связь между признаком Yфактором X весьма высокая и обратная. Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b: ௫௬=ܾܵ(ݔ)ܵ(ݕ)Уравнение регрессии(оценка уравнения регрессии)
ݕ௫=௫௬ݔ−ݔ̅ܵ(ݔ)ܵ(ݕ)+ݕ̅=−0ǡ94ݔ−28ǡ8914ǡ87264ǡ54+1584ǡ44==−16ǡ65ݔ+2065ǡ31Линейное уравнение регрессии имеет вид y= –16,65x+ 2065,31
Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент регрессии b= –16,65показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора хна единицу его измерения. В данном примере с увеличением на 1 единицу yпонижается в среднем на –16,65. Коэффициент a= 2065,31формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями. Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо. Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения. Связь между уи хопределяет знак коэффициента регрессии b(если b 0 –прямая связь, иначе –обратная). В нашем примере связь обратная.Коэффициент эластичности
Коэффициенты регрессии (здесь b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя уи факторного признака х. Для этих целей вычисляются коэффициенты эластичности и бетакоэффициенты. Средний коэффициент эластичности Eпоказывает, на сколько процентов в среднем по совокупности изменится результат уот своей средней величины при изменении фактора xна 1% от своего среднего значения. Коэффициент эластичности находится по формуле: ܧ=ݕݔݔݕ=ܾݔ̅ݕ̅=−16ǡ6528ǡ891584ǡ44=−0ǡ3Коэффициент эластичности меньше 1. Следовательно, при изменении Хна 1%, Yизменится менее чем на 1%. Другими словами –влияние Хна Yне существенно. Бетакоэффициент
Бетакоэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:
β=βܵ(ݔ)ܵ(ݕ)=−16ǡ6514ǡ87264ǡ54=−0ǡ94Т.е. увеличение xна величину среднеквадратического отклонения Sxприведет к уменьшению среднего значения Yна 0,94среднеквадратичного отклонения Sy. Средняя ошибка аппроксимацииОценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации –среднее отклонение расчетных значений от фактических: ̅=Σȁݕ−ݕ௫ȁǣݕ݊100%Ошибка аппроксимации в пределах 57% свидетельствует о хорошем подборе уравнения регрессии к исходным данным. ̅=0ǡ499100%=5ǡ47%Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии. Эмпирическое корреляционное отношение
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах •0;1․. η=√Σ(ݕ̅−ݕ௫)2Σ(ݕ−ݕ̅)2=√551050ǡ29629822ǡ22=0ǡ94где (ݕ̅−ݕ௫)2=629822ǡ22−78771ǡ93=551050ǡ29Индекс корреляции
Для линейной регрессии индекс корреляции равен коэффициенту корреляции
rxy= –0,94. Полученная величина свидетельствует о том, что фактор xсущественно влияет на y.Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции: ܴ=√1−Σ(ݕ−ݕ௫)2Σ(ݕ−ݕ̅)2Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy. В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах •0;1․. Теоретическое корреляционное отношениедля линейной связи равно коэффициенту корреляции rxy. Коэффициент детерминации
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах:
R2= –0,942= 0,8749, т.е. в 87,49% случаев изменения хприводят к изменению y. Другими словами,точность подбора уравнения регрессии –высокая. Остальные 12,51% изменения Yобъясняются факторами, не учтенными в модели.
Для оценки качества параметров регрессии построим расчетную таблицу9.
Таблица 9 Расчетная таблица оценки качества параметров регрессии
xyy(x)(yi–ycp)2(y–y(x))2(xi–xcp)2|y–yx|:y019002065,3199575,3127326,49834,570,0871518501815,6370519,751181,4192,90,01862018001732,446464,24569,4679,010,03762517501649,1827408,6410165,4815,120,05763016501565,954297,537064,451,230,05093515501482,721186,424526,1337,350,04344014201399,527041,98420,36123,460,01444512401316,27118641,985817,26259,570,06155011001233,04234686,4217700,89445,680,122601426014260629822,2278771,931988,890,49
Значимость коэффициента корреляции
Для того чтобы приуровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1≠ 0, надо вычислить наблюдаемое значение критерия набл=௫௬√݊−2√1−௫௬2и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k= n–2 найти критическую точку tкритдвусторонней критической области. Если tнаблtкрит, нет оснований отвергнуть нулевую гипотезу. Если ⁃tнабл| tкрит–нулевую гипотезу отвергают. набл=0ǡ94√7√1−0ǡ942=7ǡ29По таблице Стьюдента с уровнем значимости α=0,05 и степенями свободы k=7 находим tкрит: tкрит(n–m–1;α/2) = (7;0,025) = 2,365 где m= 1 –количество объясняющих переменных. Если tнабл tкрит, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается). Поскольку tнабл tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически значим.
В парной линейной регрессии t2r= t2bи тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии. Интервальная оценка для коэффициента корреляции (доверительный интервал)
(−крит1−2√݊Ǣ+крит1−2√݊)Доверительный интервал для коэффициента корреляции (0ǡ94−2ǡ3651−0ǡ942√9Ǣ0ǡ94+2ǡ3651−0ǡ942√9)r(0,85;1,03)Анализ точности определения оценок коэффициентов регрессии
Несмещенной оценкой дисперсии возмущений является величина: ܵ௬2=Σ(ݕ−ݕ௫)2݊−݉−1=78771ǡ937=11253ǡ13S2y= 11253,13–необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии). ܵ௬=√ܵ௬2=√11253ǡ13=106ǡ08
Sy= 106,08–стандартная ошибка оценки (стандартная ошибка регрессии). Sa–стандартное отклонение случайной величины a. ܵ=ܵ௬√Σx2݊ܵ(ݔ)=106ǡ08√95009·14ǡ87=77ǡ28Sb–стандартное отклонение случайной величины b. ܵ=ܵ௬√݊ܵ(ݔ)=106ǡ08√9·14ǡ87=2ǡ38Доверительные интервалы для зависимой переменной
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя. (a+ bxp± ε) где ε=критܵ௬√1݊+(ݔ̅−ݔр)2Σ(ݔ−ݔ̅)2tкрит(n–m–1;α/2) = (7; 0,025) = 2,365
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Yпри неограниченно большом числе наблюдений и Xp= 32 ε=2ǡ365·106ǡ08√19+(28ǡ89−32)21988ǡ89=85ǡ44(2065,31–16,65·32 ± 85,44)(1447,22;1618,1)С вероятностью 95% можно гарантировать, что значения Yпри неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. Индивидуальные доверительные интервалы для † при данном значении ‟
(a+ bxi± ε) где ε=критܵ௬√1+1݊+(ݔ̅−ݔ)2Σ(ݔ−ݔ̅)2=2ǡ365·106ǡ08√1+19+(28ǡ89−ݔ)21988ǡ89tкрит(n–m–1; α/2) = (7; 0,025) = 2,365Таблица 10 Индивидуальные доверительные интервалы для † при данном значении ‟
xiy= 2065,31–16,65xiεiymin= y–εiymax= y+ εi02065,31310,41754,912375,7151815,63275,751539,882091,38201732,4269,141463,262001,54251649,18265,361383,821914,53301565,95264,531301,421830,48
351482,72266,681216,051749,4401399,5271,741127,761671,24451316,27279,551036,721595,82
С вероятностью 95% можно гарантировать, что значения Yпри неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов. Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) tстатистика. Критерий Стьюдента. Спомощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений xи y). Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются tкритерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0о случайной природе показателей, т.е. о незначимом их отличии от нуля. Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности,используют статистические методы проверки гипотез. В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности. Проверим гипотезу H0о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1неравно) на уровне значимости α=0,05. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется tкритерий Стьюдента. Найденное по данным наблюдений значение tкритерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения. Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессииравно (n–2), n–число наблюдений. Если фактическое значение tкритерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1–α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля. Если фактическое значение tкритерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимостиα. tкрит(n–m–1; α/2) = (7; 0,025) = 2,365=ܾܵ=Ȃ16ǡ652ǡ38=7Поскольку 7 2,365, то статистическая значимость коэффициента регрессии bподтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента). =ܾܵ=2065ǡ3177ǡ28=26ǡ72Поскольку 26,72 2,365, то статистическая значимость коэффициента регрессии aподтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Верхний и нижний границы для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими: (b–tкритSb; b+ tкритSb) (–16,65–2,365·2,38; –16,65+ 2,365·2,38) (–22,27;–11,02) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. (a–tкритSa; a+ tкритSa) (2065,31–2,365·77,28; 2065,31 + 2,365·77,28) (1882,54;2248,08) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. 2) Fстатистика. Критерий Фишера. Коэффициент детерминации R2используется для проверки существенности уравнения линейной регрессии в целом. Проверка значимости модели регрессии проводится с использованием Fкритерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели. Если расчетное значение с k1=(m) и k2=(n–m–1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой. ܴ2=1−Σ(ݕ−ݕ௫)2Σ(ݕ−ݕ̅)2=1−78771ǡ93629822ǡ22=0ǡ8749
где m–число факторов в модели. Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму: 1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо,H0: R2=0 на уровне значимости α. 2. Далее определяют фактическое значение Fкритерия:ܨ=ܴ21−ܴ2(݊−݉−1)݉=0ǡ87491−(9−1−1)1=48ǡ97(ܨнабл)где m=1 для парной регрессии. 3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n–2. Fтабл–это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α –вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01. 4. Если фактическое значение Fкритерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1–α) принимается альтернативная гипотеза о статистической значимости уравнения в целом. Табличное значение критерия со степенями свободы k1=1 и k2=7, Fтабл=5,59.
Поскольку фактическое значение F Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Связь между Fкритерием Фишера и ※статистикой Стьюдента выражается равенством: 2=2=√ܨТаблица 11Показатели качества уравнения регрессии
ПоказательЗначениепоказателей по Средней плотностиВодопоглощениюМорозостойкостиКоэффициент детерминации0,870,980,97Средний коэффициент эластичности–0,30,27–0,68Средняяошибка аппроксимации5,471,884,58
Выводы 1. Исследована зависимость между содержанием в керамических образцах на основе межсланцевой глины отощающейи выгорающей добавки в виде горелых пород и основных физических свойств теплоизоляционного кирпича методом линейной регрессии. 2. Модель зависимости строится на основании результатов фактического эксперимента и аналитически описывает зависимость результатов опытов.3. Приведенный регрессионный анализ позволяет получить математические модели, делающие возможным предсказание свойств керамических масс в точках, не вошедших в серию эксперимента, а также определить область оптимальных с точки зрения использования отходов топливноэнергетического комплекса.
Ссылки на источники1. Донской С.Е. О механизмах ликвидации экологического ущерба, связанного с прошлой деятельностью // Экология производства. –2013. –№ 3. –С. 311.2. Абдрахимова Е.С., Абдрахимов В.З.Использование нефтяного кека в производстве теплоизоляционных материалов на основе жидкостекольных композиций // Промышленный сервис. –2012. –№ 2. –С. 3639.3. Абдрахимов В.З., Хасаев Г.Р., Колпаков А.В., Абдрахимова Е.С. Использование углеродосодержащих отходов топливноэнергетического комплекса в производстве керамических материалов различного назначения // Экология и промышленность России. –2013. –№ 9. –С. 3033.4. АбдрахимовВ.З, Колпаков А.В.Исследование тепломассообменных процессов при обжиге легковесного кирпича на основе межсланцевой глины и нефтяного кека // Огнеупоры и техническая керамика. –2011. –№ 1112. –С. 2428.5. АбдрахимовВ.З., Белякова Е.А., Денисов Д.Ю.Экспериментальное исследование теплопроводности легковесного кирпича наоснове бейделлитовой глины и горелых пород // Огнеупоры и техническая керамика. –2010. –№ 1112. –С. 4952.6. АбдрахимовВ.З., Рощупкина И.Ю., Абдрахимова Е.С., Колпаков А.В. Использование отходов горючих сланцев в производстве теплоизоляционных материалов без применения природного сырья // Экология и промышленность России. –2012. –№ 3. –С. 2831.7. АбдрахимовВ.З. Оптимизация состава керамических масс по физикомеханическим свойствам // Известия вузов. Строительство. –2003. –№ 1. –С. 4547.8. КовковИ.В.,Абдрахимов В.З.Исследование регрессивным методом анализа влиянияшлака от выплавки ферросплава на физикомеханические показатели кирпича // Известия вузов. Строительство. –2006. –№9. –С. 1051109. АбдрахимоваЕ.С., Бердов Г.И.Оптимизациясостава керамических масс по физикомеханическим свойствам кислотоупорной // Известия вузов. Строительство. –2000. –№ 12. –С. 5458.