Алгоритм и программа обработки массивов непрерывных данных о состоянии образовательных систем методом планирования эксперимента

Выпуск: Приложение 13. «Современные научные исследования. Выпуск 3»

ART 85122

Автор:

Библиографическое описание статьи для цитирования:

Степаньян В. В. Алгоритм и программа обработки массивов непрерывных данных о состоянии образовательных систем методом планирования эксперимента // Научно-методический электронный журнал «Концепт». – 2015. – Т. 13. – С. 606–610. – URL: http://e-koncept.ru/2015/85122.htm.

Аннотация. При исследовании сложных многофакторных процессов, в которых на главный выходной параметр влияет множество факторов, применяется теория планирования эксперимента. При этом значения факторов задаются фиксировано в обе стороны от номинального значения с определенным интервалом варьирования. Предлагаются алгоритм и программа обработки массивов факторов с любыми отклонениями от номинала, полученными в ходе эксперимента. В основу положены оригинальные подходы, разработанные ранее. Указанная программа может быть использована при оптимизации физических, технических, экономических и социальных процессов.

Ключевые слова: качество, функция, алгоритм, вычисление, коэффициент, матрица, уровень регрессии, газ

Текст статьи

Степаньян Владимир Владимирович,студент экономикотехнологического факультета НОУ ВПО «Международный инновационный университет», г. Сочиstep.wo@mail.ru

Алгоритм и программа обработки массивов ненормированныхданных

о состоянии образовательных систем методом планирования эксперимента

Аннотация.При исследовании сложных многофакторных процессов, в которых на главный выходной параметр влияет множество факторов, применяется теория планирования эксперимента. При этом значения факторов задаются фиксированов обе стороны от номинального значения с определенным интервалом варьирования.Предлагается алгоритм и программа обработки массивов факторов с любыми отклонениями от номинала, полученными в ходе эксперимента. В основу положены оригинальные подходы, разработанные ранее. Указанная программа может быть использована при оптимизации физических, технических, экономических и социальных процессов.Ключевые слова: Алгоритм,Вычисление, коэффициент, матрица, функция, уровень регрессии, качество, газ

При исследовании физических, технических, экономических и социальных процессовсуществует проблема обработки массивов,размеры которыхмогут превышатьдесятки тысяч строк. Обработка таких массивоввручную, с использованием известных пакетов прикладных программ ППП, например MathCAD,практически невозможна, так как из этого огромного количества строк необходимо реализовать полный факторный эксперимент. Даже массив состоящий из тысячи строкможет обрабатываться вручную несколько дней.Для того, чтобы решить данную проблему намибыла разработана программа статистической обработки массивов непрерывных данныхметодом планирования эксперимента[1,2].Алгоритм работы программысодержит четыре основных этапа и представлен на рисунке 1.На первом этапе отсеиваются все значения факторов не входящих в нормальный закон.Это позволяет исключить из статистического ряда грубые ошибки,за счет чего размер массива значительно сокращается.На втором этапе производится расчет коэффициентов изменения факторови методы повышения адекватности уравнения регрессии, разработанные при участии автора и изложенные в[2,3]. На третьем этапе реализуется полный факторный эксперимент ПФЭ, типа , где n–число факторов. На четвертом этапе получаем уравнение регрессии с проверкой адекватности по критерию Фишера и отсеиванием незначащих факторов по критерию Студента.Рассмотрим предлагаемый алгоритм более подробно.

Рис.1.Алгоритм работы программыОбнуление массиваЗагрузка данных в массивВычисление min, maxв столбцах массиваЗаполнение новой матрицы состоящей из min, maxВычисление значения условного нуля Xi0 и среднего значения интервала разброса ∆XiЗаполнение матрицы состоящей из Xi0 и ∆Xi1НачалоНахождение среднеарифметического каждого столбцаВычисление среднеквадратического отклоненияУдаление строк с элементами не входящими в интервал от Xi0

1,5σ до Xi0 1.5σ в каждом столбцеЗаполнение матрицы состоящей из оставшихся строк Рис. 1.продолжение –Алгоритм работы программыВычисление коэффициентов изменения факторов1Заполнение матрицы коэффициентами изменения факторовБлок преобразования матрицы коэффициентов изменения факторов для планирования факторного экспериментаВычисление коэффициентов регрессииЗаполнение матрицы с коэффициентами регрессииFрасч.
НетУведомление оператора –уравнение регрессии неадекватно2Да

Рис.1 продолжение.Алгоритм работы программы

Обнуление массива. При загрузке программы происходит обнуление массива для возможности дальнейшего заполнения матрицы исходного массива данных.

1)Загрузка данных в массив. Загрузка данных в массив производится либо поэлементным введением в матрицу, либо загрузкой из файла с расширением *.bak. Эту операцию осуществляет модуль сохранения и загрузки.

2)Нахождение среднеарифметического каждого столбца. Начало1. Находим сумму всех элементов по каждому столбцу.2. Делим каждое полученное значение на количество строк.Расчет доверительного интервала2Сравнение доверительного интервала с коэффициентами уравнения регрессии dAaiНетai = 0Расчет коэффициентов уравнения погрешностиВывод результатов на экранКонец3. Вычисляем квадрат разности Yij–Ŷ².4. Присваиваем полученные значения новой матрице.Конец

3)Вычисление среднеквадратического отклонения σ.Начало1.Вычисляем сумму по каждому столбцу.2.Полученную сумму делим на количество строк.3.Присваиваем полученные значения новой матрице.Конец

4)Удаление строк с элементами не входящими в интервал от Xi0

1,5σ до (Xi0 1.5σ в каждом столбце.Начало1.Определяем границу Xi01,5σ по каждому столбцу.2.Определяем границу Xi0 1,5σ по каждому столбцу.3.Циклически сравниваем каждое значение каждого столбца с полученным интервалом.4.Удаляем полностью строку если элемент какоголибо столбца не входит в этот интервал5.Количеству строк присваиваем Количество срок –1) –«kolstr:kolstr1».Конец

6 Вычисление min, maxв столбцах массива и заполнение новой матрицы состоящей из min, max

начало1.Декларируем некоторые значения MAXи MINбесконечно большое и бесконечно маленькое. 2.Перебираем все элементы матрицы М по столбцам.3.Если значение элемента матрицы больше значения MAXто присваиваем MAXзначение этого элемента.4.Если значение элемента матрицы меньше значения MINто присваиваем MINзначение этого элемента.5.Заносим получившиеся значенияMINи MAX для каждого столбца в матрицу минимальных и максимальных значений.6.Возвращаем функции значение матрицы минимальных и максимальных значений.Конец

7 Вычисление значения условного нуля Xi0, среднего значения интервала разброса ∆Xiи заполнение матрицы состоящей из Xi0 и ∆Xi.Начало

1.Перебираем все значения матрицы М по столбцам.2.Получаем из матрицы М значения минимумов и максимумов.3.Производим вычисление значений условного нуля и среднего значения интервала разброса по формулам и заносим данные значения в матрицу.4.Возвращаем функции значение матрицы значений условного нуля и среднего значения интервала разброса.КонецВычисление значений условного нуля и среднего значения интервала разброса вычисляется по следующим формулам соответственно[1]:

(1)

8 Вычисление коэффициентов изменения факторов и заполнение матрицы коэффициентами изменения факторов.Начало1.Перебираем все значения матрицы М по столбцам.2.Производим вычисление коэффициентов изменения факторов по формуле, используя значения коэффициентов начальной матрицы, а также значений условного нуля и среднего значения интервала разброса. Заносим коэффициенты в матрицу.3.Возвращаем функции значение получившейся матрицы.КонецВычисление коэффициентов изменения факторов производится по формуле[2]: (2)

9 Блок преобразованияизматрицы коэффициентовизменения факторов в матрицупланирования полного факторного эксперимента Данный блок является наиболее важной частью программы, так как здесь идет преобразование полученной матрицы до матрицы полного факторного эксперимента, т.е. из тысячи строк необходимо выделить такие строки, чтобы окончательная матрица обладала следующими свойствами [1]: ;;. (3)Данный блок разделяется на 3 раздела, описание которых представлены ниже.

Первый раздел:Начало1.Перебираем последовательно все строки матрицы М.2.Проверяем каждую строку на условие соответствия виду:  , , , ); (+,+,+,+); (+,,,); (,+,+,+); (,+,+,); (+,,,+); (,+,,+); (+,,+,); (,,,+); (+,,,); (,,+,+); (+,+,,); (,,+,); (+,+,,+); (,+,,); (+,,+,+);3.Удаляем все строки вида  , , ,  и ,,,;4.Если значения элементов строки не удовлетворяют данному условию, то вызываем процедуру удаления данной строки.КонецВторой раздел:Начало1.Перебираем последовательно все строки матрицы М. 2.Считаем количество строк каждого вида.3.Считаем количество строк не имеющее пары.4.Если строка не имеет пары, то вызываем процедуру удаления строки. КонецТретий разделНачало1.Проверяем, если количество строк, если больше 16, тогда удаляем парные строкизначение коэффициентов изменения факторов по модулю которых больше.Таким образом, остается только 16 строк и полученная матрица удовлетворяет условиям 3.

Конец

10 Вычисление коэффициентов регрессии и заполнение матрицы с коэффициентами регрессии

Начало1.Перебор матрицы К по строкам2.Вычисление коэффициентов по формулам3.Занесение коэффициентов в матрицу4.Присваиваем функции значение полученной матрицыКонец

Вычисление коэффициентов регрессии выполняется по формулам[1]: ;. (4)

11 Расчет критерия Фишера Fрасч. и доверительного интервала.

Полученное уравнение регрессии необходимо проверить на адекватность по критерию Фишера,а коэффициенты уравнения регрессии на значимость по критерию Стьюдента. Для этого производим следующие операции:

Начало1.Перебор матрицы по строкам;2.Вычисление значений Fрасч. и dAiс использованием значений коэффициентов из матрицы;3.Присваивает функциизначение Fрасч. и dAi;4.Проверка уравнения регрессии на адекватность;Конец

В этой процедуре выполняется расчет следующих промежуточных величин, необходимых для вычисления значение Fрасч. и dAi: Dвоспр. дисперсия воспроизводимости; Dад дисперсия адекватности f–число степеней свободыŶi–значение выходного параметра, вычисленное по уравнению регрессии.Сначала определяется число степеней свободы f как[1]: f= m–(n+ 1), (5)

где m–число опытов, в матрице факторного эксперимента; n–число факторов.

Затем вычисляется Ŷi–значение выходного параметра, вычисленное по уравнению регрессии [1]: Y= a0+ a1*q1 + a2*q2 + a3*q3 +a4*q4, (6)где qi–знак  или  для фактора qi.Дисперсия адекватности вычисляется по формуле [1]: , (7)где Yi–значение выходного параметра в эксперименте экспериментальное значение в матрице факторного эксперимента; Ŷi–значение выходного параметра, вычисленное по уравнению регрессии теоретическое значение; f–число степеней свободы. Дисперсия воспроизводимости вычисляется по формуле [1]: , (8)где

среднее значение выходного параметра или свободный член уравнения регрессии a0.После того, как вычислены все промежуточные величины определяются значение Fрасч. и dAiпо формулам [1]:

, , (9)где t–это коэффициент Стьюдента, значение которому присваивается в зависимости от количества строк полученных при преобразовании матрицы факторного эксперимента, сами значенияопределены из [1] таблица П.11см. таблицу 1

12 Проверка уравнения регрессии на адекватность и сравнениедоверительного интервала с коэффициентами уравнения регрессии dAai.

Все значения критериев Фишера и Стъюдента приведены в [3] и заложены в базуданных программы.Начало1.Если Fрасч. > Fтабл. , то выводим «Уравнение регрессии неадекватно».2.Если Fрасч. < Fтабл., то продолжаем проверку.3.Сравниваем все коэффициенты уравнения регрессии с доверительным интерваломКонец

Здесь выполняется проверка уравнения регрессии на адекватность т. е. FРАСЧFТАБЛ [1]Сравнение доверительного интервала с коэффициентами уравнения регрессии dAaiзаключается в следующем: если коэффициент регрессии по модулю меньше доверительного интервала, то этот коэффициент приравниваем к нулю. Здесь программа поочередно сравнивает коэффициенты уравнения регрессии по модулю с доверительным интервалом.

13 Расчет коэффициентов уравнения погрешности и вывод результата на экран

От уравнения регрессии в безразмерном виде переходим ксоставлению уравнения погрешности.

Начало1.Проводим расчет коэффициентов уравнения погрешности с первого по четвертый;2.Вывод окончательного результата –уравнения погрешности на экран. Конец

В этой процедуре выполняется расчет конечного результата исследования массива данных по формуле [1]: , (10)Уравнение погрешности имеет вид [1]: , (11)где

относительное изменение выходного параметра; относительное изменение фактора.

Таким образом, намисозданы алгоритм ипрограмма статистической обработки массивов ненормированныхданных по методике, предложенной в [2]. С помощью разработанной программы нами были обработаны массивы данных, полученных на примере исследования влияния индивидуальных личностных факторов студентов на результативность обучения по дисциплине «Информатика»[3].

Ссылки на источники1.Алексеев В.П., Озёркин Д.В. Основы научных исследований. // Учебное пособие для студентов специальности200800. –Томск, ТУСУР, 2012. –171 с.2.Алексеев В. П., Степаньян В. В. Повышение адекватности и достоверности модели обработки ненормированных массивов данных в исследованиях образовательных систем методом планирования эксперимента // Концепт. –2014. –№ 07 июль. –ART 14178.–URL: http://ekoncept.ru/2014/14178.htm. –Гос. рег. Эл No ФС 7749965. –ISSN 2304120X.3.Степаньян В. В. Исследование влияния индивидуальных личностных факторов студентов на результативность обучения по дисциплине «Информатика» // Концепт. –2014. –№ 03 март. –ART 14070.–URL: http://ekoncept.ru/2014/14070.htm. –Гос. рег. Эл No ФС 7749965. –ISSN 2304120X.