Надіслати статтю
вул. Інститутська 11, м. Хмельницький, 29016

НЕЛІНІЙНА РЕГРЕСІЙНА МОДЕЛЬ ДЛЯ ОЦІНЮВАННЯ РОЗМІРУ ВЕБ-ЗАСТОСУНКІВ, ЩО СТВОРЮЮТЬСЯ З ВИКОРИСТАННЯМ PHP ФРЕЙМВОРКУ SYMFONY

A NONLINEAR REGRESSION MODEL FOR ESTIMATING THE SIZE OF WEB APPLICATIONS CREATED USING SYMFONY FRAMEWORK

Сторінки: 119-124. Номер: №6, 2022 (315)  
Автори:
ЛАТАНСЬКА Людмила
Національний університет кораблебудування ім. адмірала Макарова
 ORCID ID: 0000-0001-6473-7624
e-mail: llatanskaya@gmail.com
МАКАРОВА Лідія
Національний університет кораблебудування ім. адмірала Макарова
 ORCID ID: 0000-0003-2903-3001
e-mail: lidiia.makarova@nuos.edu.ua
КОЛЬЦОВ Андрій
Національний університет кораблебудування ім. адмірала Макарова
 ORCID ID: 0000-0002-1917-3038
e-mail: andrew.koltsv@gmail.com
ДАВЛАТОВА Діана
Національний університет кораблебудування ім. адмірала Макарова
 ORCID ID: 0000-0003-2495-1305
e-mail: didi77777@ukr.net
LATANSKA Liudmyla, MAKAROVA Lidiia, KOLTSOV Andrii, DAVLATOVA Diana
Admiral Makarov National University of Shipbuilding
DOI: https://www.doi.org/10.31891/2307-5732-2022-315-6-119-124

Анотація мовою оригіналу

Питання щодо визначення розміру програмного забезпечення на перших етапах роботи над проектом є важливим, адже отриманий розмір можна використати для прогнозування вартості, тривалості та трудомісткості. Частка веб-застосунків серед усіх розроблюваних проектів програмного забезпечення сьогодні є значною, як і популярність мов програмування, що використовуються у веб-розробці. Лідером за частотою використання є мова PHP з її численними фреймворками.
Метою дослідження є побудова нелінійної регресійної моделі для оцінювання розміру web-застосунків, що створюються з використанням PHP фреймворку Symfony, за допомогою нормалізуючого перетворення на основі десяткового логарифму.
Для побудови моделі на платформі GitHub знайдено 50 проектів веб-застосунків, які створено з використанням фреймворку Symfony. З допомогою інструменту PhpMetrics отримано наступні метрики діаграми класів по цим проектам: кількість класів, середня кількість методів на кожен клас, глибина дерева наслідування. Такий вибір метрик зумовлений можливістю отримати таку інформацію про розроблюваний проект на ранніх стадіях проектування та відсутністю мультиколінеарності серед обраних метрик.
Емпіричні дані перевірено на нормальність. Перевірка показала, що дані є негаусівськими, тому їх нормалізовано за допомогою десяткового логарифму, виконано перевірку на наявність викидів, знайдені викиди усунуто та для даних, що лишились, побудовано лінійну для нормалізованих даних та нелінійну для вихідних даних регресійні моделі. Для порівняння також побудовано лінійну регресійну модель для емпіричних даних у припущені про нормальність розподілу. Порівняння моделей показало суттєве покращення якості оцінювання розміру веб-застосунків, що створюються з використанням фреймворку Symfony, при застосуванні саме нелінійного регресійного аналізу.
Ключові слова: оцінювання кількості строк коду, програмні застосунки, нелінійна регресійна модель, нормалізуюче перетворення, фреймворк Symfony.

Розширена анотація англійською  мовою

The issue of estimating the size of the software in the first stages of work on the project is important, because the obtained size can be used to predict the cost, duration and labor intensity. The share of web applications among all software projects developed today is significant, as is the popularity of programming languages ​​used in web development. The leader in frequency of use is the PHP language with its numerous frameworks. The purpose of the study is to build a non-linear regression model for estimating the size of web applications created using the Symfony PHP framework, using a normalizing decimal logarithm transformation. To build the model, 50 web application projects were found on the GitHub platform, which were created using the Symfony framework. Using the PhpMetrics tool, the following class diagram metrics for these projects were obtained: the number of classes, the average number of methods per class, the depth of the inheritance tree. This choice of metrics is due to the possibility of obtaining such information about the project under development at the early stages of design and the absence of multicollinearity among the selected metrics.
Empirical data were tested for normality. The check showed that the data are non-Gaussian, so they were normalized using a decimal logarithm, an outlier check was performed, the outliers were eliminated, and for the remaining data, a linear regression model was built for the normalized data and a nonlinear one for the original data. For comparison, a linear regression model was also constructed for the empirical data under the assumption of normal distribution. The comparison of the models showed a significant improvement in the quality of estimating the size of web applications created using the Symfony framework when applying non-linear regression analysis.
Keywords: LOC estimation, software, non-linear regression model, normalizing transformation, Symfony framework.

References

  1. Arcidiacono G. Comparative research about high failure rate of IT projects. PM World Journal. 2017. Vol. VI, Issue II.
  2. Usage statistics of PHP for websites. URL: https://w3techs.com/technologies/details/pl-php (20.10.2022).
  3. The Best PHP Framework for 2015: SitePoint Survey Results. URL: https://www.sitepoint.com/best-php-framework-2015-sitepoint-survey-results/ (20.10.2022).
  4. PHP developer ecosystem survey. URL: https://www.jetbrains.com/lp/devecosystem-2021/php/ (20.10.2022).
  5. Prykhodko S. B. Nonlinear regression model for estimating the size of web-applications created using the Laravel framework. Information technology and computer engineering. 2021. Vol. 50, no. 1. P. 115–121.
  6. Prykhodko S. B., Shutko I. S., Prykhodko A. S. A nonlinear regression model to estimate the size of web apps created using the CakePHP framework. Radio Electronics, Computer Science, Control. 2022. No. 4. P. 129–139.
  7. Prykhodko S., Shutko Ivan, Prykhodko Andrii Early LOC estimation of web apps created using Yii framework by nonlinear regression models. WSEAS TRANSACTIONS ON COMPUTERS. 2021. Vol. 20. P. 321–328. DOI: https://doi.org/10.37394/23205.2021.20.35.
  8. Hee Beng Kuan Tan, Yuan Zhao, Hongyu Zhang. Conceptual data model-based software size estimation for information systems. ACM Transactions on Software Engineering and Methodology. 2009. Vol. 19, no. 2. P. 1–37. DOI: https://doi.org/10.1145/1571629.1571630.
  9. Hee Beng Kuan Tan, Yuan Zhao, Hongyu Zhang Estimating LOC for information systems from their conceptual data models. Proceeding of the 28th international conference, Shanghai, China, 20–28 May 2006. New York, New York, USA, 2006. DOI: https://doi.org/10.1145/1134285.1134331.
  10. Prykhodko S.B. Constructing the non-linear regression equation to estimate the software size of open source PHP-based information systems. Problems of Information Technologies. 2018. № 1 (023). P. 118–125.
  11. Prykhodko S. B. Three-factor non-linear regression model to estimate the size of open source php-based applications. Scientific notes of Taurida National V.I. Vernadsky University. Series: Technical Sciences. 2020. Vol. 1, no. 1. P. 124–131. DOI: https://doi.org/10.32838/2663-5941/2020.1-1/23.
  12. Prykhodko N. V., Prykhodko S. B. Constructing the Nonlinear Regression Models on the Basis of Multivariate Normalizing Transformations. Èlektronnoe modelirovanie. 2018. Vol. 40, no. 6. P. 101–110. DOI: https://doi.org/10.15407/emodel.40.06.101.
  13. Prykhodko Sergiy. Detecting outliers in multivariate non-Gaussian data on the basis of normalizing transformations. 2017 IEEE First Ukraine Conference on Electrical and Computer Engineering (UKRCON), Kiev, 29 May – 2 June 2017. [S. l.], 2017. DOI: https://doi.org/10.1109/ukrcon.2017.8100366.
  14. Prykhodko Sergiy. Application of the squared mahalanobis distance for detecting outliers in multivariate non-Gaussian data. 2018 14th International Conference on Advanced Trends in Radioelecrtronics, Telecommunications and Computer Engineering (TCSET), Lviv-Slavske, Ukraine, 20–24 February 2018. [S. l.], 2018. DOI: https://doi.org/10.1109/tcset.2018.8336353.
  15. Handbook of regression analysis. Choice Reviews Online. 2013. Vol. 51, no. 02. P. 51–0931–51–0931. DOI: https://doi.org/10.5860/choice.51-0931.
  16. Foss T. A simulation study of the model evaluation criterion mmre. IEEE Transactions on Software Engineering. 2003. Vol. 29, no. 11. P. 985–995. DOI: https://doi.org/10.1109/tse.2003.1245300.
  17. Prykhodko S., Natalia Prykhodko. Mathematical Modeling of Non-Gaussian Dependent Random Variables by Nonlinear Regression Models Based on the Multivariate Normalizing Transformations. Advances in Intelligent Systems and Computing. Cham, 2020. P. 166–174. DOI: https://doi.org/10.1007/978-3-030-58124-4_16.

 

Post Author: Горященко Сергій

Translate