ایزانلو، بلال.، بازرگان، عباس.، فرزاد، ولی ا....، صادقی، ناهید و کاوسی، امیر. (1393). تفکیک ابعاد متعامد از خوشههای سؤال بر اساس هشت روش تعیین بعد در داده های دوارزشی: مورد آزمون ریاضی رشتة ریاضی فیزیک کنکور 92-91. فصلنامة اندازهگیری تربیتی، 5(18)207-240.
دربان آستانه، علیرضا.، طهماسبی، سیامک و رضایی، پانیذ. (1395). تحلیل الگوی نابرابری فضای آموزشی شهرستانهای کشور. مطالعات برنامهریزی آموزشی 5(9)، 50-31.
رودباری، مسعود و فیضآبادی فراهانی، زهرا. (1386). فراوانی و متغیرهای مرتبط درنتیجة دانشآموزان دورة پیشدانشگاهی در کنکور سال 1384. مجلة علوم تربیتی و روانشناسی، 4(6)، 84-65.
میرغفوری، سید حبیبالله.، طهاری مهرجردی، محمدحسین و بابایی، حمید. (1389). شناسایی وضعیت توسعهیافتگی و رتبهبندی استانهای کشور ازلحاظ دسترسی به شاخصهای بخش کتابخانهای. فصلنامة کتابداری و اطلاعرسانی، 13(3).
صفائیپور، مسعود و مودت، الیاس. (1392). ارزیابی استانهای ایران با تأکید بر شاخصهای اجتماعی-اقتصادی و شاخص ترکیبی توسعه انسانی با استفاده از تکینک TOPSIS و GIS. مطالعات ساختار و کارکرد شهری، 1(3)، 27-11.
شریفی یگانه، نگار. (1391). ارزیابی کارکرد افتراقی جنسیتی سؤالهای آزمون ریاضی با استفاده از دو روش مانتل - هنزل و نظریة سؤال- پاسخ. مطالعات اندازهگیری و ارزشیابی آموزشی، 1(2)، 76-53.
صادقی جعفری، جواد.، روشن، محمد و شکوری گنجوی، حامد. (1390). بررسی مقایسهای عملکرد تحصیلی دانشجویان سهمیههای ایثارگری و سهمیة مناطق در دورههای روزانه دانشگاههای دولتی. نامة آموزش عالی، 3(10)، 51-75.
گرامی پور، مسعود.، رضایی، احمد.، رمضانی صدر، اعظم و نوروزی، لیلا. (1395). کنش افتراقی سؤال در آزمونهای سازمان سنجش آموزش کشور برحسب ویژگیهای جمعیتشناختی داوطلبان کنکور سراسری. فصلنامة اندازهگیری تربیتی، 7(26)، 122-101.
گرامیپور، مسعود.، رمضانی صدر، اعظم.، رضایی، احمد.، نوروزی، لیلا و مختاریان، فرانک. (1396). کنش افتراقی سؤال (DIF) و آزمون (DTF) مرتبط با جنسیت در آزمونهای کنکور سراسری سازمان سنجش آموزش کشور. مطالعات اندازهگیری و ارزشیابی آموزشی، 7(19)، 73-41.
محمدبیگی، ابوالفضل.، محمدصالحی، نرگس و علی گل، محمد. (1393). روایی و پایایی ابزارهای و روشهای مختلف اندازهگیری آنها در پژوهشهای کاربردی در سلامت. مجلة دانشگاه علوم پزشکی رفسنجان، 13(12)، 1170-1153.
Bolt, D., M., Cohen, A. S., & Wollack, J. A. (2001). A mixture model for multiple choice data. Journal of Educational and Behavioral Statistics, 26, 381–409.
Cohen, A., & Bolt, D. (2005). A Mixture Model Analysis of Differential Item Functioning. Journal of Educational Measurement, 42(2), 133-148.
De Ayala, R. J., Kim, S.-H., Stapleton, L. M., & Dayton, C. M. (2002). Differential item functioning: A mixture distribution conceptualization. International Journal of Testing, 2, 243–276.
Fraser, C., & McDonald, R. P. (1988). NOHARM: Least squares item factor analysis. Multivariate Behavioral Research, 23, 267–269.
Kim, E. S., Cao, CH., Wang, Y., & Nguyen, D. T. (2017) Measurement Invariance Testing with Many Groups: A Comparison of Five Approaches. Structural Equation Modeling: A Multidisciplinary Journal, 24(4), 524-544. doi: 1080/10/2017/10705511.1304822
Lord, F. M. (1980). Applications of item response theory to practical testing problems. Hillsdale, NJ: Lawrence Erlbaum Associates.
Lubke, G. H., & Muthén, B. O. (2005). Investigating population heterogeneity with factor mixture models. Psychological Methods, 10, 21–39. doi:1037/10/1082-989X.1/10.21
Mazor, M. M., Hambleton, R. K., and Clauser, B. E. (1998). Multidimensional DIF analysis: the effects of matching on unidimensional subtest scores. Applied Psychological. Measurement, 22, 357–367. doi: 10.1177/014662169802200404
McDonald, R. P. (1997). Normal-ogive multidimensional model. In W. J. van der linden & R. K. Hambleto (Ed.), Handbook of Modern Item Response Theory (pp. 258-269). New York: Springer Verlag.
Mislevy, R., Wilson, M., Ercikan, K., & Chudowsky, N. (2002). Psychometric principles in student evaluation. In D. Nevo & D. Stufflebeam (Eds.), International handbook of educational evaluation (pp. 478–520). Dordrecht, The Netherlands: Kluwer.
Muthén, L.K. and Muthén, B.O. (1998-2017). Mplus User’s Guide (Eighth Ed). Los Angeles, CA: Muthén & Muthén.
Oliveri, M., Ercikan, K. & Zumbo, B. (2013). Analysis of Sources of Latent Class Differential Item Functioning in International Assessments. International Journal of Testing, 13(3), 272-293. doi:13. 10.1080/15305058.2012.738266
Pomes, M., Squires, J., & Yovanoff, P. (2014). Psychometric examination of a Spanish translation of a developmental screening instrument. Journal of Early Childhood Research, 14. doi: 10.1177/1476718X14529279
Samuelsen, K. M. (2005). Examining differential item functioning from a latent class perspective (Unpublished Doctoral dissertation). University of Maryland, College Park.
Stout, W., Froelich, A., & Gao, F. (2001). Using resampling methods to produce an improved DIMTEST procedure. In A. Boomsma, M. A. J. van Duijn, & T. A. B. Snijders (Eds.), Essays on item response theory (pp. 357-376). New York, NY: Springer-Verlag.
Webb, M. L., Cohen, A. S., & Schwanenflugel, P. J. (2008). Latent class analysis of differential item functioning on the Peabody Picture Vocabulary Test–III. Educational and Psychological Measurement, 68, 335–351.
Willingham, W. W., Ragosta, M., Bennett, R. E., Braun, H., Rock, D. A., & Powers, D. E. (1988). Testing handicapped people. Needham, MA: Allyn & Bacon.
Young, J. W., Steinberg, J., Cline, F., Stone, E., Martiniello, M., Ling, G., & Cho, Y. (2010). Validity and fairness of standards-based assessments for initially fluent students and former English language learners. Educational Assessment, 15, 87–106.