دانشنامه روانشناسی مردمی
علیرضا نوربخش (مشاور بالینی)

انواع پایایی و روایی آزمون

پایایی و روایی چیست و چگونه تعیین می شود؟

روایی و پایایی سنجش­ ها، معیارهای ضروری برای تعیین صحت و دقت یک آزمون هستند.

روایی آزمون

پایایی(Reliability) یک آزمون، عبارت است از درجه ثبات، همسانی و قابلیت پیش‌بینی آن در اندازه­ گیری هر آنچه اندازه می­ گیرد. این کیفیت، در هر نوع اندازه‌گیری، یک امر اساسی است. مفهوم یاد شده با این امر سروکار دارد که ابزار اندازه گیری در شرایط یکسان تا چه اندازه نتایج یکسانی به دست می دهد. برای اندازه گیری پایایی از شاخصی به نام ضریب پایایی استفاده می­ شود. اکثر سازندگان آزمون و محققان اگر ضریب پایایی ۹۰% یا بیشتر را به دست آورند، احساس رضایت می­ کنند، اما از ضریب کمتر از ۷۰% ناراضی می­ شوند.

پایایی یک آزمون تا حدی تابع طول آزمون است. هر چه طول آزمون بیشتر باشد، پایایی آن بیشتر است. دامنه ضریب پایایی از صفر تا ۱+ است. ضریب پایایی صفر معرف عدم پایایی و ضریب پایایی یک معرف پایایی کامل است.

پایایی تا حدی تابع ناهمگنی گروه نیز است. ضریب پایایی با افزایش گستردگی یا ناهمگنی آزمودنی‌هایی که در آزمون شرکت می ­کنند، افزایش می ­یابد. بر عکس، هر چه گروه نسبت به ویژ­گی ه­ایی که اندازه­ گیری می­ کند، همگن­ تر باشد، ضریب پایایی کمتر خواهد بود.

انواع  پایایی : 

پایایی مجدد یا باز آزمایی(Test-Retest) : این روش عبارت است از ارائه یک آزمون بیش از یک بار در یک گروه آزمودنی تحت شرایط یکسان. برای محاسبه ضریب پایایی با این روش، ابتدا ابزار اندازه گیری بر روی یک گروه آزمودنی اجرا شده و سپس در فاصله زمانی کوتاهی دوباره در همان شرایط، آزمون بر روی همان گروه اجرا می‌شود. نمرات بدست آمده از دو آزمون مورد بررسی قرار گرفته و ضریب همبستگی آنها محاسبه می‌شود. این ضریب نمایانگر قابلیت اعتماد (پایایی) ابزار است.

اجرای فرم­ های همتا(Equivalence) : استفاده از آزمون های همتاست که شباهت زیادی با یکدیگر دارند، ولی کاملا یکسان نیستند. به عبارتی، دو آزمون معادل در مورد یک مفهوم یا متغیر به خصوص تهیه شده و در فاصله کوتاهی به یک گروه واحد داده می­ شود. ضریب پایایی بر اساس همبستگی نمرات دو آزمون همتا به دست می‌آید. خطاهای اندازه گیری و کمبود یا عدم وجود همسانی میان دو فرم همتای آزمون (تفاوت در سوالات یا محتوای آن‌ها) قابلیت اعتماد را کاهش می‌دهد.

دو نیمه کردن آزمون(Split-half) : این روش برای تعیین هماهنگی درونی یک آزمون به کار می‌رود. برای محاسبه ضریب قابلیت اعتماد با این روش، سوال های یک آزمون را به دو نیمه تقسیم نموده و سپس نمره سوال های نیمه اول و نمره سوال های نیمه دوم را محاسبه می‌کنیم. پس از آن همبستگی بین نمرات این دو نیمه را بدست می‌آوریم. این آزمون معمولا برای متغیرهای دو حالتی که کد صفر به پاسخ­ های غلط و کد یک به پاسخ ­های صحیح داده می ­شود، به کار می ­رود.

روش آلفای کرونباخ : ضریب کرونباخ برای سنجش میزان تک بعدی بودن نگرش ها، قضاوتها و سایر مقولاتی که اندازه گیری آنها آسان نیست به کار می‌رود. این آزمون که حاصل آن یک ضریب به نام آلفای کروبناخ می‌باشد، برای پایایی پرسشنامه ای که به صورت طیف لیکرت طراحی شده و جواب های آن چند گزینه ای می‌باشند، به کار می‌رود. روش پایایی آلفای کرونباخ معمول­ ترین ضریب پایایی ثبات داخلی است که در بیشتر مطالعات از آن استفاده می ­شود و معرف میزان تناسب گروهی از آیتم ­هایی است که یک سازه را می ­سنجند.

روش کودر – ریچاردسون : این روش شامل دو آزمون است که آزمون­ های همگنی(ثبات بین سوالات) هستند که نسبت پاسخ­ های صحیح به غلط را در هر سوال یا آزمون در نظر می گیرد. برای آزمون ­هایی که پاسخ آن­ ها به شکل صحیح یا غلط بیان می­ شود، مفید است.(پرسش های دو وجهی)

روایی آزمون

روایی :

اهمیت روایی(Validity) در ارزشیابی آزمون حتی بیش از پایایی است. در حالی که پایایی با دقت و همسانی آزمون سروکار دارد، روایی نشان می دهد که آزمون واقعا چه چیزی را می سنجد. آزمونی که برای سنجش متغیرهای پژوهش رواست باید آنچه را که مورد نظر است اندازه گیرد و برای پژوهشگر اطلاعات مفیدی را فراهم کند. گرچه آزمون ممکن است بدون داشتن روایی، معتبر و پایا باشد، اما عکس این امر صادق نیست. به عبارت دیگر سطح مناسبی از پایایی شرط لازم و اولیه روایی است و پایایی به تنهایی روایی را تضمین نمی کند.

بنابراین آزمون در صورتی دارای روایی است که آنچه را که مورد نظر است به دقت اندازه گیری کند. به عنوان مثال، آزمونی ممکن است برای اندازه گیری علاقه به موسیقی ساخته شده باشد، اما به غلط به عنوان آزمون خلاقیت معرفی شود. این آزمون ممکن است دارای پایایی باشد، زیرا اگر در زمان های مختلف درباره افراد اجرا شود، همواره نتایج یکسان به دست می آید، با وجود این فاقد روایی است، زیرا خلاقیت را نمی سنجد.

برآورد روایی آزمون های روانی امری دشوار و پیچیده است، دلیل این امر آن است که متغیرهای روانی مفاهیم انتزاعی هستند، مانند هوش، اضطراب و شخصیت. این مفاهیم واقعیت محسوس و عینی خارجی ندارند، بنابراین وجود آنها را باید به روش غیر مستقیم استنباط کرد.

پایایی و روایی آزمون

انواع روایی :

روایی محتوا (Content Validity) : آزمون، وقتی اعتبار محتوایی دارد که هدف‌های آن با محتوای آزمودنی ارتباط داشته باشد. برای مثال، سنجش دقت افراد از طریق آزمون‌هایی امکان‌پذیر است که با مفهوم دقت ارتباط داشته باشد.

  1. روایی صوری : روایی صوری زیر بخشی از روایی محتوایی است. ساده ­ترین روش برای بررسی روایی، اندازه گیری این است که آیا ابزار در ظاهر به درستی متغیر مورد مطالعه را مورد سنجش قرار می­ دهد یا خیر. هرچند به طور کلی نمی ­توان فقط اعتبار صوری را برای نتیجه گیری معتبر دانست چرا که شکل ظاهری ابزار، صحت و اعتبار نتیجه گیری نهایی را مشخص نمی ­کند، بلکه این روش مشخص می­ کند آیا ابزار انتخاب شده مناسب با هدف پژوهش است یا خیر.

روایی ملاک یا معیار : منظور از روایی ملاکی، میزان همبستگی بین نمرات حاصل از یک ابزار با نمرات حاصل از ابزار اندازه گیری دیگر(ملاک) است. گاهی ارزیابی همبستگی به منظور پیش بینی برای آینده است، یعنی نمرات ابزار ملاک پس از گذشت یک فاصله زمان از اجرای ابزار اول گردآوری خواهد شد در اینصورت به آن روایی پیش بینی گفته می شود. زمانی که این پیش بینی بدون فاصله و در زمان حال انجام شود، به آن روایی همزمان می گویند. برای نعیین روایی ملاکی ضریب همبستگی بین نمرات حاصل از دو ابزار به عنوان شاخص روایی آزمون مورد نظر محاسبه شده و هر چه این ضریب بزرگتر باشد، ابزار روایی بیشتری دارد.

  1. روایی پیش بین : مهمترین نوع روایی است. این روایی از بررسی رابطه نمره­ های آزمودنی که برخی ویژگی­ ها را می­ سنجد و آنچه ادعای پیش بینی آن را دارد، به دست می­ آید.
  2. روایی همزمان: در مواردی به کار می رود که داده های حاصله از دو اندازه گیری در یک زمان در دسترس باشد. در این گونه موارد عملکرد در یک آزمون به عملکرد در آزمون دیگر مرتبط می گردد. این فرایند اعتبار همزمان نامیده می شود. اعتبار همزمان در موردی محاسبه می شود که هدف جانشین کردن این ابزار اندازه گیری به جای ابزار دیگری باشد. این امر بیشتر به علت ملاحظات مربوط به سهولت اجرای آزمون یا جانشین کردن یک آزمون کوتاه تر به جای یک آزمون طویل تر است.

روایی ساخت یا سازه (Construct validity): بیان می کند نتایج به دست آمده از کاربرد یک ابزار اندازه گیری تا چه حد با نظریه هایی که آزمون بر محور آنها تدوین شده است تناسب دارد. بعبارت دیگر نمایانگر آن است که ابزار اندازه گیری تا چه اندازه یک سازه یا خصیصه ای را که مبنای نظری دارد می سنجد. روایی سازه یعنی نمرات آزمون چقدر با دیگر اندازه گیری ها یا رفتارها همبستگی نظری و منطقی دارد.

  1. روایی همگرا: میزان همبستگی نمرات یک آزمون با چندین عامل مختلف را گویند. میزان ارتباط و همبستگی میان سوال مربوط به یک حیطه با همان حیطه را در بر می ­گیرد. روایی همگرا همچنین میزان ارتباط نمرات در یک ابزار سنجش را با نمرات در ابزارهای دیگری که همان سازه یا سازه ­های مشابه را دارند، اندازه گیری می ­کند.
  2. روایی افتراقی: این روش روایی به همبستگی ضعیف بین سوالات مربوط به یک حیطه با دیگر حیطه ­ها دلالت دارد. این طور می ­توان گفت که ضریب همبستگی یک سوال با حیطه­ های دیگر باید کمتر از ضریب همبستگی آن سوال با حیطه­ های مربوط به خودش باشد. در واقع با استفاده از یک ابزار باید بتوان میان سازه مورد اندازه گیری و دیگر سازه ­های نامرتبط تمایز قائل شد.

منبع : آزمون های روانشناختی، (ارزشیابی شخصیت و سلامت روان). علی فتحی آشتیانی. نشر بعثت

 

۴ ۲۲ رای ها
رأی دهی به مقاله

* درود بر شما که با حمایت خود و دعوت دیگران به مطالعه مقالات سایت، به من انگیزه می دهید. لطفا در کامنت ها و مباحثات شرکت کنید و پرسشگر باشید. جهت مشاوره آنلاین یا حضوری با شماره ۰۹۳۵۵۷۵۸۳۵۸ در تلگرام هماهنگ نمایید. *

5 نظر
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
بابایی
۱۳۹۹/۰۳/۰۶ ۰۸:۳۹

خیلی خوب توضیح دادن ممنون

حامد
۱۴۰۰/۱۰/۲۱ ۲۲:۰۲

روایی و پایایی آزمون

حامد
۱۴۰۰/۱۰/۲۱ ۲۲:۰۴

سلام استاد ممنون از توضیحات حضرتعالی.جهت آزمونهای چهارگزینه ای کدام روش جهت اندازگیری پایایی سوالات استفاده میشود؟

Sara
پاسخ به  حامد
۱۴۰۰/۱۲/۲۷ ۱۴:۱۶

از روش آلفای کرونباخ

سورنا
۱۴۰۱/۰۱/۲۰ ۰۰:۵۷

عالی بود👏