(p-value) و hypothesis testing

P Value in Arabic

نرى هذه القيمة p-value في الدراسات والأبحاث العلمية، وتعتبر مؤشراً أساسياً لفهم نتائج الأبحاث وتحديد مصير الفرضية (hypothesis)، فماذا تعني p-value؟

لتقريب معنى p-value، سنستخدم مثالاً لشرحها، لنفترض أن بحثاً ما يقارن بين نوعين من الأدوية للصداع، الدواء الأول نفترض أن اسمه (X) والدواء الثاني (Y). وتمت كتابة الفرضية (hypothesis) كالتَّالي:

There’s no difference between X and Y in treating headaches

قام الباحث بتوظيف متطوعين لتجربة الدوائين لعمل تجربة سريرية، وقسمهم إلى مجموعتين، المجموعة الأولى وعددهم (15)، يقوم أفرادها باستخدام (X) والمجموعة الثانية وعددهم (15)، يقوم أفرادها باستخدام (Y) عند شعورهم بالصداع، ثم يقوم الباحث بقياس تأثير الدوائين في كل مجموعة. وعلى افتراض أن (13 من أصل 15) من الذين استخدموا (X) تخلصوا من الصداع، بينما (3 من أصل 15) من الذين استخدموا (Y) تخلصوا من الصداع. فهناك فرق واضح بين الدوائين، فالذين تخلصوا من الصداع باستخدام (X) أكثر من الذين تخلصوا من الصداع باستخدام (Y). ولكن هل يعتبر هذا فرقاً معتبراً بين الدوائين بحيث يمكننا تعميم نتيجة البحث على جميع المصابين بالصداع (حتى المصابين الآخرين الذين لم يدخلوا في التجربة البحثية) أم لا، هنا يأتي استخدام p-value لتحديد ما إذا كنا نستطيع قبول أو رفض الفرضية (hypothesis).
شرح p-value بالعربي العربية واختبار hypothesis
لا يمكننا الجزم بأفضلية (X) وتعميم نتيجة البحث على جميع المرضى المصابين بالصداع إلا بعد عمل التحليل الإحصائي. لذلك، بمقارنة المجموعتين عن طريق التحليل الإحصائي وجدنا أن (p-value) الناتجة من هذا التحليل الإحصائي هي (p=0.0001). فماذا تعني (p=0.0001)؟
الحرف (P) في (p-value)، يعني (probability) أو (الاحتمالية)، والاحتمالية هي احتمالية استمرار الصداع بعد استخدام الدواء. عادة ما نحدد رقماً لـ(p-value) قبل بدء التجربة البحثية ليكون مقياساً لنا، ويكون هذا الرقم هو (0.05)، فإذا كانت القيمة الناتجة ل(p-value) من التحليل الإحصائي هي أقل من المقياس (0.05)، فهذا يعني أن هناك فرقاً إحصائياً معتبراً بين الدوائين وأن (X) أفضل من (Y).
أما لو افترضنا أن نتيجة التحليل الإحصائي هي (p=0.08)، ففي هذه الحالة، تكون (p) أكبر من (0.05)، وهذا يعني أن الفرق غير معتبر إحصائياً، ولا يمكن الجزم بأفضلية (X) أو تعميم نتيجة البحث على جميع المصابين بالصداع. وفي هذه الحالة، لا يمكننا وصف (X) لعلاج الصداع.


لماذا اخترنا (0.05) p-value لتكون هي المقياس في اختبار الـ(hypothesis)؟

لقد اتفق علماء الإحصاء على هذه القيمة لتكون هي المقياس، وهي تعني (%5) لأن (0.05=%5)، ولنتمكن من تعميم نتيجة البحث، نريد أن تكون احتمالية استمرار الصداع هي أقل من (%5).
أرجو أن تكون الفكرة واضحةً، وأن أكون قد تمكنت من تبسيطها لفهم هذا المبدأ البحثي المهم. كما يمكنك الاطلاع على النسخة الإنجليزية من هذه المقالة هنا.


Hypothesis testing on wikipedia