تقلا میان احتمال و یقین
تلاش برای فهم مرز میان وقایع قطعی و نادر با توسل به آمار بیزی
در کاوشی درخصوص فهم بشری،1 «دیوید هیوم»، به احتمال وقوع معجزات میپردازد: «هر معجزه یک نقض قوانین طبیعت است و چون تجربهای محکم و دگرگونیناپذیر این قوانین را مبرهن کرده است. اثبات بر ضد یک معجزه، بر مبنای ماهیت خود امر، کاملترین دلیلی بر مبنای تجربه است که ممکن است بشود تصور کرد. چرا این چیزی است بیش از محتمل که همه انسانها لاجرم میمیرند؛ که سرب نمیتواند، به خودی خود، در هوا معقل بماند؛ که آتش چوپ را میسازند و با آب خاموش میشود؛
عطا کالیراد*: در کاوشی درخصوص فهم بشری،1 «دیوید هیوم»، به احتمال وقوع معجزات میپردازد: «هر معجزه یک نقض قوانین طبیعت است و چون تجربهای محکم و دگرگونیناپذیر این قوانین را مبرهن کرده است. اثبات بر ضد یک معجزه، بر مبنای ماهیت خود امر، کاملترین دلیلی بر مبنای تجربه است که ممکن است بشود تصور کرد. چرا این چیزی است بیش از محتمل که همه انسانها لاجرم میمیرند؛ که سرب نمیتواند، به خودی خود، در هوا معقل بماند؛ که آتش چوپ را میسازند و با آب خاموش میشود؛ به جز اینکه معلوم میشود که این رویدادها موافقاند با قوانین طبیعت و احتیاج هست به نقض این قوانین. یا به عبارت دیگر، به معجزه، برای مانعشدن از آنها؟ هیچ چیز معجزه محسوب نمیشود اگر که یک وقتی در سیر معمول طبیعت رخ بدهد».2 «هیوم»، معجزه را ناقض قوانین طبیعی و واقعیت چنان نامحتمل میپندارد که تبیینهای جایگزین برای توضیح معجزه محتملترند تا وقوع معجزه. این استدلال اساسا در باب احتمال است: رخدادهایی که قوانین طبیعی را نقض میکنند، میشود پیشاپیش چنان نامحتمل پنداشت که باید به هر شاهدی گواه بر وقوع چنین رخدادهایی با دیده تردید نگریست. «ریچارد پرایس»3 چنین تفسیر آماری را برنمیتابید. او با اتکا بر عقاید «توماس بِیز»،4 به این نتیجه رسید که تصور «هیوم» از احتمال وقوع یک معجزه بسیار بدبینانه است. تصور کنید که یک میلیون مشاهده در صحت قانونی طبیعی انجام داده باشیم (به عنوان مثال، یک میلیون بار آب سرد در کتری ریختیم و کتری را روی آتش قرار دادیم و هر بار جوشآمدن آب را مشاهده کردیم). این یک میلیون مشاهده را میتوان مانند یک میلیون مرتبه سکهانداختن در نظر گرفت: در هر مشاهده، یا قانون طبیعی رعایت میشود (شیر) یا قانون طبیعی نقض میشود (خط). آیا با توجه به اینکه در این یک میلیون مشاهده، قانون طبیعی نقض نشده و هر بار جوشآمدن آب در کتری در اثر حرارتدادن را مشاهده کردیم، میتوان نتیجه گرفت که احتمال نقض قانون طبیعی با اتکا بر این یک میلیون مشاهده صفر است؟ «پرایس»، با اتکا بر رساله «توماس بیز»، استدلال کرد که اگر احتمال نقض قانون طبیعی را غیرصفر ولی بسیار ناچیز در نظر بگیریم، مثلا یک به یکمیلیونو 60 هزار، احتمال نقض قانون در حین یکی از مشاهدات، در صورتی که یک میلیون مرتبه دیگر نیز این آزمایش را تکرار کنیم، تنها اندکی کمتر از 50 درصد خواهد بود!5
احتمال شرطی و قاعده بِیز
قاعدهای که «توماس بِیز» پیافکند، پاسخی بود به مسئله احتمال معکوس؛6 چگونه میتوان توزیع آماری متغیری را که مشاهده نشده، مشخص کرد؟ پاسخ «بِیز» دو سال پس از مرگ او در قالب رسالهای به منظور حل یک مسئله از دکترین بختها7 در ۱۷۶۳ میلادی منتشر شد. «ریچارد پرایس» با انتشار این رساله در نشریه رسالات فلسفی انجمن سلطنتی لندن8 و سخنرانی در باب این اثر کمر همت به مشهورکردن آن بسته بود، اما تلاشهای او چندان ثمربخش نبود و اهمیت رویکرد «بیز» به آمار و احتمال تا قرن بیستم میلادی مشخص نبود. گمنامی نسبی رویکرد «بیز»، منجر به پدیدآمدن رویکرد متفاوت به آمار در اواخر قرن نوزدهم و ابتدای قرن بیستم که آمار فراوانیگرایانه9 و گهگاه، به یاد یکی از بنیانگذاران این حوزه، آمار فیشری10 خوانده میشود، شد. تمایز میان این دو صرفا به روش محاسبه احتمال محدود نمیشود، بلکه منعکسکننده دو رویکرد فلسفی سراسر متفاوت در باب معنای احتمال است. در وهله نخست، برای فهم آمار با رویکرد «بِیز»، باید با مفهوم احتمال شرطی و قاعده «بیز» آشنا شویم. تصور کنید تستی برای تشخیص بیماری مانند کووید۱۹ وجود داشته باشد که در صورت مثبتبودن نتیجه تست شما، شما به احتمال ۹۹ درصد به کووید۱۹ مبتلا هستید. احتمال ابتلای شما به کووید۱۹ با توجه به نتیجه مثبت این تست چقدر است؟ احتمالا این پرسش را بسیار بچهگانه و حتی توهینآمیز بپندارید! احتمال ابتلای به کووید۱۹ در صورت مثبتبودن نتیجه تست ۹۹ درصد است... البته بر اساس قاعده «بیز» چنین نیست! نخست باید توجه کرد که این ۹۹ درصد مذکور، احتمال مثبتبودن تست به شرط ابتلا به کووید۱۹ است، اما هدف ما محاسبه احتمال ابتلا به کووید۱۹ به شرط مثبتبودن تست است. شاید تصور کنید که این دو احتمال باید با یکدیگر برابر باشند، اما بر اساس قاعده «توماس بیز»، این دو احتمال برابر نیستند. برای روشنشدن این نابرابری، فرض کنید احتمال ابتلا به کووید۱۹ برای فردی که به صورت تصادفی از جمعیت انتخاب شود، یک در هزار باشد؛ اگر نتیجه تست ما مثبت بود، احتمال ابتلای به بیماری با توجه به مثبتبودن نتیجه تست متناسب خواهد بود با حاصلضرب احتمال مثبتبودن تست به شرط ابتلا به کرونا و احتمال ابتلای به کرونا در جمعیت، یعنی ۹۹ درصد ضرب در یک در هزار. با اتکا بر قاعده «بیز» و استفاده از احتمالهایی که پیشتر ذکر شد، احتمال ابتلا به بیماری کووید۱۹ در صورت مثبتبودن تست خاص که ۹۹ درصد دقت دارد، تنها ۱.۹ درصد خواهد بود! نتیجه خلاف شهودی محاسبه احتمال بیماربودن ما در صورت مثبتبودن نتیجه تست تشخیص بیماری، نمونهای است از سرشت غیرشهودی مفهوم احتمال و شانس در چارچوب آمار بیزی. نمونههای بسیاری از ناکارآمدی غریزه ما در فهم احتمال وقوع رخدادها وجود دارد؛ اغلب رخدادهای مستقل را مرتبط به هم میپنداریم و رخدادهای مرتبط را مستقل. اما رویکرد بِیزی به آمار صرفا آشکارکننده دشواری شهود ما در فهم احتمال نیست، بلکه اساسا تصور ما از احتمال را دگرگون میکند.
احتمال به مثابه سطح اطمینان
وقتی یک احتمال را به رخدادی خاص نسبت میدهیم، میتوان احتمال را به دو صورت تفسیر کرد.11به عنوان مثال اگر احتمال ششآوردن یک تاس را یکششم قلمداد کنیم، میتوان یکششم را فراوانی ششآوردن تصور کرد. در این صورت، اگر به تعداد بسیار تاس بریزیم، مرتبههایی که شش آوردیم به یکششم میل میکند. اما میتوان یکششم را باور پیشینی ما در باب احتمال ششآوردن در صورت تاسریختن دانست؛ در این صورت، یکششم به فراوانی وقوع رخداد در صورت تکرار چندصدباره آن ندارد، بلکه به سطح یقین و اطمینان ما در مورد احتمال وقوع این رخداد خاص، یعنی ششآوردن، مربوط میشود. آمار بیزی مبتنی بر این تفسیر دوم از احتمال است. گرهزدن احتمال به وقوع یک رخداد به پیشفرض ما در باب وقوع آن رخداد، احتمال را از کمیتی عینی به کمیتی ذهنی بدل میکند. یکی از انتقادهای اصلی به آمار بیزی نیز همین است؛ گویی علمی دقیق را به باور و اطمینان شخصی ما پیوند میدهد و از دقت آن میکاهد. اما مزیت اصلی آمار بیزی همین نقص ظاهری است؛ در عالم واقع، همواره با پیشفرضهای خاص خود به مشاهده طبیعت میپردازیم و هرگز به مانند ناظری بیطرف دنیای اطراف را درک نمیکنیم. در نظر گرفتن باورهای خود در باب رخدادها به معنای ذهنی و میلیبودن این توصیف آماری نیست، بلکه باید بر مبنای مشاهدات خود، باورمان را بهروز کنیم. تصور کنید با دوستان خود مشغول بازی نرد هستید و دوستی شکایت میکند که تاس مورد استفاده در این بازی مطابق انتظار رفتار نمیکند و بیش از حد شش میآورد. اگر بخواهید در چارچوب آمار بیزی به شکایت دوست خود رسیدگی کنید، پیشفرض شما این است که احتمال وقوع هر یک از شش حالت یک تاس، آوردن یک تا شش، با هم برابر و برابر با یکششم خواهد بود. با هزار بار ریختن این تاس، میتوانید با دقتی متناسب با تعداد دفعاتی که این تاس را ریختید، توزیع احتمال وقوع هر یک از این شش حالت را به دست آورید. اگر احتمال ششآوردن پس از این هزار مشاهده با احتمال وقوع پنج حالت دیگر تفاوت معناداری داشته باشد، آنگاه میتوانید حق را به دوست خود دهید و تاس دیگر را برای بازی اختیار کنید. توضیح فوق در باب بهروزکردن باورمان در باب احتمال آوردن یک تا شش در یک تاس، بسیار سادهانگارانه است و به جزئیات فنی چگونگی بدلکردن توزیع احتمال باور ما پیش از مشاهدات، آنچه در زبان فنی آمار احتمال پیشینی12 خوانده میشود، به احتمال پسینی13 وقوع رخدادی خاص، یعنی احتمال صحت فرض ما به شرط مشاهدات، نمیپردازد. در عمل، در اغلب موارد امکان تبدیل تحلیلی احتمال پیشینی به احتمال پسینی وجود ندارد و تنها به مدد رایانه و شبیهسازی میتوان با تقریب خوبی احتمال پسین را بر مبنای مشاهدات واقعی محاسبه کرد. این دشواری محاسباتی، تا حدی سلطه بیچون و چرای آماری فراوانیگرایانه تاکنون را توضیح میدهد: آزمونهای آماری سنتی متکی به رایانه نیستند، گرچه رایانه انجام این آزمونها را بسیار آسان میکند؛ این آزمونها را میتوان با کاغذ و مداد انجام داد. در نقطه مقابل، آمار بیزی نیازمند فهم زبانهای برنامهنویسی است که به منظور محاسبه عددی احتمال پسینی پدید آمدهاند. افزون بر این، انجام این آزمونها نیازمند فهم عمیق جنبه آماری رخداد مورد نظر است؛ باور پیشین ما در باب یک رخداد را میبایست در قالب توزیع آماری توصیف کرد تا با محاسبه عددی این توزیع را به توزیع احتمال پسینی بدل کرد. درخصوص رخدادی همچون سکهانداختن، توزیع احتمال پیشینی شیر یا خط آمدن همان توزیع دوجملهای است که فرایندی که دو حالت ممکن بیشتر ندارد را توصیف میکند، اما در مورد رخدادهای پیچیدهتر، یافتن توزیع پیشینی چندان آسان نیست.
شیاطین در قطعیت پنهان هستند
با وجود این دشواریها، آمار بیزی برای بسیاری رویکردی جذابتر است تا فراوانیگرایانه. جنبه اصلی این جذابیت به چگونگی انعکاس عدم قطعیت در آمار بیزی و پنهانشدن عدم قطعیت در آمار فراوانیگرایانه برمیگردد. در اخبار علمی، بسیار به تیترهایی برمیخورید که حکایت از سودمندی رژیم غذایی و عادت روزمره خاصی بر طول عمر یا احتمال سکته قلبی دارند. در بهترین حالت، این تیترها مبتنی بر پژوهشهایی هستند که دو گروه را مورد مقایسه قرار دادند. تصور کنید در پژوهشی خیالی از این قسم، سعی کنیم اثر راندن دوچرخه در قیاس با موتورسیکلت بر سلامت قلبی افراد را بررسی کنیم. میتوانیم سلامت قلبی شماری از افراد جامعه را که عادت به دوچرخهسواری دارند، با افرادی که موتورسیکلتسوار هستند، مقایسه کنیم. در آمار فراوانیگرایانه، مقایسه سلامت قلبی این دو گروه به مقایسه دو فرضیه بدل میشود: کمیت منعکسکننده سلامت قلبی میان این دو گروه تفاوتی ندارد یا متفاوت است. پاسخ این آزمونهای آماری نیز مانند این دو فرضیه بدیل، سیاه و سپید هستند. در آمار بیزی، توزیع آماری سلامت قلبی هر گروه تخمین زده میشود و میتوان با مقایسه توزیع این دو گروه، میزان تفاوت میان دو گروه و اطمینان ما نسبت به میزان این تفاوت را مستقیما تخمین زد. آمار بیزی ما را وامیدارد تا با عینکی از جنس احتمالات به وقایع بنگریم. از یک سو، سازوکارهای طبیعت بهندرت جبری هستند و شاید بتوان گفت که طبیعت بر داربستی از جنس رویدادهای بختانه علم شده است و از این رو رویکردی احتمالاتی به این وقایع توصیفی دقیقتر به دست میدهد. از سوی دیگر، در مواردی نیز که با رویدادهای جبری روبهرو هستیم، آمار بیزی باز هم به توصیف بهتری از این وقایع میانجامد؛ چراکه از عدم قطعیت روششناختی،14 یعنی محدودیت دانش ما در باب این وقایع، گریزی نیست. «تغییر کتب دانشگاهی و عادت به طول خواهد انجامید اما بر اساس قاعده بیز، ما در نهایت به رویکردی مناسبتر میل خواهیم کرد. قاعده بیز پیشبینی میکند که پیروان بیز در نهایت پیروز خواهند شد».15
* پژوهشگر زیستشناسی تکاملی، مؤسسه ماکس پلانک در توبینگن، آلمان
پینوشتها:
1- An Enquiry Concerning Human Understanding, 1748
2- کاوشی درخصوص فهم بشری، ترجمه کاوه لاجوردی، نشر مرکز، ص ۱۱۸.
3- Richard Price
4- Thomas Bayes
5- برای توصیفی مبسوط از پاسخ پرایس به هیوم، ر.ک: Stephen Stigler, The Seven Pillars of Statistical Wisdom (2006)
6- Inverse probability
7- An Essay towards solving a Problem in the Doctrine of Chances
8- Philosophical Transactions of the Royal Society of London
9- Frequentist statistics
10- Fisherian Statisticsبه یاد Ronald Aylmer Fisher.
11- البته صورت سومی هم قابل تصور است که بر اساس آن احتمال به مثابه گرایش (propensity) قلمداد میشود. در این یادداشت از بررسی این تفسیر که توسط کارل پوپر پیشنهاد شد، چشمپوشی میکنم.
12- Prior probability
13- Posterior probability
14- Epistemological uncertainty
15- Nate Silver, The Signal and the Noise (2012)