با اينكه در بخش‌هاي پیشین، بر پایه شواهد تجربي بحث کرديم، عمده تمرکز ما به استدلال قياسي معطوف شده بود، اما بيشتر استدلال‌هاي بی‌پایه و اساسی كه در علم اقتصاد برخورد مي‌كنيم از نوع قياسي نبوده، بلكه ادعاهايي درباره «واقعيات» هستند، يعني داده‌ها چه چيزهايي نشان مي‌دهند؛

بنابراين در بخش‌هاي بعدي می‌خواهیم نكاتي را گوشزد كنيم تا خود را در برابر چنين ادعاهايي حفاظت نماييم. با خواندن مطالب این بخش‌ها همچنين درك بهتري پیدا می‌کنید كه اقتصاد به چه چيزهايي مي‌پردازد. از آنجا كه اقتصاد علمي تجربي است، اقتصاددان‌ها بيشتر وقت خويش را صرف اندازه‌گيري ميزان اثرات پيش‌بيني شده و همچنین آزمون تئوری‌ها در برخورد با مشاهدات مي‌كنند. در نظرسنجي اخيري كه از اقتصاددانان آمريكايي جوان شاغل در ده دپارتمان برتر اقتصاد انجام شد حدود نصف آنها عمدتا كار تجربي و تقريبا يك سوم آنها تركيبي از كار تئوريك و تجربي مي‌كردند. اين ايده كه علم اقتصاد «صرفا يك مشت تئوري» است، قضاوتي نابجا است كه از نگاه به دروس اقتصاد مقدماتي به دست آمده است چون كه آنها بر زنجيره‌هاي استدلال قیاسي متمركز شده‌اند.

1- نقش بررسي‌هاي تجربي در علم اقتصاد
يك دليل اينكه چرا كارهاي تجربي در اقتصاد خيلي مهم است به اين خاطر است كه همه آنچه تئوري اقتصادي به ما مي‌دهد معمولا جنبه كيفي و نه نتايج كمي دارد. تئوري اقتصادي در حالي‌كه مي‌تواند به ما بگويد اگر x اتفاق بيفتد، قيمت‌ها بالا خواهد رفت و اگر y اتفاق بيفتد، توليد كاهش خواهد يافت و از این قبیل، اما نمي‌تواند بگويد ميزان اين تغييرات چقدر است. در عين‌حال اغلب همين پرسش «چقدر» است كه اهمیت دارد. اگر تئوري به ما مي‌گويد افزايش نرخ بهره، بيكاري را «موقتا» افزايش خواهد داد، اطلاعات كافي به ما نمي‌دهد كه تصميم بگيريم آيا با افزايش نرخ بهره موافقت يا مخالفت كنيم. بيشتر مردم مي‌خواهند بدانند بيكاري چقدر و چه مدت افزايش خواهد يافت و تنها شواهد تجربي است كه توانايي حل اين مساله را دارد.
دليل ديگري كه چرا بر كار تجربي تاكيد مي‌كنيم اين است كه کار تجربی صرفا خدمتكاري ساده نيست كه جزئيات كشف نشده و باقي گذاشته تئوري شاهانه را روشن مي‌كند. كار تجربي، ارباب يا قاضي نيز هست، يك نوع داوري كه ورود برخي تئوري‌ها به درون حوزه مجاز را خوشامد مي‌گويد و ساير تئوري‌ها را به جهان مادون مردودي‌ها مي‌فرستد؛ بنابراين كنار گذاشته مي‌شوند. (قطعا آنچه گفتيم حالتی آرماني را توصیف می‌کند؛ برخي تئوري‌ها در عين حال که ضرباتي از شواهد رد شده مي‌خورند بي‌دغدغه به حيات خود ادامه مي‌دهند، اما نه براي هميشه.)
تمام كاري كه استنتاج‌ها مي‌كنند باز كردن دلالت‌هايي است كه در فروض مدل وجود دارد. اگر اقتصاددانان قواعد منطقي را به درستي به كار ببرند، پس نتيجه‌گيري‌هاي آنها نيز درست است، اما درباره فروض چه مي‌گوييم؟ آنچه اهميت دارد درستي يك فرض به معناي مطلق آن نيست، بلكه فقط کافی است براي مقصود مد نظر ما تا حد كفايت درست و دقيق باشد. محرز شدن آن هم زماني ميسر است كه تئوري ساخته شده با آن فروض، با شواهد تجربي سازگار باشد.

2- انواع شواهد تجربي
چندين نوع شواهد تجربي وجود دارد كه براي برآورد ميزان اثر متغير و آزمون تئوري‌ها استفاده مي‌شوند.

حكايت‌ها
همه ما با شيوه گزارش‌گيري رسانه‌ها و گفت‌وگوها و مصاحبه‌هاي خبري هر روزه آنها به شكل حكايت و سرگذشت آشنا هستيم. شيوه‌اي كه با آب و تاب همراه بوده و سرگرم‌كننده است و به ذهن شنونده فشار نمي‌آورد و مي‌توان از آن براي «اثبات كردن» دقيقا هر چيزي استفاده كرد. هلن سنگدل با ارائه مدرك نشان مي‌دهد كه گيرندگان كمك‌هاي رفاهي يك مشت آدم علاف هستند چون او كسي را مي‌شناسد كه شغل خود را ترك كرد تا كمك‌هاي رفاهي دريافت كند و ساراي دل‌نازك واكنش نشان مي‌دهد كه او شخصي را مي‌شناسد كه دنبال شغل مي‌گردد، اما نمي‌تواند پيدا كند و اگر كمك‌هاي رفاهي نبود از گرسنگي مرده بود. آنچه هر دوي آنها مي‌گويند درست است، اما در شيوه برخورد با مساله كه گويي فقط گفته آنها درست است اشتباه مي‌كنند. آنچه آنها زور مي‌زنند بگويند اين است كه دست كم يك شخص در فهرست كمك‌هاي رفاهي، علاف و هرزه‌گرد است و دست‌كم يك نفر كه واقعا مستحق كمك است داريم. چه كسي اين را منكر شده است؟ استدلال کردن فقط از يك مورد، توان خسارت‌زايي زيادي دارد و این تنها به علم اقتصاد محدود نمي‌شود. اينكه صلح و سازش چمبرلين با هیتلر در انتهاي دهه 1930 اشتباه بود به اين معنا نیست كه همه كوشش‌ها براي جلوگيري از وقوع جنگ اشتباه است.
رويدادهاي برجسته
رويداد برجسته ارتباط نزديكي با حکایت‌ها پيدا مي‌كند. آن هم شبيه بسياري حکایت‌ها، متكي بر يك مورد است، اما موردي كه يك رويداد به چشم‌آمدني (براي مثال بحران بزرگ دهه 1930)است. رويداد برجسته دو برتري نسبت به حکایت معمولي دارد. نخست هر تئوري كه سعي در تبيين يك دسته معين رويدادها دارد، اگر قادر به تبيين رويدادی برجسته كه در آن دسته جاي مي‌گيرد نباشد شكست تماشايي مي‌خورد. دوم اگر چه اصولا يك رويداد برجسته لزوما علت برجسته‌اي ندارد (بيشتر اوقات سقوط بهمن از يك گلوله کوچک برفي شروع مي‌شود،) در بيشتر موارد عامل اصلي يك رويداد برجسته، چيزي است كه از درون داده‌هاي ما فرياد مي‌زند و نه چيزي كه به آرامي در گوشمان زمزمه مي‌شود و با توجه به سر و صداي پيش‌زمينه اصلا شنيده نمي‌شود؛ بنابراين اگر چه رويداد برجسته را اغلب برحسب اعداد يعني علم آمار توصيف مي‌كنند، آن غالبا پيام خويش را بدون كمك گرفتن از فنون پيچيده آماري به ما مي‌رساند.
پس در حالي‌كه گزارش‌ها درباره رويدادهاي برجسته واقعا حکایت‌گونه هستند، آنها دست‌كم در سطح آموزشي، چيزهاي بيشتري از حکایت معمولي براي ياد دادن به ما دارند و مي‌توان اين دفاع جانانه را از آنها كرد كه وقتي رخ مي‌دهند اقتصاددانان قويا و شايد بيش از حد تحت‌تاثير آنها قرار مي‌گيرند، اما مشكل در «وقتي كه رخ مي‌دهند» است. بر اساس تعريف، آنها رويدادهايي نادر هستند؛ بنابراين اقتصاددانان بايد معمولا به دنبال چيز ديگري بگردند.

علم آمار
همانطور كه يك ضرب‌المثل مي‌گويد: «حکایت»، اسم مفرد براي «داده‌ها» است. اگر هلن سنگدل فقط يك مورد از كلاهبرداري در كمك‌هاي رفاهي نیاورده بود، بلكه هزار مورد مي‌آورد و اگر اين هزار مورد يك نمونه فراگير بود، پس او استدلالي قوي داشته است. براي تعميم‌هاي معتبر، بايد به دنبال موردهاي زيادي بگردیم و اصولا در حالي‌كه مي‌توان هر کدام از موارد را خيلي سريع يكي پس از ديگري خواند، چنين كاري نه فقط به شدت زمانبر بوده، بلكه از حافظه شنونده و قطعا شكيبايي وي بيرون است. پس نيازمند خلاصه كردن اين موردها به هر طريقي هستيم. برخي اوقات مي‌توان اين كار را بدون توسل به اعداد كرد، يعني مثلا مي‌گوييم «مردم ميل به زندگي در محيط خانوادگي دارند.» اما اگر بخواهيم دقيق‌تر حرف بزنيم نياز به كمي كردن است؛ براي مثال با ذكر درصدی از مردم كه در محيط خانوادگي زندگي مي‌كنند؛ يعني از علم آمار استفاده مي‌كنيم.
اينكه با کمک علم آمار می‌توان داده‌ها را به شكل فشرده توصيف کرد استفاده مهمي از اين علم بوده، اما تنها مورد استفاده نيست. استفاده ديگر، كندوكاو و عميق شدن در آن چيزي كه به آساني قابل‌مشاهده ‌باشد و استنتاج روابط زيربنايي است. براي مثال اينكه آيا تفاوت درآمد بين يك نمونه از نيويوركي‌ها و يك نمونه از شيكاگويي‌ها احتمالا فقط به علت ويژگي‌هاي نمونه‌ها يا تفاوت‌هاي واقعي درآمدها بوده است و اينكه آيا تغييرات يك متغير، مثلا كسري بودجه دولت، باعث تغيير در متغيري ديگر مثلا GDP مي‌شود. هدف اين كتاب آموزش دادن به شما درباره چگونگي يافتن و رد كردن استدلال‌هاي نادرست است. به اين جهت با انواع روش‌هايي آشنا مي‌شنويم كه مي‌توان از علم آمار براي دزديدن عقل ما استفاده كرد. شايد اين باعث شود نتيجه بگيريد پس اصلا ارزش ندارد که خود را به زحمت انداخته و علم آمار را یاد بگیریم، اما اين تفكر اشتباه است. تهيه فهرست نسبتا جامع از همه حوادثی كه هنگام رفتن به خريد ممکن است برايتان اتفاق بيفتد از سر خوردن هنگام سوار شدن به خودرو تا افتادن مواد غذايي روي انگشت پايتان نيز شايد چنين به نظر آيد كه در خانه ماندن و از گرسنگي مردن برايمان بهتر است.
هنگام توضيح در این ‌باره که چگونه آمار را بخوانيم و ارزيابي كنيم ابتدا بايد با سه طرز تلقي منفي مبارزه كرد. يكي اين تلقی كه علم آمار، يك نوع سنديت و اصالت «علمي» فراهم مي‌كند: پيش كشيدن آماري كه از نظر شما حمايت مي‌كند روش قاطعي براي پايان بخشيدن به يك استدلال است. اين حرف چرتي است. «نگاه به داده‌ها» اغلب نخستين گام در يك تحليل جدي است. برخي اوقات نياز است بپرسيم چگونه داده‌ها جمع‌آوري شده‌اند، تعاريف مورد استفاده چقدر مرتبط با آن‌ چيزي هستند كه ما مي‌خواهيم اندازه بگيريم، داده‌هاي رقيب چه چيزي نشان مي‌دهند و غير آن. تلقي دوم اين است كه تمام آمارها غيرقابل اعتماد بوده و بايد ناديده گرفته شوند و در حالي‌كه اعداد دروغ نمي‌گويند دروغگويان عددسازي مي‌كنند، اما اين نيز حرف بي‌منطقي است. اگر از آمار با ژرف‌انديشی استفاده شود شاهراهي به حقيقت به روي ما مي‌گشايد. واكنش درست به وجود آمارهاي دروغ و غيرقابل اتكا اين است كه خواننده شكاك و نه بدبين و بي‌تفاوت باشيم؛ يعني با اطلاعات عددي دقيقا مثل اطلاعات كاملا زباني برخورد كنيم. سومين تلقي از آمار اين باور است كه وقتي با آمار مواجه مي‌شويد امكان درك آنچه اتفاق مي‌افتد نيست مگر اينكه سواد رياضي بالايي داشته باشيد، اما در اينجا هيچ دانش رياضيات بيش از سطح دبستان نياز نيست؛ بنابراين محتواي اين بخش بسيار شبيه به منطق شفاهي است كه هر روز به كار مي‌بريم.

3- هنگام نگاه به آمارها، حواسمان
به چه جاهایی باشد
پيش از اينكه به سنجه‌هاي معين آماري و امكان بهره‌برداري نادرست از آنها بپردازيم، لازم است به برخي دلايل احتياط و حواس جمعي درباره آمار نگاهی بیندازیم.

محدودسازي دامنه تمركز
فشرده‌سازي اطلاعات كه با علم آمار ممكن مي‌شود فايده زيادي داشته، اما يك مانع جدي نيز هست. علم آمار با پرتوافكني قدرتمند بر يك جنبه معین از وضعيت، ما را ترغيب به ناديده گرفتن ساير جنبه‌هاي آن وضعيت مي‌كند و در نتيجه آنچه را مي‌توانست تفاوت‌هاي مهم بين مشاهدات مختلف ما باشد كمرنگ مي‌سازد. برای آمارداني كه خواهان اندازه‌گيري وزن مردم است، يك مرد بانكدار 25 ساله ساكن نيويورك و يك زن بدبخت 60 ساله ساكن هائيتي كه وزن هر دو 70 كيلوگرم است يكسان هستند. تنها چیزی از مردم که براي او اهميت دارد وزن آنها است. اين را با كار یک روزنامه‌نگار مقايسه كنيد كه با
5 عراقي مصاحبه مي‌كند و نتيجه را چنان گزارش مي‌كند كه گويي نشانه افكار عمومي عراقي‌ها است. آماردان مي‌گويد چنین تعميمی بي‌معني است و نمونه وي بسيار اندك بوده و نماينده جامعه عراقي نيست چون كه اين پنج نفر احتمالا به اين دليل انتخاب شده‌اند كه مايل به صحبت با يك گزارشگر آمريكايي بوده‌اند و نيز شايد به اين دليل که می‌توانستند انگليسي صحبت كنند. آماردان مي‌گويد براي شناخت افكار عمومي جامعه عراق، يك نظرسنجي آماري با نمونه كافي و تصادفي انتخاب شده انجام دهید. گزارشگر شايد در جواب بگويد اگر چه گزارش از نظر آماري ايراد داشته، اما حكم يك نظرسنجي آماري را دارد چون به مردم اجازه داده است هر چه مي‌خواهند بگويند و درك گوناگوني به دست مي‌آيد كه با نگاه به اعداد اصلا به دست نمي‌آيد. آرتور كستلر (نويسنده رمان مهم سياسي «تاريكي در نيمروز») زماني گفته بود: «آمار چیزی بیرون نمي‌دهد، این جزئیات است که اهمیت دارد.» و آنچه آماردان‌ها هنگام ارائه ميانگين‌ها مي‌شويند و كنار مي‌گذارند گاهي اوقات بسيار مهم است. مثل اين مي‌ماند كه يك وكيل مدافع در مراسم بازنشستگي خود چنين بگويد: من برخي مشتريان خود را كه مي‌دانستم گناهكار هستند از مجازات رهانيدم، در حالي‌كه عده‌اي ديگر از مشتريان كه مي‌دانستم بيگناه هستند محكوم شدند. خوب ميانگين كه بگيريم عدالت اجرا شده است.»
به‌علاوه از آنجا كه اندازه‌گيري بسيار مهم است بسیار وسوسه مي‌شويم كه باور كنيم هر چيزي قابل اندازه‌گيري نباشد پس مهم نيست يا دست‌كم اينكه تاكيد زيادي روي آن نكنيم. براي مثال اقتصاددانان هنگام تبيين نسبت پس‌انداز، يعني درصدی از درآمد خانوار كه پس‌انداز مي‌شود، به آساني قادر به اندازه‌گيري چندين متغير توضيحي مثل اندازه خانوار، درآمد و ثروت آن هستند. آنچه كه آنها معمولا نمي‌توانند اندازه‌گيري كنند آينده‌نگري و دوراندیشی است. پس آنها معمولا فرض مي‌كنند كه اين عامل در بين همه خانواده‌ها يكسان باشد؛ بنابراين هنگام تبيين تفاوت نرخ پس‌انداز انواع خانواده‌ها، ناديده گرفته مي‌شود. برخي اوقات وقتي اين كار را مي‌كنيد و يك عامل را ناديده مي‌گيريد چون توانايي اندازه‌گيري آن را نداريد، داده‌ها حسابي شما را گوشمالي مي‌كنند: تنها توانايي تبيين بخش اندكي از نوساناتي را پيدا مي‌كنيد كه سعي در تبيين داريد، اما فرض كنيد آن‌طور كه احتمالا به نظر مي‌رسد، آينده‌نگري با ثروت همبستگي مثبت داشته باشد. پس تحليل شما برازش خوبي با داده‌ها پيدا مي‌كند، اما اهميت ثروت را زياده برآورد مي‌كند چون كه ثروت تا حدودي به جاي آينده‌نگري آمده است و نيز اهميت تفاوت‌هایي در آينده‌نگري را به كلي از دست داده‌ايد.

داده‌هايي كه به من داده شده است
توليد داده‌هاي خام آماري از نظرسنجي‌ها، اغلب فوق‌العاده پرهزينه است و نيز آنهايي را كه زحمت پاسخ دادن به خود نمي‌دهند حذف مي‌كند. از آنجا كه دولت جيب‌هاي بزرگي دارد و مي‌تواند مردم را وادار به پاسخ دادن كند، اقتصاددانان عمدتا متكي به آمار توليدی دولت هستند، اما دولت اين داده‌ها را توليد نمي‌كند تا اقتصاددانان آكادميك را خوشحال سازد بلكه براي استفاده خود است. برخي اوقات آنچه دولت اندازه‌گيري مي‌كند ارتباط نسبتا نزديك با آنچه اقتصاددانان مايل به اندازه‌گيري هستند دارد؛ اما در ساير زمان‌ها، سنجه‌هاي دولت، پيوند ضعيف با متغيرهاي مورد استفاده در تئوري اقتصادي دارد به طوري كه استفاده از اين داده‌ها براي آزمون تئوري برخي اوقات كار پرزحمتي است. زمان‌هايي هست كه اگر داده‌ها با تئوري نمي‌خواند، معقول‌تر است كه داده‌ها را نامناسب تشخيص دهيم تا اينكه بخواهيم تئوري را دور بيندازيم.

خطاها در داده‌ها
مشكل مهم ديگر به كيفيت داده‌هاي ما مربوط مي‌شود. در حالي‌كه برخي داده‌ها از قبيل داده‌هاي قيمت سهام و نرخ ارز عالي هستند بيشتر داده‌ها به درجات متفاوت ضعف دارند. يك دليل بديهي ضعف داده‌ها به هزينه بالاي جمع‌آوري آنها مربوط است و اگر چه داده‌هاي غيرقابل اعتماد منجر به تصميمات سياستگذاري زيان‌بار مي‌شود، پيشنهاد هزينه بيشتر كردن در آمار اقتصادي روش مطمئن تهیيج و برانگیختن راي‌دهندگان نيست. دليل ديگر اين است كه عده‌اي از مردم ميلي به ارائه داده‌هاي مورد نياز ندارند يا اينكه آنها را منكر مي‌شوند؛ بنابراين عده‌اي از مردم در جايي كار مي‌كنند كه «اقتصاد زيرزميني» ناميده مي‌شود، يعني ميزان درآمد و اشتغال خود را به اداره ماليات و ساير ارگان‌هاي دولتي گزارش نمي‌دهند. اندازه‌گيري اين میزان از GDP که کمتر گزارش می‌شود دشوار است و برآوردهاي موجود بسيار متفاوت است اما براي اقتصاد آمريكا چيزي حدود 10 درصد GDP رقم نامعقولي نيست. در بيشتر كشورها به خصوص كشورهاي كمتر توسعه يافته، اين رقم بسيار بيشتر است.
دليل سوم كه نامحسوس‌تر است شکاف بين آنچه ما دوست داريم داده‌هايمان اندازه‌ بگيرند و آنچه آنها واقعا اندازه‌گيري مي‌كنند هست. براي مثال اصولا كاري كه مردم براي پخت غذا و ساير كارهاي خانه مي‌كنند يك نوع توليد محصول و دقيقا شبيه كاري است كه آنها در كارخانه‌ها و ادارات مي‌كنند، اما ما فاقد داده‌هاي كافي درباره كار منزل هستيم؛ به طوري كه آن را در GDP شامل نمي‌كنيم. اين تنها يكي از چندين تفاوت بين آن چيزي است كه ما دوست داريم در GDP شامل كنيم و آنچه قادر به شامل كردن هستيم. بسياري از مجموعه داده‌ها نیز مشكلات خاص خود را دارند: مثل شاخص‌هاي قيمت، اندازه‌گيري اشتغال و نرخ فقر.
چهارم اينكه داده‌هاي استخراج شده به صورت پسماندهاي كوچك از تفاوت بين اعداد بزرگ و به صورت درصد بيان كردن آنها، مثلا نرخ پس‌انداز، مستعد ایجاد خطاهاي بزرگي هستند.
پس خطاهاي محاسباتي و نسخه‌برداري وجود دارد. در دوره‌اي آنها تعداد زيادي از مقالات در نشريات علمي اقتصادي را آلوده كردند و شايد هنوز هم مي‌كنند، در حالي‌كه در بيشتر موارد نتايج كلي يك مقاله را تغيير نمي‌دهند در مواردي اين كار را مي‌كنند. وقتي با حجم انبوه داده‌ها سروكار داريم، نسخه‌برداري از خطاها، از قبيل جابه‌جا شدن ارقام احتمالا رخ مي‌دهد. (من دو بار خطاهاي جدي در يك پايگاه داده‌هاي همگاني يافتم.) در كارهاي خودم برخي خطاها يافته‌ام كه با كنترل دقيق هم هنوز پابرجا بودند. كاربرد رايانه اين مشكل را از بين نبرده است. (به‌علاوه اگر اشتباهي مثل ضرب كردن هنگامي كه بايد تقسيم كنيد مرتكب گرديد، وقتي محاسبات پرزحمت را با ماشين حساب اداري مي‌كنيد احتمال بيشتري هست متوجه خطاي خود در مراحل بعدي شويد نسبت به كار با برنامه كامپيوتري كه با يك فشار انگشت به برنامه مي‌گويد ضرب را انجام دهد.) به‌علاوه حتي اگر داده‌ها به درستي وارد شده باشند، برنامه‌هاي كامپيوتري متفاوت براي محاسبات پيچيده، نتايج بسيار متفاوتي بيرون مي‌دهند كه در نهايت يكي از اينها درست است.

دقت و خطاها
تحت‌تاثير دقت ظاهري آمارهاي اقتصادي قرار نگيريد. در بيشتر موارد وانمود مي‌شود كه دقيق هستند. براي مثال گزارش اقتصادي به رييس‌جمهور در سال 2008 نشان مي‌دهد كه GDP در سال 2007 رقم 5/13،970 ميليارد دلار است. ما خودمان را خوشبخت مي‌دانيم اگر سومين عدد اين رقم به اندازه 1 واحد هم بالا رود.
برآورهاي مقدماتي در معرض بازنگري‌هاي زياد بوده؛ بنابراين شايسته توجه بالايي نيستند. نخستين برآورد از رشد دستمزد ساعتي كاركنان در فصل دوم سال 1966 با نرخ 6/6 درصد رشد كرده بود. نخستين بازنگري، اين برآورد را به 2/1- درصد پايين آورد. اقتصاددانان اين را مي‌دانند و گول چنين ادعاهاي ساختگي درباره دقت داده‌ها را نمي‌خورند، اما سايرين اين‌طور نيستند.

مشكلات تركيب كردن داده‌ها
در فصل سوم سال 2006 ميانه قيمت يك خانه در آمريكا 7/1 درصد سقوط كرد. در عين‌حال، داده‌ها نشان مي‌داد كه در تمام چهار منطقه كشور قيمت ميانه خانه افزايش يافت: به ميزان 3/19 درصد در شمال شرق، 4 درصد در غرب ميانه، 7/0 درصد در جنوب و 6/1 درصد در غرب. چگونه امکان دارد چنین اتفاقي افتاده باشد؟ پاسخ اين است كه تركيب منطقه‌اي؛ بنابراين وزن‌هاي مناطق مختلف در ميانگين ملي تغيير كرد. تعداد خانه فروخته شده در جنوب از 49 درصد كل خانه‌هاي كشور در فصل قبلي به 55 درصد در فصل سوم 2006 تغيير كرد. از آنجا كه ميانه قيمت خانه در جنوب ارزان‌تر است، وزن بزرگ‌تر خانه‌هاي جنوب در ميانگين، ميانگين ملي را پايين كشيد. يك مثال ديگر مي‌آوريم. يك دانشگاه متهم به تبعيض جنسيتي در پذيرش دانشجويان تحصيلات تكميلي شد؛ چون نسبت كمتري از درخواست‌كنندگان مونث را پذيرفته بود. از آنجا که پذيرش اين دانشجويان در سطح دپارتمان انجام مي‌شود، دانشگاه همه دپارتمان‌ها را كنترل كرد و هيچ تبعيضي مشاهده نشد، اما دپارتمان‌هايي كه بيشترين نسبت درخواست‌كنندگان مونث را داشتند نسبت كوچك‌تري از هر دو درخواست‌كننده مونث و مذكر نسبت به ساير دپارتمان‌ها پذيرفته بودند. دليل آوردن از آنچه برای كل اتفاق افتاده است به آنچه در واقع برای اجزاي آن اتفاق مي‌افتد خطرناك است. اگر مجبورید تحقيق كنيد چرا چيزي بالا مي‌رود يا پايين مي‌آيد، بهتر است ابتدا نگاه كنيد چه اتفاقي براي هر كدام از اجزا مي‌افتد.

تعهد علمي و داده كاوي
مشكل ديگر، تعهد علمي افراطي است. اقتصادداني كه چندين بررسي درباره يك قضيه بحث‌انگيز انجام داده است، احتمالا در كار بعدي خود به پاسخي مشابه آنچه در كارهاي پيشين خود انجام داد مي‌رسد. همه ما انگيزه قوي داريم تا ببينيم داده‌هاي جديد ما، آنچه را كارهاي پيشين ما نشان داده است تاييد كند يا دست‌كم رد ننمايد. اين براي احساس از خود راضي بودن فرد خوب است- چه كسي مي‌خواهد اشتباه را بپذيرد؟ براي كار و حرفه شخص نيز خوب است. در محيط دانشگاهي، مثل هر جاي ديگر، مديريت معمولا نيازمند پيروي از يك مسير سازگار است. به علاوه چه‌كسي مي‌خواهد متحدان فكري خود را نااميد سازد؟ دليل ديگر كه فكر مي‌كنم اهميت كمتري دارد اين است كه ما مي‌خواهيم نتايج پژوهش ما با باورهاي سياسي و ايدئولوژيك ما سازگاري داشته باشد.
تعهد علمي لزوما دلالت بر بي‌صداقتي ندارد. ما نه فقط آنچه را مي‌بينيم باور مي‌كنيم، بلكه آنچه را باور مي‌كنيم نيز مي‌بينيم. يك مثال ساده اينجا آورده‌ام. فرض كنيد من آزمون آماري انجام مي‌دهم و نتيجه‌اي كاملا خلاف آن چيزي كه انتظارم دارم به دست مي‌آورم. نخستين واكنشم اين است كه بايد يك خطا در وارد كردن داده‌ها مرتكب شده باشم. پس كار را نگاه كرده و مي‌بينم واقعا همين اتفاق افتاده است. اينكه عالي است. اگر نتايجي را منتشر كنيم كه به علت خطا در وارد كردن داده‌ها به دست آمده است رفتار غيرمسوولانه‌اي است، اما فرض كنيد من خطاي وارد كردن داده‌ها مرتكب شده‌ام كه فرضيه من را پشتيباني مي‌كند. پس من دوباره كارم را بازبینی نخواهم كرد. چنين برخورد متفاوتي در حالي‌كه معقول است نتايج آماري من را به نفع فرضيه‌ام سوگيري مي‌كند.
همانطور كه مي‌دانيد واژه «سوگيري» اغلب معناي متفاوتي در اقتصاد و آمار نسبت به زندگي معمولي دارد. لزوما يا حتي معمولا دلالت بر بي‌صداقتي و حمايت ويژه ندارد بلكه معمولا به يك مساله اجتناب‌ناپذير اشاره دارد. سوگيري‌ها نشانه كوتاهي اخلاقي پژوهشگر است فقط اگر قابل‌اجتناب‌ باشد يا اگر پژوهشگر يك سوگيري چاره‌ناپذير را از ديد خواننده پنهان كند يا اگر نتايجي را كه از «طرف ديگر» بحث پشتيباني مي‌كنند پنهان كند.
نسخه پيچيده‌تر- و مبهم- دور ريختن آزمون‌هايي كه فرضيه را رد مي‌كنند به شرح زير است: فرض مي‌كنيم شما معتقديد تغيير نرخ رشد پول علت اصلي تبيين‌كننده نرخ تورم است. به داده‌هاي نرخ رشد پول و نرخ تورم نگاه مي‌كنيد و متاسفانه داده‌ها از فرضيه شما پشتيباني نمي‌كنند. چكار مي‌توانيد بكنيد؟ خوب شايد از خودتان بپرسيد كه آيا احتمال ندارد دوره زمانی كافي براي تغييرات نرخ رشد پول در نظر نگرفتيد تا اثر خود را بر جاي بگذارد. پس تحليل خود را دوباره انجام مي‌دهيد اين دفعه وقفه زماني طولاني‌تري در نظر مي‌گيريد. اگر نتيجه گرفتيد كه خيلي عالي است. اگر نه، پس از خودتان مي‌پرسيد كه آيا سنجه پول انتخابي براي آزمون از بين چندين سنجه قابل‌تامل شايد سنجه درستي نباشد و دوباره تحليل خود را انجام مي‌دهيد. اگر به نتيجه دلخواه نرسيديد مي‌توانيد تكانه عرضه از قبيل افزايش شديد قيمت نفت را هم بيافزاييد. هر كسي با به كار گرفتن قدرت تخيل خويش مي‌تواند چندين روش ديگر براي اصلاح آزمون خود پيدا كند. پس هر زمان يكي از اين روش‌ها سرانجام از فرضيه‌تان پشتيباني كرد مي‌توانيد با افتخار اعلام كنيد كه «داده‌ها از فرضيه من پشتيباني كردند.» اين فرآيند شكنجه كردن داده‌ها نام‌هاي بسياري دارد كه در بين آنها «داده‌كاوي»، «وارسی داده‌ها» و «صید داده‌ها» ناميده مي‌شود. با وجودي كه بسياري متعجب مي‌شوند اين كار در سطح گسترده انجام مي‌شود.
يك دليل چنين كاري اين است كه اغلب اوقات فرضيه مورد آزمون از مفاهيمي مثل «پول» استفاده مي‌كند كه همتاي روشن و بي‌ابهامي در داده‌هاي موجود ندارند؛ پول را مي‌توان چنان باريك تعريف كرد كه اسكناس و مسكوك در گردش به‌علاوه سپرده‌هاي ديداري باشد يا تعريفي گسترده داشته باشيم كه سپرده‌هاي مدت‌دار و سهام در صندوق تعاوني بازار پول را شامل شود. به‌علاوه تئوري ما معمولا مشخص نمي‌سازد چه مدت زمان مي‌برد تا اثرات پيش‌بيني شده رخ دهد و آنچه که ساير متغيرها بايد در نظر بگيرند؛ بنابراين اگر در نخستين كوشش موفق نشديد، كاملا منطقي است كه فرضيه خود را متهم نسازيد، بلكه ايراد را در متغيرهاي خاص و وقفه‌هاي زماني كه استفاده كرده‌ايد يا در تصريح روش آماري از قبيل تبديل داده‌ها به لگاريتمي بدانيد. هرگز نمي‌توان هيچ فرضيه‌اي را در انزوا آزمون كرد: آزمون هميشه شامل فرضيه‌هاي جانبي است از قبيل شيوه درست اندازه‌گيري متغيرهاي معين، يا طول وقفه‌هاي معين. از آنجا كه ما نمي‌توانيم اينها را با اعتماد زيادي در همان آغاز مشخص سازيم، چاره‌اي نداريم كه چندين نوع از آنها را امتحان كنيم. وضعيت ايده‌آل زماني است كه دو يا چندين مجموعه داده‌ داشته باشيم و يكي از آنها را استفاده كنيم تا سنجه‌ها، وقفه‌ها و... درست را پيدا كنيم و سپس اين اطلاعات را براي آزمون فرضيه با مجموعه داده‌هاي ديگر استفاده كنيم، اما اغلب فقط يك مجموعه داده در دسترس است.
اين مشكل منحصر به علم اقتصاد نيست. اينكه فرضيه بايد مشتركا آزمون شود در علوم طبيعي نيز صادق است. و اينكه تنها بهترين نتايج عرضه مي‌شود نيز منحصر به علم اقتصاد نيست. وقتي برخي شركت‌هاي دارويي داروهاي جديد را آزمون مي‌كنند و نتيجه منفي به دست مي‌آورند، آنها دوباره و دوباره آزمون مي‌كنند با اين اميد كه سرانجام يك نتيجه مثبت به دست خواهند آورد كه سپس قابليت انتشار عمومي دارد.
واكنش معقول اين نيست كه نتيجه به دست آمده در هر بررسي، چه در اقتصاد يا در ساير حوزه‌ها را خيلي جدي بگيريم، بلكه باید منتظر باشيم تا توسط ساير بررسي‌ها با استفاده از داده‌های جدید و با روش‌هاي متفاوت تاييد گردد. اين نيز به مساله قبلا بحث شده خطاي داده‌ها كمك خواهد كرد، اما دفاع از چنين صبر و بردباري اغلب توصيه غيرواقع‌بينانه‌اي است. بيشتر بررسي‌ها تكرار نمي‌شوند چون نتايج آنها به اندازه‌اي مهم ملاحظه نمي‌شوند كه ارزش زمان يك شخص را داشته باشد؛ يا اگر ارزش داشته باشد و تكرار بررسي به همان نتايج بررسي اوليه برسد، سردبيران نشريات علمي، چنين مقالاتي را آنقدر باارزش نمي‌بينند که دوباره منتشر شوند چون به حد كافي اصيل نيستند كه همين امر انگيزه انجام چنين بررسي‌هايي را از همان اول كم مي‌كند. به علاوه شايد فقط يك مجموعه داده‌ها در دسترس باشد به طوري كه تكرار كردن بررسي، برخي از مشكلات بررسي اوليه را همچنان داشته باشد.

دروغ گفتن و پيچاندن
مادامي كه كساني هستند كه تحت‌تاثير اعداد قرار مي‌گيرند چون اعداد حالتی دقيق، رياضي‌وار؛ بنابراين «علمي» دارند، ذخيره كافي آمار ساختگي وجود خواهد داشت كه برخي از آنها يكسره دروغ هستند، اما نيازي نيست دروغ تابلوداري گفت تا تاثير نادرستي بر جا گذاريم. پيچاندن همين كار را مي‌كند. يك مثال از اطلاعات غلط دادن با عبارات فني درست اين است كه بگوييم «تا حداكثر» يا «تا حداقل». يك فروشگاه دروغ نمي‌گويد وقتي كه ادعا مي‌كند قيمت‌هاي خود را «تا حداكثر 50 درصد» كاهش داده است هر چند كه فقط قيمت يكي از 3000 قلم كالاي در معرض فروش خود را بيش از 5 درصد كاهش داده است و احتمال بيشتري مي‌رود كه مشتريان «50 درصد» را به جاي «تا حداكثر» به ياد داشته باشند.
خرده‌فروش‌ها و تبليغاتچي‌ها تنها شيادها نيستند. مقامات دولتي نيز با موفقيت مي‌پيچانند، هم چون اگر دستشان رو شود كه دروغ روشني گفته‌اند شرمندگي بسياري برايشان مي‌آورد. پس آنها بايد در اطلاعات غلط‌دادن به عموم احتياط كنند، اما آنها هر كاري بتوانند مي‌كنند. براي مثال چون نيروي كار در حال افزايش است، اين امكان هست كه تعداد شاغلان نسبت به گذشته افزايش یابد در حالي كه نرخ بيكاري نيز بالا مي‌رود. اگر اين اتفاق بيفتد، گزارش خبري كه كاخ سفيد منتشر مي‌كند، به احتمال زياد بر رقم اشتغال تاكيد مي‌ورزد و نرخ بيكاري را ناديده مي‌گيرد در حالي كه اگر عکس آن اتفاق بيفتد احتمال بيشتري مي‌رود كه دولت بر كاهش نرخ بيكاري تاكيد نمايد. به علاوه تعاريف نيز تغيير مي‌كنند تا با نيازها جور درآيند. براي مثال وقتي آیزنهاور با احتمال كسري بودجه كوچك اما نمادين مواجه شد، فدرال رزرو را (كه در خارج از بودجه بود) ترغيب کرد تا مقداري از وجوه خود را به خزانه بدهد به طوري كه بودجه ظاهرا متوازن شود، اگرچه آنچه اتفاق افتاد انتقال بي‌معني از يك جيب دولت به جيب ديگر بود. به دنبال آن، جانسون براي اينكه كسري منتشره نه واقعي را كاهش دهد صندوق امانات تامين اجتماعي را وارد بودجه كرد. و در سال 2006 وقتي كسري بودجه كمتر از ميزان سال قبل بود كاخ سفيد اعلام كرد كه اين نشان‌دهنده موفقيت سياست مالي بوش بوده است. اين گزارش اشاره‌اي نكرد كه پيش‌بيني‌هاي بودجه نشان مي‌دهد كسري بودجه در سال‌هاي بعدي به شدت افزايش خواهد يافت. گزارش مطبوعاتي دولت دروغ نگفت؛ فقط در اعلام حقيقت، صرفه‌جويي به خرج داد. پيش‌بيني‌ها براي سال‌هاي آتي، همچنين «تعديلاتي» كه دولت‌هاي آیزنهاور و جانسون انجام دادند اطلاعات عمومي در دسترس بود به طوري كه دولت را نمي‌توان متهم به پنهان‌كاري شديد كرد.
سطوح پايين‌تر دولت نيز آمادگي پيچاندن دارند. ديويد كاولز مثال روشنگرانه زير را پيدا كرد: اداره منابع طبيعي مينه‌سوتا اظهار كرد كه شوراي ايمني ملي گزارش داده است تعداد كساني كه به اتاق درمان اورژانس به خاطر زخم‌هاي ورزشي مراجعه مي‌كنند در هر 100 هزار نفر شركت‌كننده در شكار، كمتر از رشته‌هاي فوتبال، بيسبال، بيليارد و پينگ پنگ است. آن طور كه كاولز به درستي اشاره مي‌كند اين گزارش وخامت و شدت زخم‌ها را ناديده مي‌گيرد و نيز تعداد كساني كه به جاي رفتن به اتاق اورژانس سر از سردخانه درآورده‌اند و نيز ميزان وقتي را كه مردم صرف شكار مي‌كنند كه در مقايسه با ساير ورزش‌ها بسيار كمتر است در نظر نمي‌گيرد.
فعالان اجتماعي نيز مي‌توانند تور عالي ببافند؛ بنابراين
«ائتلاف نجات دارفور» يك تبليغات منتشر كرد كه تعداد كشته‌هاي دارفور را 400 هزار «مرد، زن و كودك بیگناه» اعلام مي‌كرد وقتي حداكثر رقم واقعي كه مي‌توان براي كشته‌ها داد نصف آن بود. آنطور كه جوئل بست توضيح مي‌دهد: مطبوعات از فعالان اجتماعي درخواست آمار مي‌كنند... فعالان اجتماعي با دانستن اينكه اعداد بزرگ نشان‌دهنده مشكلات بزرگي است و اينكه مردم را وادار به كاري كردن بسيار سخت است مگر اينكه مردم متقاعد شوند مشكل بزرگي وجود دارد (و صادقانه باور كنند) تخمين‌هاي بزرگي ارائه مي‌دهند.» آيا بايد آنها را به خاطر چنين كاري سرزنش كرد؟» تصور كنيم شما يك فعال اجتماعي در حوزه بي‌خانمان‌ها هستيد. شما مطمئن هستيد كه مشكل بي‌خانماني بسيار بزرگ‌تر از آن چیزی است که بيشتر مردم فكر مي‌كنند. كوتاه زماني پيش از اينكه با تلويزيون مصاحبه كنيد با دو برآورد از تعداد كودكان بي‌خانمان برخورد مي‌كنيد كه رقم يكي دو برابر ديگري است. هيچ راه و فرصتي براي اينكه بفهميد كدام‌يك درست است نداريد. بايد چكار كنيد؟ اگر هر دو برآورد را ذكر كنيد و بي‌طرف بمانيد اين‌طور به نظر مي‌رسد كه بي‌اطلاع از قضايا هستيد؛ بنابراين كارآمدي پيامتان كاهش مي‌يابد. آيا منصفانه است كه شما را بابت بي‌صداقتي مقصر بدانيم اگر كه فقط برآورد بالاتر را ذكر كنيد؟ پاسخ من بلي است. برايم قابل‌درك است چرا ديگران با من موافق نيستند، اما آنها بايد از شيب لغزنده آگاه باشند. نقطه بعدي در اين شيب، استفاده از برآورد بالاتر است حتي اگر فكر كنيد كه برآورد پايين‌تر احتمال بيشتري دارد درست باشد و به زودي در نقطه‌اي قرار می‌گیرید كه برآورد بالاتر را استفاده مي‌كنيد هر چند كه مي‌دانيد نادرست است. سياستمداران به خصوص در معرض اين وسوسه هستند، همان‌طور كه شخصيت‌هاي راديو و تلويزيون هستند.
اگر شما فكر مي‌كنيد سر خوردن زياد در يك مسير شيب‌دار بسيار بعيد است پس اين را نگاه كنيد. يك نظرسنجي در 1991 گزارش داد كه 5/11 ميليون كودك آمريكايي در خطر گرسنگي قرار دارند. اين به نظر وحشتناك مي‌رسيد به خصوص اگر كسي «در خطر» گرسنگي را واقعا با گرسنه بودن یکی بگيرد، آنطور كه يك خواننده بي‌دقت احتمالا دچار آن مي‌شود، اما اين نظرسنجي يك بچه را در خطر گرسنگي مي‌دانست اگر والدين وي به هر يك از مجموعه پرسش‌هاي خاص پاسخ بلي مي‌دادند كه يكي از آنها اين بود: «آيا شما به خاطر ته كشيدن پولتان براي خريد مواد غذايي، تاكنون مجبور شدید به تعداد محدودي خوراكي براي تغذيه كودكانتان متكي شوید؟» كه اصلا تعريف خوبي از «گرسنگي» نيست. در مثال ديگري، توماس سوول نقل مي‌كند كه وقتي نشان داده شد ادعاهاي به عمل آمده در این‌باره که با ارائه مراقبت پيش از زايمان چقدر پول صرفه‌جويي شده است توجيه نداشتند، رييس دپارتمان تندرستي جنين و پيش از زايمان در مدرسه تندرستي عمومي هاروارد پاسخ داد كه «توجيه اين خدمات با تحليل هزينه و فايده ضعیف است،» اما آن را توجيه كرد چون «مردم به اين نوع تلاش وادار شدند،» چرا که سياستمداران «اكراه دارند پول را براي خدمت به فقرا خرج كنند.» به عبارت ديگر، وارونه جلوه دادن ايرادي ندارد اگر براي آرمان خوبي باشد. و اين كار در محيط دانشگاهي مي‌شود!

بي‌دقتي و ناداني
در حالي‌كه عمدا پيچاندن واقعيات كاري نكوهيده است، خطاهاي صادقانه اما ناشي از بي‌توجهي نيز اطلاعات گمراه‌كننده زيادي توليد مي‌كند. برخي اوقات تقصير آن نه بر عهده توليدكننده داده‌ها بلكه خواننده است. فرض كنيد يك گزارش خبري ابراز مي‌دارد «تا حداكثر پنجاه نفر مردند.» اگر در آن لحظه‌اي كه خبر خوانده شده است پرسش شود، تعدادي از خوانندگان خبر را به خوبي فهميده‌اند و مي‌گويند دقيقا نمي‌دانند چند نفر مرده‌اند فقط اينكه بيشتر از پنجاه نفر نبوده است، اما من گمان مي‌كنم اگر يك ساعت بعد از آنها پرسيده شود اكثريت جواب خواهد داد «پنجاه نفر» يا احتمالا «حدود پنجاه نفر.» اعداد در حافظه ما دوام بيشتري مي‌آورد تا شرط و شروطي كه براي آنها در نظر گرفتيم. يك تيتر روزنامه نيويورك تايمز نوشته بود «نيروي ناتو مي‌گويد 70 نفر از طالبان در جنگ شبانه كشته شدند.» در حالي‌كه خود مقاله گزارش مي‌دهد كه «نيروهاي ناتو و افغان احتمالا تا حداكثر 70 نفر... را كشته‌اند.» ديويد موراي، جوئل شوارتز و رابرت ليختر مثال‌هاي فراواني مي‌آورند كه چگونه رسانه‌ها نتايج بررسي‌هاي علمي را اشتباه برداشت مي‌كنند. جوئل بست يك مقاله سال 1995 را از نشريه‌اي بدون ذكر نام مي‌آورد كه ادعا مي‌كند «هر سال از 1950 تعداد بچه‌هاي آمريكايي كه به ضرب گلوله كشته شده‌اند دو برابر شده است.» نويسنده مقاله اطلاعات دريافتي از منبع خود را مخدوش كرده است. گزارش سال 1994 مي‌گويد «از 1950 تاكنون» تعداد بچه‌هايي كه در یک سال با اسلحه كشته شده‌اند دو برابر شده است- كه كاملا متفاوت از دو برابر شدن تعداد كشته‌ها «در هر سال» است.
وقتي اداره آمار يك گزارش درباره ازدواج منتشر كرد كه نشان مي‌داد كمتر از نصف تمام ازدواج‌هايي كه بين 1975 و پايان 1979 انجام شده است تا 25امين سالگردشان دوام آورده است، سر و صداي زيادي به پا كرد كه خانواده آمريكايي دچار بحران است و اينكه بايد كاري در اين باره صورت گيرد. كاري كه بايد انجام شود توجه به اين نكته است كه ازدواج‌هاي انجام شده در اواخر دهه 1970 همگي شانس اين را نداشتند تا به 25مين سالگرد خود برسند و وقتي اين عامل را در نظر مي‌گيريم، گزارش نشان مي‌دهد كه نرخ طلاق افزايشي نبوده است.

داده بي‌مصرف وارد كنيد- داده بي‌مصرف بيرون مي‌آيد
دانشمندان علوم كامپيوتر اين عبارت را برای وضعيت‌هايي ساخته‌اند كه قرار است كامپيوترها با دریافت داده‌های بی‌ارزش، نتایج عالی بیرون دهند. همين مشكل در علم آمار مطرح مي‌گردد. آمار توانايي پاسخ دادن به پرسش‌هاي بسياري را دارد- مادامي كه اهميت نمي‌دهيد آيا پاسخ درست است يا خير. و چون بيشتر مردم اهميت نمي‌دهند بايد مراقب «پاسخ‌ها» به پرسش‌هاي غيرقابل‌پاسخ دادني باشيد. براي نمونه، اطلاعات دقيق درباره رفتار شخصي خصوصي، يا موضوعات بالقوه شرم‌آور مثل مصرف مواد مخدر يا نوشيدن مشروبات را بايد با شك و ترديد نگاه كرد. همچنين پاسخ‌هايي كه به پرسش‌هايي داده مي‌شود كه پاسخگو فاقد اطلاعات لازم است. براي مثال پرسش‌هايي كه از مردم درباره تغيير درآمد از سال قبل مي‌شود داده بي‌مصرف توليد مي‌كند: مردم آن را به خاطر ندارند. و نيز اين پرسش كه «شما سال گذشته چقدر پس‌انداز كرديد؟» اين پرسش بايد به نحو دقيق‌تري بيان شود. و به داده‌ها از نظرسنجي‌هايي كه پاسخ‌دهندگان انگيزه دستكاري در نتايج دارند اعتمادي نكنيد. بسياري سال‌هاي پیش، مجلس ايالتي كاليفرنيا نگران كاهش توجه به امر آموزش در دانشگاه كاليفرنيا شد و درخواست كرد تا يك نظرسنجي انجام شود كه اعضاي هيات علمي وقت كاري خود را چگونه پر مي‌كنند. به اين جهت، دانشگاه به اعضاي هيات علمي گفت جدول استفاده از وقت روزانه خود را به مدت يك هفته تكميل نمايند. نه فقط هيچ روشي وجود نداشت كه گواهي كند آنها حقيقت را گفته‌اند بلكه اساتيد به آساني مي‌توانستند كارهاي خود را از يك هفته به هفته بعد جابه‌جا سازند و براي مثال اين هفته وقت بيشتري را صرف آموزش كنند مثلا با آماده ساختن يادداشت‌هاي ارائه درس يا پرسش‌هاي امتحاني كه براي هفته‌هاي بعدي نياز است و در عوض كارهاي پژوهشي خود را از این هفته به هفته‌هاي بعد جابه‌جا نمايند؛ بنابراين نمي‌توان نتايج اين نظرسنجي را جدي گرفت.

برخي مسائل ديگر
مشكل ديگري كه برخورد مي‌كنيم به قلمرويي مربوط مي‌شود كه فرضيه مورد آزمون به‌كار مي‌رود. فرض كنيد داده‌ها نشان مي‌دهد كه يك سال تحصيلات بيشتر، باعث يك و نيم سال افزايش طول عمر مي‌شود. آيا منظور اين است كه با صرف بيست سال بيشتر در دانشگاه (مثلا گرفتن چهار يا پنج دكتري) مردم به طور متوسط مي‌توانند طول عمر خود را سي سال افزايش دهند؟ البته كه نه: اين داده‌ها از مشاهدات مربوط به مردمي آمده است كه سطح نسبتا معمولي تحصيلات دارند (مثلا ديپلم) و دليلي ندارد كه فرض كنيم آن نتايج براي مواردي خارج از اين دامنه هم كاربرد دارد. حقيقتا حتي درون دامنه سال‌هاي تحصيلات كه واقعا در نمونه مشاهده شده است، خوبي برازش داده‌ها شايد تماما به علت تجمع شديد جمعيت در آن دامنه خاص باشد.
برخي از مهم‌ترين تكنيك‌ها در علم آمار در بستر آزمايش‌هاي كشاورزي گسترش يافت كه آزمايش‌كننده اطمينان داشت نمونه تصادفي است و اثراتي را كه تحقيق مي‌كرد بر تكه زمين‌هاي تصادفي به کار می‌برد، اما در اقتصاد كلان و برخي اوقات در اقتصاد خرد، بيشتر داده‌هايي كه در اختيار ما قرار مي‌گيرد در دست آزمايش‌كننده نبوده بلكه از تاريخ گرفته‌ايم به طوري كه هر يك از مشاهدات ما تصادفي نيستند. براي مثال GDP فصل سوم و فصل چهارم سال 2008 مشاهداتي مستقل نيستند، آنچه در اولي اتفاق مي‌افتد روي دومي تاثير مي‌گذارد در حالي‌كه يك متغير از قبيل سياست پولي كه بر GDP در يك فصل تاثير مي‌گذارد در فصل بعدي نيز تاثير دارد.
هشدار نهايي: مراقب داده‌هايي باشید كه دهان به دهان مي‌چرخند بدون اينكه با هر طناب قابل‌پذيرفتنی به منبعی وصل شده باشند. اگر كسي به شما مي‌گويد در يك سال معمولي پاي 21134 آمريكايي به گربه گير مي‌كند، بايد اين پرسش پيش بيايد كه واقعا چه كسي توانسته است اينها را حساب كند.
مشكلاتي كه تا اينجا ذكر شد تنها مشكلاتي نيستند كه وظيفه اغلب دشوار استنتاج اطلاعات درست از داده‌هاي موجود را پيچيده مي‌كنند. مشكل ديگر اجتناب از مغالطه رگرسيونی است كه مستلزم درك نمونه‌گيري است و مشكل ديگر، استنتاج عليت از همبستگي‌هاي مشاهده شده است كه در بخش بعدي به آنها خواهيم پرداخت.
ماخذ:دنیای اقتصاد

نوشته شده توسط سپهر برادران در پنجشنبه شانزدهم تیر ۱۳۹۰ |