با همه اينها، مشكلات جدي در اين بين وجود دارد. بدين منظور به چهار مجموعه از داده‌های اقتصادي GDP، شاخص قيمت، پس‌انداز و اشتغال نگاه دقيق‌تري مي‌اندازيم.
توليد ناخالص داخلي (GDP)
هدف از تهیه GDP این است تا سنجه جامعی از توليد كالاها و خدمات نهايي باشد كه امکان گردآوری آن در يك كشور وجود دارد. «نهايي» به اين معنا است كه براي خودداري از شمارش بيش از يكبار يك قلم كالا يا خدمت، GDP توليد محصولات واسطه‌اي را حذف مي‌كند؛ يعني محصولي كه در ساير محصولات گنجانده خواهد شد مثل كلوخه آهن كه براي ساخت فولاد استفاده مي‌شود حذف مي‌شود. «ناخالص» يعني در تعریف GDP فرسودگي و استهلاك تجهيزات سرمايه‌اي مورد استفاده در توليد محصول را كم نمي‌كنیم چون داده‌هاي ما در آن مورد دقيق نيستند. «داخلي» به معناي محاسبه توليداتي است كه درون كشور اتفاق مي‌افتد، شامل توليد بنگاه‌هاي خارجي، اما آنچه را بنگاه‌هاي داخلي در ساير كشورها توليد مي‌كنند، حذف مي‌كنیم.
GDP سه چهره دارد. يكي حجم كالاها و خدمات نهايي توليد شده است، ديگري مخارج كل است چون همه اين كالاها و خدمات را در نهايت كسي مي‌خرد و سوم درآمد كل است؛ چون آنچه را كه يك نفر خرج مي‌كند شخص ديگري دريافت مي‌كند. GDP فقط يكي از چندين سنجه مرتبط با توليد است كه وزارت بازرگاني آمريكا منتشر مي‌كند. سنجه ديگر «درآمد شخصي» یعنی درآمد دريافتي اشخاص است؛ بنابراين سود توزيع نشده شركت‌ها را حذف مي‌كند، اما درآمد نهادهاي غيرانتفاعي كه به خانوارها خدمت مي‌كنند را شامل مي‌شود. «درآمد شخصي قابل تصرف» نيز اين درآمد شخصي را پس از كسر ماليات‌هاي شخصي، كه اصلی‌ترين‌اش ماليات بر درآمد شخصي است، اندازه‌گيري مي‌كند.
اگر چه GDP كلي‌ترين سنجه توليد است، چندين قلم اصلي در اقتصاد را ناديده مي‌گيرد؛ GDP هزينه‌هاي آلودگي را كه در كنار توليد به وجود مي‌آيد به روشنی كسر نمي‌كند، چون مشكل اندازه‌گيري اين هزينه‌ها را داريم. فرض كنيد شاخص كيفيت هوا اندكي بهبود يابد و انتشار گازهاي گلخانه‌اي 2 درصد كاهش يابد، در حالي‌كه شاخص آلودگي آب به شدت بدتر شود و پانصد گونه گياهي و حيواني در خطر نابودي قرار گيرد. پرسش مهم این است که با توجه به اين تغييرات، GDP را در كدام جهت (و به چه ميزان به صورت دلاري) بايد تعديل كرد؟ بنابراين حسابداران حسابداری GDP دليل خوبي دارند كه چنين عواملي را كلا حذف كنند، اگر چه با اين كار اثر تناقض‌نماي زير را داريم: مقررات جلوگيري از آلودگي كه يك ميليارد دلار توليد را كاهش مي‌دهد، در حالي‌كه پنج ميليارد دلار در هزينه‌هاي نظافت و تندرستي خانواده‌ها صرفه‌جويي مي‌كند GDP را يك ميليارد دلار كاهش مي‌دهد.
ارزش كار زنان خانه‌دار كه پولي بابت کار در خانه نمي‌گيرند يا محصولي كه در باغچه شخصي پرورش داده مي‌شود نيز از GDP حذف مي‌شود چون مشكل اندازه‌گيري و نوسانات سالانه آنها را داريم؛ در حالي‌كه يك بررسي در انگلستان نتيجه گرفت اندازه اينها تقريبا به اندازه GDP اندازه‌گيري شده است. به همين ترتيب، ارزش بيشتر خدمات دولتي را نمي‌توان مستقيما اندازه‌گيري كرد. براي مثال تصور كنيد سعی شود ارزشی دلاري (مثبت يا منفي؟) برای كار وزير دفاع قائل شویم؛ بنابراين در مورد بسياري از خدمات دولتي، GDP، به جاي ارزش محصول، ارزش نهاده‌ها از قبيل حقوق كاركنان دولتي را اندازه‌گيري مي‌كند. فرض ضمني در اينجا اين است كه بهره‌وري يك دلار پرداختي براي اين خدمات دولتي، در هر سال يكسان است، به طوري كه هيچ رشد بهره‌وري طي زمان نداشته‌ايم. اين البته در برخي موارد اما نه در همه جا درست است.
به‌علاوه، GDP انواع مهم سرمايه‌گذاري‌ها را از سنجه سرمايه‌گذاري و اغلب از خود GDP حذف مي‌كند. هزينه نصب يك سيستم كامپيوتري جديد نه تنها سخت‌افزار و نرم‌افزار، بلكه بازآموزي كساني را كه از آن استفاده خواهند کرد نيز در برمي‌گيرد. با اين حال دومي (هزینه آموزش) را با هزينه‌هاي توليد بنگاه‌ جمع مي‌كنند؛ به‌طوري كه به عنوان سرمايه‌گذاري يا افزايش GDP ظاهر نمي‌شود. همين قضيه درباره بيشتر فعالیت‌های تحقیق و توسعه صادق است.
به‌علاوه GDP را ابتدائا به صورت اسمي يعني به دلار جاري اندازه‌گيري مي‌كنند. از يك شاخص قيمت به نام «شاخص تعديل‌كننده GDP» استفاده مي‌شود تا متغيرهاي اسمي را به واقعي تبديل كند، اما شاخص‌هاي قيمت در معرض انواع مسائلي قرار دارند كه در ادامه بحث شده است. اينها به هيچ وجه تنها مسائل در برآورد GDP نيستند.
خوشبختانه، يك عامل اصلاحي مهم وجود دارد. اينكه رايج‌ترين استفاده از داده‌هاي GDP، مقايسه کردن GDP در دوره‌هاي متفاوت است از قبيل فهميدن اينكه آيا GDP سه ماهه كنوني، كندتر يا تندتر از سه ماه گذشته رشد كرده است. به اين خاطر است که اهميت زيادي ندارد در GDP، آلودگي يا كار زنان خانه‌دار و ... در نظر گرفته نشود؛ چون اين حذفيات، تقريبا در هر دوره سوگيري یکسانی را به داده‌ها انتقال مي‌دهد. بدبختانه در مورد بسياري از خطاهاي روشن اندازه‌گيري اينگونه نيست. چون صاحبان كسب و كار و همچنين سايرين مي‌خواهند از تحولات اقتصادي درست همين حالا باخبر شوند، وزارت بازرگاني داده‌هاي مقدماتي را مدت‌ها جلوتر از اينكه از همه اطلاعات مورد نياز براي توليد داده‌هاي قابل اعتماد استفاده شود، منتشر مي‌كند. داده‌هاي فعلي GDP مقدماتي فقط يك ماه پس از پايان فصل مربوطه منتشر مي‌شوند. آنها را پس از دو ماه، بازنگري مي‌كنند. در جولاي هر سه سال بعد، آنها دوباره بازنگري مي‌شوند و هر پنج سال يا همين حدودها بازنگري نهايي صورت مي‌گيرد. چون كه احتمال دارد اين بازنگري‌ها بسيار محسوس باشد باید اين ارقام مقدماتي را با احتياط زياد قضاوت كرد. براي مثال در 28 فوريه 2007، نرخ رشد GDP واقعي براي سه ماهه چهارم 2006 از 5/3 درصد به 2/2 درصد بازنگري شد.
مقايسه‌هاي بين‌المللي GDP يا GDP سرانه مشكلات اضافي دارد. براي مثال عربستان سعودي، اعتبار بالايي در داشتن درآمد سرانه بالا کسب کرده است؛ چون توليد نفت اين كشور را محصول خالص در نظر مي‌گيرند، در حالي‌كه عمده آن به صورت تمام شدن يك منبع طبيعي است؛ بنابراين نشانه كاهش سرمایه ملی است به جاي اينكه افزايش درآمد ملی باشد. آماري كه از آن زياد ياد مي‌شود و ارتباط نزديكي با GDP سرانه دارد، تعداد كساني است كه با كمتر از يك دلار در روز زندگي مي‌كنند. این آمار نيز ايراد دارد. اينها كساني هستند كه درآمدشان را به پول محلي به دست مي‌آورند و سازمان ملل سپس آن پول‌ها را با نرخ ارز رايج به دلار تبديل مي‌كند، اما نرخ‌هاي ارز فقط قيمت كالاهاي قابل مبادله بين‌المللي و نه قيمت همه كالاها و خدمات را بازتاب مي‌دهند كه عمل اشتباهي است و نيز كالاهاي ضروري و اساسي در كشورهاي كم درآمد نسبت به آمريكا ارزان‌تر (و برخي كالاهاي لوكس گران‌تر) هستند. در يك بررسي بانك جهاني اعلام شد که برآوردهاي چين از GDP سرانه سال 1992 عدد 390 دلار است. بانك جهاني به خاطر تفاوت قيمت‌ها و نيز ساير تعديل‌هاي نسبتا جزئي، آن رقم را به 1910 دلار بالا برد، اگرچه تاييد مي‌كند اين رقم «در معرض حاشيه خطاي زيادي است كه احتمالا سوگيري را به سمت بالا انتقال مي‌دهد.»

نرخ پس‌انداز
نرخ پس‌انداز شخصي؛ يعني درصد درآمد شخصي قابل تصرف، در دهه 1950 حدود 8 درصد بود. در 1982 نرخ پس‌انداز به بيش از 11 درصد رسيد و در 1990 به 7 درصد سقوط كرد، قبل از اينكه با شتاب به حدود 2 درصد در سال 2000 و به 4/0 درصد در 2006 سقوط كند. آيا منظور اين است كه افراد، پس‌انداز كافي براي بازنشستگي ندارند و اينكه كل ملت براي تامين مالي سرمايه‌گذاري‌هاي خود، وابستگي بيشتري به سرمايه‌ خارجي پيدا كرده است؟
پاسخ تا حدودي بستگي به اين دارد كه چگونه درآمد و پس‌انداز را تعريف مي‌كنيم. براي نمونه، يك سنجه بديل از پس‌انداز كه در كنار ساير تعديل‌ها، خريد كالاهاي بادوام را پس‌انداز در نظر گرفته و فقط استهلاك آنها را به عنوان مصرف لحاظ مي‌كند، ماجراي بسيار متفاوتي مي‌گويد. اكنون میزان كاهش نرخ پس‌انداز از 1990 تا 2000، فقط حدود 6/0 درصد می‌شود نه آن‌طور كه با تعريف رايج‌تر 7/4 درصد به دست مي‌آيد. ساير تعديل‌ها عبارتند از نفع سرمايه از درآمد و پس‌انداز، مطالبات در صندوق‌هاي بازنشستگي و استفاده از نرخ بهره واقعي به جاي اسمي در محاسبه پرداخت بهره مصرف‌كننده (در حساب‌هاي GDP، بهره پرداختي بابت بدهي شخص به صورت مخارج مصرفی وارد مي‌شود.) و حتي اگر خريد كالاهاي بادوام مصرف‌كننده به صورت پس‌انداز به حساب بیاید، ساير تعديل‌ها افت نسبت پس‌اندازها به اندازه فقط 4/1 درصد را نشان مي‌دهد. اين لزوما معني نمي‌دهد كه كاهش نرخ پس‌انداز يک مساله جدي است. در بسیاری موارد، روش متعارف اندازه‌گيري نرخ پس‌انداز شخصي شايد كاملا مناسب باشد، اما به هر صورت نشان مي‌دهد چگونه درك ما از يك مساله، بستگي زيادي به جزئيات فني در چگونگي تعريف سنجه‌هاي معين دارد.
شاخص‌هاي قيمت
همان‌طور كه در بخش‌هاي بعدي شرح مي‌دهيم، هنگام سروكار داشتن با يك كالاي واحد همگون، ساختن شاخص قيمت كار راحتي است، اما در شرايطي كه كالاهاي ناهمگون بسياري داريم براي مثال زماني كه مي‌خواهيم شاخص قيمت براي مخارج مصرف‌كننده تهيه كنيم چه مي‌شود؟ استفاده از ميانگين ساده قيمت كالاها و خدمات گوناگون كه وزن و اهميت يكساني به همه آنها داده می‌شود كار درستي نيست. اگر قيمت هر گالن بنزين 2 دلار بيشتر شود در عين‌حال كه قيمت بليت رقص باله 2 دلار كاهش مي‌يابد، وضع رفاهي بيشتر مردم بدتر مي‌شود. اگر شاخص قيمتي مي‌خواهيم كه بتوان از آن براي اندازه‌گيري تغيير رفاه مصرف‌كننده يا قدرت خريد دلار مصرف‌كننده استفاده كرد، بايد هر تغيير قيمت را با درصد مخارج مصرف‌كننده كه صرف آن قلم مي‌شود وزن داد.
انجام چنین كاری یک مشكل ايجاد مي‌كند: چگونه بايد كالاهاي گوناگون را وزن بدهيم؟ مصرف‌كنندگان موجوداتی منفعل و خالي‌الذهنی نيستند، آنها به بالا و پایین رفتن قيمت واكنش نشان مي‌دهند. اگر قيمت گوشت مرغ افزايش يابد، در حالي‌كه قيمت گوشت گوسفند كاهش مي‌يابد، آنها با خريد گوشت مرغ كمتر و گوشت گوسفند بيشتر پاسخ مي‌دهند؛ بنابراين اگر قيمت مرغ و گوشت را با مخارجي كه در سال اول صرف آنها شده است وزن بدهيم، زیاني كه مصرف‌كنندگان متحمل شده‌اند زياد نشان داده مي‌شود، اما اگر با مخارجي كه در سال‌جاري صرف آنها مي‌شود وزن دهيم، زیان را كمتر برآورد كرديم؛ چون وضع مصرف‌كنندگان بدتر مي‌شود اگر آنها مجبور باشند الگوي مصرفی خود را از گوشت مرغ به گوشت گوسفند تغيير دهند تا هزينه‌هاي خود را پايين نگه دارند. خوشبختانه راه‌حل بينابيني براي اين مشكل وجود دارد، اما آنها نياز به داده‌هايي درباره مخارج مصرف‌كننده در اقلام گوناگون برای هر سال دارند.تغيير كيفيت كالاها و خدمات يك مشكل مهم‌تر و حتي ناخوشايندتر ايجاد مي‌كند. امكان دارد هم اكنون 1500 دلار بابت يك كامپيوتر شخصي بپردازيد، دقيقا همان قيمتي كه در سال 1985 می‌پرداختید، اما شما اكنون قدرت محاسباتي و امکانات بسيار بيشتري در ازاي پول پرداختي به دست مي‌آوريد. اين روزها شكايت‌هاي دائمي درباره افزايش بسيار سريع‌تر هزينه‌هاي پزشكي و درمان از رشد نرخ تورم شنيده مي‌شود، اما آيا واقعا همين‌طور است؟ اگر اكنون يك بيمار به پزشكي مراجعه كند كه با يك بار ويزيت 80 دلاري، بيماري وی را درمان مي‌كند در حالي‌كه پنج سال پیش بايد سه بار ويزيت 40 دلاري مي‌شد، پس در اين مورد، هزينه‌هاي پزشكي دو برابر نشده است، بلكه به يك سوم كاهش يافته است و شاهد افزايش چشمگيري در اميد به زندگي بوده‌ايم.
معرفی خدمات جديد، مشكل مشابهي به وجود مي‌آورد. فرض كنيد درآمد سرانه از 1950 تاكنون به همين مقدار افزايش يافته باشد، اما تمام اين افزايش فقط همان كالاها و خدماتي را شامل مي‌شد كه در 1950 در دسترس بودند: هيچ رايانه شخصي، دسترسي به اينترنت، هواپيماي جت، پخش سي‌دي، درمان‌هاي جديد پزشكي، تلفن منشي‌دار و غيره وجود نمي‌داشت. آيا وضع رفاهي ما بسيار بدتر نمي‌بود؟ و حتي در بين كالاهاي قديمي، اينك دسترسي به تنوع بسيار بيشتري از آنها داريم، از قبيل رستوران‌هايي كه انواع غذاهاي محلي را عرضه مي‌دارند. بله، جهاني شدن منجر به انتخاب‌های بيشتري شده است و همگوني را كاهش داده است.
براي اينكه اهميت تغيير كيفيت و تنوع كالاهاي جديد كاملا تفهيم شود، سعي مي‌كنيم ترفندی به کار ببریم. فرض مي‌كنيم در يك بخت‌آزمايي برنده شديد و دو حق انتخاب دارید: گواهي جايزه 500 دلاري از بين كالاهاي كاتالوگ فروشگاه سيرز روبوك 1960 كه همه آنها قيمت سال 1960 را دارند يا گواهي جايزه 500 دلاري براي كالاها از كاتالوگ امسال که قيمت‌هاي سال‌جاري را دارند. كداميك را انتخاب مي‌كنيد؟ اگر اولي را انتخاب كنيد، يا اگر بين دو تا مردد باشيد، پس حكايت از اين دارد كه هيچ تورمي از 1960 وجود نداشته است؛ اينكه ارزش يك دلار كنوني دقيقا برابر يا حتي بيشتر از ارزش يك دلار در 1960 است اگر چه شاخص قيمت مصرف‌كننده در سال 2007 نسبت به 1960 حدود هفت برابر شده است (چون كيفيت كالاها بيش از هفت برابر شده است آن افزایش قیمت را خنثی می‌کند). یقینا پرسشي كه مطرح كرديم غيرمنصفانه است. اگر انتخاب بين گواهي جايزه 500 دلاري در فروشگاه‌هاي مختلف بود بديهي است كه گواهي 1960 را ترجيح مي‌داديد. به‌علاوه دست‌كم برخي ترجيحات شما براي كالاهاي جاري نسبت به كالاهاي 1960 صرفا بحث مد و سليقه است. اين پرسش فقط مي‌خواست اهميت تغيير كيفيت و كالاهاي جديد را نشان دهد.
شاخص‌هاي قيمت سعي دارند تغييرات كيفيت و تنوع كالاهاي جديد را هم در نظر بگيرند، اما به نحو كامل اين كار را نمي‌كنند. براي نمونه، وقتي كالاهاي جديد وارد بازار مي‌شوند ابتدا قيمت بالايي داشته و كمتر كسي آنها را مي‌خرد. اما زماني كه كاربرد همگاني مي‌يابند و در شاخص قيمت گنجانده مي‌شوند، قيمت‌شان بسيار كاهش يافته است. شاخص قيمت اين كاهش را ناديده مي‌گيرد. در 1996 كميسيون دولتي بوسكين برآورد كرد كه سوگيري به سمت بالا در شاخص قيمت مصرف‌كننده 1/1 درصد در سال است كه در دامنه 8/0 تا 6/1 درصد قرار می‌گیرد. اين برآورد را همه نمی‌پذیرند و از آن سال به بعد اداره آمار نيروي كار، شيوه گردآوري اين شاخص را بهتر کرده است. با همه اينها، شاخص قيمت مشكلات جدي دارد.
بخواهيم نتيجه بگيريم، پرسش زیر در ارتباط با اعداد شاخص مطرح مي‌شود و آنچنان سخت است كه من راهي براي پاسخ دادن به آن نمي‌بينم. آيا سطح زندگي كارگران امروزي بالاتر يا پايين‌تر از سطح زندگی هنري هشتم شاه انگلستان است كه در سده شانزدهم زندگي مي‌كرد؟ کارگران قطعا محروم از داشتن خدم و حشم فراوان و قلعه‌هاي هنری هشتم هستند، اما آنها كالاهاي بسيار زيادي دارند كه شاه انگليس در خواب هم نمی‌دید. آيا واقعا مي‌توان گفت وضع رفاهي كداميك بهتر است؟

اشتغال
دولت به دو روش تعداد افراد شاغل را اندازه‌گيري مي‌كند كه نتايج آنها برخي اوقات واگرايي شديدي دارد. يك روش آن نظرسنجي از خانوارها است كه مثلا نشان داد ميزان اشتغال در جولاي 2004 حدود 5/1 درصد نسبت به ميزان اشتغال در مارس 2001 افزايش يافته است. روش ديگر كه نظرسنجي از فهرست مزد و حقوق‌بگيران كارفرمايان است، نشان مي‌دهد كه اشتغال طي همين دوره 1 درصد كاهش يافته است؛ بنابراين در مبارزات انتخاباتي 2004، دموكرات‌ها اتهام وارد كردند كه طي رياست‌جمهوري جورج بوش، اشتغال كاهش يافته است
در حالي‌كه جمهوري‌خواهان ادعا كردند كه اشتغال افزايش يافته است. قطعا تفاوت معمولا آنقدرها هم زياد نیست و طي بلندمدت چنين تفاوتي از بين مي‌رود.
چندين عامل باعث اين تفاوت مي‌شوند. يكي اينكه در حالي‌كه پيمايش فهرست حقوق بگيران، تعداد مشاغل را حساب مي‌كند
به طوري كه هر شخصي كه دو شغل دارد دو بار به حساب مي‌آيد، نظرسنجي خانوار چنين شخصي را يكبار به حساب مي‌آورد. دوم اينكه در پيمايش فهرست حقوق‌بگيران، خويش‌فرماها، كارگران كشاورزي، كارگران خانوار، كارگران خانوادگي بدون دستمزد و كارگراني كه مرخصي بدون حقوق گرفتند حذف مي‌شوند، اما برخلاف نظرسنجي خانوار، كارگراني را كه زير شانزده سال هستند شامل مي‌كند. همه اينها كه در ظاهر جزئيات فني ديده مي‌شوند، اما باعث تفاوت‌هاي بزرگي مي‌گردند.

نرخ فقر
اينكه فقر چيست به چشمان بیننده آن بستگي دارد، اما چشمان بيشتر بیننده‌ها تفاوت خيلي زيادي ندارد، به نحوی كه مي‌خواهيم فقر را تقريبي اندازه‌گيري كنيم. در آمريكا فقر را با استفاده از یک تكه اطلاعات نسبتا عيني در دسترس اندازه مي‌گیرند. وزارت كشاورزي آمريكا، حداقل هزينه رژيم غذايي کافی براي انواع گوناگون خانواده‌ها را محاسبه می‌کند كه «براي استفاده موقت يا روز مبادا كه منابع مالي به حداقل می‌رسد طراحي شده است.» سپس با تقسيم اين هزينه‌هاي غذايي به نسبت درآمدهايي كه خانواده‌ها صرف مواد غذايي مي‌كنند، آستانه فقر محاسبه مي‌شود، مثلا اگر اين خانواده‌ها يك سوم درآمدشان را صرف مواد غذايي كنند، خط فقر در سه برابر هزينه يك رژيم غذايي كافي تعيين مي‌شود. رقمي كه معمولا ذكر مي‌شود ميانگين محاسبه شده براي انواع خانواده‌ها است و هر سال بابت تورم تعديل مي‌شود. در اوت 2005، این رقم 1980 دلار براي يك خانواده چهار نفره بود و 6/12 درصد آمريكايي‌ها فقير تعريف مي‌شدند.
اين شیوه كار بدون منتقدان خاص خود نيست. برخي فكر مي‌كنند نرخ فقر خيلي پايين تعيين شده است كه با افزايش درآمد بايد سنجه فقر را اصلاح کرد تا سطح زندگي را در نظر بگيرد. سايرين مخالفت مي‌كنند كه با برآورد تعداد خانواده‌هايي كه در فقر به سر مي‌برند، ما بايد در درآمد خانواده، ارزش پولي دريافتي‌هاي جنسي از دولت از قبيل خدمات درماني و كوپن‌هاي غذا و نيز «اجاره مجاني» كه صاحبان خانه دريافت مي‌كنند را لحاظ كنيم كه فعلا اين كار را نمي‌كنيم. علاوه بر اين، آنها اشاره مي‌كنند بيشتر خانواده‌هايي كه فقير طبقه‌بندي مي‌شوند صرفا گرفتار درآمد پايين به صورت موقت شده‌اند؛ بنابراين مي‌توانند بيش از درآمد جاري كه دارند مصرف كنند. اين نكته نيز نگران‌كننده است كه در واقعيت امر، نرخ فقر ثبت شده در 2006 دقيقا به اندازه سي سال پيش است. با توجه به افزايش شديد درآمد سرانه، رشد برنامه‌هاي مبارزه با فقر و همچنين داده‌هاي مخارج مصرف‌كننده كه نشان‌دهنده افزايش مخارج 20 درصد فقير جامعه است، چنين يافته‌اي كه نرخ فقر تغيير نكرده است، خلاف درك شهودي بوده و با شواهد قوي از بهبود تغذيه، تندرستي و مسكن فقرا در تضاد است. تبيين احتمالي كه پيشنهاد مي‌شود اين است كه نوسانات سال به سال درآمدها افزايش يافته است؛ به طوري كه اينك تعداد مردم بيشتري مدتي را در سطح درآمدی كاملا زير سطح درآمدی معمولی خود به سر مي‌برند.

داده‌هاي نظرسنجي
بيشتر داده‌هايي كه به دست ما مي‌رسد از نظرسنجي بنگاه‌ها‌ يا خانوارها به دست آمده است. براي مثال، نظرسنجي بنگاه‌ها برخي داده‌هاي مورد استفاده براي تخمين GDP به ما مي‌دهد؛ در حالي‌كه آمارگيري از مخارج خانوار، اهميت نسبي كالاها و خدمات گوناگون در شاخص قيمت مصرف‌كننده را روشن مي‌كند.
يك نگرش گسترده اما نه به هيچ وجه همگاني در بين اقتصاددانان دانشگاهی اين است كه شواهد پرسشنامه‌اي از خانواده‌ها و بنگاه‌ها قابل اعتماد نيستند؛ به ويژه اگر قرار است پاسخ‌ها به ما بگويند «چرا» بنگاه‌ها يا خانواده‌ها به همين شيوه‌اي كه مي‌بينيم رفتار مي‌كنند. آدم بدبين مي‌گويد پرسيدن از خانوارها يا بنگاه‌ها كه چرا آنها فلان كار را مي‌كنند يك تكنيك است كه با تئوري‌سازي اقتصاددانان چشم و همچشمي مي‌كند و معلوم است ابزارهاي رقيب هرگز به خوبي ابزارهاي ما نيستند. آدمي كه كمتر بدبين است بي‌ميلي اقتصاددانان در استفاده از شواهد پيمايشي را به مشكلات جدي كه چنين شواهدي دارند نسبت مي‌دهد، همچنین به بسياري از نمونه‌هاي موجود از پيمايش‌هاي بد طراحي شده در علم اقتصاد و نيز به بسياري از اقتصاددان‌ها كه از ادبيات مفصل و پيچيده‌اي كه جامعه‌شناسان جمع‌آوري كردند براي اينكه چگونه پيمايش‌ها را انجام دهيم؛ بنابراين از مهارت زياد مورد نياز براي انجام پيمايش‌ها آگاهی ندارند.
مشكل جدي در كارهاي پيمايشي كه اقتصاددانان آكادميك انجام مي‌دهند نرخ پاسخ‌دهي پايين است؛ چون فاقد قدرت دولت در الزام به پاسخ‌دهي هستند. نرخ پاسخ‌دهي يك سوم معمولا خيلي خوب تلقي مي‌شود. اگر مشخصه‌اي كه بررسي مي‌كنيم بي‌ارتباط با تمايل به مشاركت در پيمايش باشد آن مشكل را مي‌توان حل كرد - البته با مقداري هزينه - به اين صورت كه اندازه نمونه را افزايش دهيم؛ اما موارد بسياري وجود دارد كه تمايل به پاسخ‌دهي با آنچه سعي در اندازه‌گيري داريم همبستگي دارد و در اين‌صورت عدم پاسخ‌دهي باعث سوگيري نتايج ما مي‌شود. براي مثال اگر كساني كه سطح تحصيلات بالايي دارند تمايل بيشتري به پاسخ دادن به يك پيمايش درباره تحصيلات خود داشته باشند، پس پاسخ‌هايي كه دريافت مي‌كنيم تعداد سال‌هاي تحصيلات را كه جامعه نمونه‌گيري شده پر مي‌كنند بيش از حد واقع نشان خواهد داد. بر همين منوال يك نظرسنجي تلفني از افراد سالمند كه درباره ميزان تندرستي آنها پرسش مي‌كند پاسخ‌هاي با سوگيري توليد خواهد كرد. آنهايي كه به شدت بيمار هستند نسبت به آنهايي كه تندرست هستند احتمال كمتري دارد به تلفن پاسخ دهند.
مشكل ديگر كارهاي پيمايشي اين است كه تغييرات بسيار اندك در چگونگي روي كاغذ آوردن يك پرسش، همچنين ترتيبي كه پرسش‌ها آورده مي‌شوند اثرات چشمگيري بر نتايج دارد و اغلب بسيار دشوار يا حتي ناممكن است كه پرسش معيني را بدون ابهام تهيه كنيم. براي مثال يك نظرسنجي دولتي از بنگاه‌هايي كه برنامه‌ريزي براي افزايش تجهيزات سرمايه‌اي خود دارند، مي‌پرسد آيا خريدي كه قصد كرده‌ايد ساختمان يا ماشين‌آلات است. اين پرسش بدون ابهام به نظر مي‌رسد؛ اما نه براي بنگاهي كه قصد خريد كشتي دارد. من در كارهايي كه خودم انجام مي‌دادم چندين ساعت را صرف تهيه هر پرسش مي‌كردم و در عين‌حال نتیجه مطلوبی نمی‌گرفتم. به طور كلي، پرسش‌هاي مربوط به مسائل واقعي كه پاسخگو اطلاعات خوبي در آن‌باره دارد از اين قبيل كه نظرتان درباره خودرويي كه سوارش مي‌شويد و رانندگي مي‌كنيد چيست، پاسخ‌هاي مفيدي را بر مي‌انگيزد؛ اما فقط در صورتي كه به خوبي تدوين شده باشد و حالت فضولي و مداخله‌جويانه نداشته باشد و وقتي كه پاسخ صادقانه دادن، تصور از خود پاسخگو را تهديد نكند؛ اما پرسش‌هايي كه پاسخ دادن به آنها نيازمند رجوع به حافظه پاسخگو است، از قبيل درآمد سه سال پيش، احتمال دارد داده‌هاي بي‌مصرف توليد كند و به همين ترتيب پرسش‌هاي درباره انگيزه‌ها را داريم. نه فقط احتمال دارد مردم واقعا ندانند چرا فلان كار را انجام دادند، مثلا اينكه چرا دانشكده را رها كردند، بلكه آنها برخي اوقات ميلي به افشا كردن انگيزه‌هاي خود حتي براي خودشان را ندارند. پرسش‌هاي فرضي از اين قبيل كه «اگر تعهدات مالياتي شما 10 درصد كاهش يابد با آن پول اضافي چكار خواهيد كرد؟» نيز بي‌فايده هستند؛ چون مردم فاقد انگيزه هستند تا فكر و انديشه لازم به خرج دهند كه واقعا در آن شرايط فرضي چه كار خواهند كرد. به‌علاوه در مورد پرسش‌هايي كه به نيات و انگيزه‌هاي افراد كار دارد اغلب خطر جدي هست كه پاسخ‌دهندگان پرسش را بد خواهند فهميد؛ چون آنها برحسب مفاهيم انتزاعي خاصي كه پرسش بيان شده است فكر نمي‌كنند. براي مثال فرض كنيد از كسي بپرسيد: «آيا تورم با كاهش ارزش واقعي دارايي‌هاي پولي شما (مثل حساب پس‌انداز بانكي) مصرف شما را كاهش مي‌دهد؟» فرد پاسخگو كه از همه جا بي‌خبر است احتمال دارد بگويد «خير»، چون كه او هنگام تصميم‌گيري در این باره که آيا توان مالي خريد خودروي جديد دارد يا خير به چنين چيزهايي فكر نمي‌كند و در عين حال تورم ثروت عده‌اي از مردم را كاهش مي‌دهد و اگر مردم احساس كنند ثروت كمتري دارند، احتمال كمتري می‌رود كه خودروي جديد خريداري كنند.»
عقيده من درباره شواهد پيمايشي اين است كه چنين ابزاري بسيار مفيد است فقط اگر با دقت انجام شود و محدود به انواع معین پرسش‌ها باشد. بيشتر اقتصاددانان و شايد اكثريت آنها رغبت بسيار اندكي به شواهد پيمايشي نشان مي‌دهند؛ اما من فكر مي‌كنم اين روند - اگر چه به آهستگي - در حال تغيير است.


برخي مثال‌ها از دام‌هاي آماري
1- «آنهايي كه بيمه درمان دارند بيشتر از كساني كه بيمه نيستند به پزشك مراجعه مي‌كنند. پس ثابت مي‌شود كه بيمه باعث توجه بيشتر به مراقبت درماني مي‌شود.» چنين نتيجه‌گيري درست نيست. شايد احتمال داشته باشد كه آدم‌هاي بيمار بيشتر از افراد سالم بيمه درمان خريداري كنند. نتيجه اخلاقي: هيچ وقت ساير تبيین‌هاي قابل تامل را ناديده نگيريد.
2- «امسال 342.598 نفر از اين موزه ديدن كرده‌اند.» نخير، تمام چيزي كه شما مي‌دانيد اين است كه 342.598 بازديد از موزه صورت گرفته است؛ اما مطمئنا برخي افراد هستند كه بيش از يكبار از اين موزه بازديد كردند. نتيجه اخلاقي: از خودتان بپرسيد اين داده‌ها چگونه گردآوري شده است.
3 - «داده‌ها درباره ميانگين سن مشاغل گوناگون نشان مي‌دهد دانشجويان به طور متوسط زودتر از ساير مشاغل از دنيا مي‌روند. پس درس خواندن خطرناك است.» دست نگه داريد؛ چون دانشجويان عموما جوان بوده و سن پاييني دارند، وقتي دانشجويي اتفاقا مي‌ميرد انتظار مي‌رود كه سن وي پايين باشد. نتيجه اخلاقي: قبل از نتيجه‌گيري از خودتان بپرسيد آيا گروه‌هايي كه مي‌خواهيم با هم مقايسه كنيم واقعا قابل مقايسه هستند.
4- «نود درصد دانشجويان اين كلاس مي‌دانند دانشجوي ديگري هست كه تقلب مي‌كند. پس ثابت مي‌شود كه تقلب زيادي در اين كلاس انجام مي‌شود.» يكبار دوباره مي‌گوييم خير. فرض كنيد از صد نفر دانش‌آموزان كلاس فقط يك نفر تقلب مي‌كند و نود دانش‌آموز از اين قضيه خبر دارند. نتيجه اخلاقي: گفتن اينكه «ثابت مي‌شود» هيچ چيزي را ثابت نمي‌كند.
ماخذ:دنیای اقتصاد

نوشته شده توسط سپهر برادران در پنجشنبه بیست و سوم تیر ۱۳۹۰ |