您的位置: 首頁(yè) >> 人物 >> 專(zhuān)家學(xué)者 >> 王小魯
王小魯:收入分配不能躺在虛假數據上分析
2010-09-06   作者:  來(lái)源:第一財經(jīng)日報
 
    ——答王有捐、施發(fā)啟對灰色收入研究的商榷
  近日,國家統計局網(wǎng)站上連續登出了王有捐、施發(fā)啟兩位統計官員對我的灰色收入研究報告的商榷(注:下稱(chēng)“研究報告”。該報告題為《灰色收入與國民收入分配》,全文載于中信出版社《比較》第48輯;為中國經(jīng)濟體制改革研究會(huì )課題)。隨后,他們兩位又共同署名,在統計局網(wǎng)站上發(fā)表了另一篇文章,表示愿意繼續就此問(wèn)題進(jìn)行研究,并表示國家統計局準備采取措施來(lái)改善居民收入統計中的少報、漏報問(wèn)題。
  他們對我的研究報告進(jìn)行公開(kāi)討論,以及關(guān)于改善居民收入統計的表態(tài),是一種積極的態(tài)度,我非常歡迎。但這方面的討論,并不僅限于統計數據的真實(shí)性問(wèn)題,而是進(jìn)一步關(guān)系到如何認識我國當前的收入分配狀況、如何應對當前突出的社會(huì )矛盾、如何推進(jìn)改革來(lái)解決這些矛盾。我在這方面的研究,也是基于這個(gè)出發(fā)點(diǎn)而進(jìn)行的。但搞清真實(shí)情況、獲得可信數據,是必要的前提。
  因此,有必要把雙方爭議的一些問(wèn)題搞清楚。本文對他們的商榷做一個(gè)回答,意在促使有關(guān)收入分配狀況的研究更加深入,為解決這些問(wèn)題提供條件。
  1 現行居民收入統計是否真實(shí)反映收入分配現狀
  王有捐、施發(fā)啟的文章都同意目前的居民收入統計調查“存在漏報和少報的問(wèn)題”,“高收入群體也較少進(jìn)入調查樣本”;因此居民收入統計“可能存在低估的情況”。兩位也認為筆者的研究報告“在估算我國居民實(shí)際收入方面進(jìn)行了有益的探索,尤其在獲取基礎數據和推算宏觀(guān)數據方面值得參考和借鑒”!捌洳捎镁用窦矣闷(chē)、商品住宅、出境旅游、銀行存款等外部相關(guān)數據對我國常規住戶(hù)調查居民收支數據進(jìn)行驗證的方法為我們提供了不同的思路和模式,值得借鑒”。在這些方面,我們有一定的共同認識。
  但施、王前兩文的重點(diǎn),是批評我們的調查樣本比國家統計局的調查樣本量“明顯偏小”、沒(méi)有采取統計局所采用的隨機抽樣方法,因此“結果是不可靠的”,“估算結果明顯偏高”。
  如果結果“不可靠”,會(huì )有偏高和偏低兩種可能。為什么是偏高而不是偏低?怎樣算出來(lái)“明顯偏高”?高多少??jì)晌簧倘墩卟](méi)有做出解釋?zhuān)磥?lái)還是根據現有統計數據來(lái)判斷的,就是說(shuō),似乎現有的收入統計仍然是可靠的,即便有偏差也不大。而筆者對高收入居民收入的估算“明顯偏高”,也是相對于統計數據而言。這不僅與兩位關(guān)于統計數據“可能存在低估”的說(shuō)法有矛盾,而且涉及到一個(gè)關(guān)鍵問(wèn)題:現行統計究竟是否反映了高收入群體的真實(shí)收入狀況?這是需要搞清楚的。
  長(cháng)期以來(lái),我國收入分配差距持續擴大,特別是灰色收入大量存在,嚴重影響了收入分配狀況。但這些問(wèn)題并沒(méi)有從統計上如實(shí)反映出來(lái),特別是對高收入居民的收入統計嚴重脫離實(shí)際,不僅低估了收入差距擴大的嚴重性,也造成不同統計數據間的嚴重沖突。下面是幾個(gè)例子。
  其一,據國家統計局公布的城鄉居民人均收入和城鄉人口數推算,2008年全國居民可支配收入總額不足13萬(wàn)億元,而同樣來(lái)自國家統計局的資金流量表數據,卻顯示住戶(hù)可支配收入總額為18.2萬(wàn)億元。后者是根據經(jīng)濟普查得出的,應該比較全面。但這就證明居民住戶(hù)收入統計至少遺漏了5.3萬(wàn)億元,漏掉了居民收入的近30%。類(lèi)似情況已存在多年。如此嚴重的遺漏,還能認為是基本可靠嗎?這一問(wèn)題,《第一財經(jīng)日報》在8月30日發(fā)表的《居民收入統計局兩套數據打架 5.3萬(wàn)億元差距待解》一文中已有論述。
  其二,與其他宏觀(guān)統計數據比較,會(huì )發(fā)現遺漏遠不止5.3萬(wàn)億元。以2008年數據算,全國居民儲蓄總額(收入減去消費)在2008年為3.5萬(wàn)億元,而當年僅城鄉居民在金融機構的儲蓄存款就增加了4.5萬(wàn)億元,加上居民當年購買(mǎi)商品住宅支出(扣除銀行貸款),在股市、債市和實(shí)體經(jīng)濟的投資,手持現金等,實(shí)際的居民儲蓄應該在11萬(wàn)億元~11.5萬(wàn)億元之間(未計算居民在國外的存款和投資),是按居民收入統計數據計算的3.5萬(wàn)億元儲蓄的3倍以上。上述計算依據的都是國家統計局公布的數據,這類(lèi)數據沖突近些年來(lái)一直存在。
  其三,按人均可支配收入水平算,根據統計,2008年城鎮居民人均收入只有1.57萬(wàn)元;其中10%的最高收入家庭,人均也只有4.36萬(wàn)元。這樣的人均收入是如何支撐當年2萬(wàn)多億元商品住宅銷(xiāo)售的?是怎樣把房?jì)r(jià)炒上天的?就算只有10%的最高收入家庭能夠買(mǎi)得起房,這部分人的當年收入合計只有2.3萬(wàn)億元,在買(mǎi)了2.1萬(wàn)億元的商品住宅之后,他們吃什么?喝什么?拿什么錢(qián)買(mǎi)汽車(chē)?拿什么錢(qián)出國旅游?新存入銀行的4.5萬(wàn)億元私人存款又是哪來(lái)的?
  2008年,中國私人小汽車(chē)增加了560萬(wàn)輛,保有量超過(guò)2800萬(wàn)輛,而城鎮10%的最高收入家庭總共不過(guò)2000萬(wàn)戶(hù)。據悉,價(jià)值數百萬(wàn)的世界頂級豪華轎車(chē)勞斯萊斯,在中國的銷(xiāo)量已占全球第三,僅次于美、英。
  2008年,中國居民因私出國出境4013萬(wàn)人次,超過(guò)了同年美國出國人數(4002萬(wàn)人次)。據日本官方統計,2009年僅訪(fǎng)日的中國游客有110萬(wàn)人次,在日本境內人均花費11.7萬(wàn)日元,而美國游客在日本人均花費僅2.5萬(wàn)日元(2010年8月24日《參考消息》)。根據統計,中國城鎮居民的人均收入只相當于美國人均收入的1/15,10%最富城鎮家庭的人均收入也不到美國人均收入的1/5,怎么可能支撐這樣的高消費,統計上解釋得通嗎?
  據悉,2008年內地流入澳門(mén)的賭資就高達數百億元。如果將其分攤給2000萬(wàn)個(gè)最高收入家庭,每戶(hù)也有幾千元。這些錢(qián)又來(lái)自何處?
  僅此幾例,足以說(shuō)明關(guān)于高收入居民收入狀況的統計數據已嚴重脫離實(shí)際。這種情況不改變,會(huì )掩蓋實(shí)情,誤導決策,帶來(lái)嚴重后果。所以統計部門(mén)和經(jīng)濟學(xué)者的共同責任,是面對現實(shí),搞清情況,不能繼續滿(mǎn)足于統計調查“樣本量大”、“方法科學(xué)”等表面文章,回避這些尖銳的問(wèn)題。
  2 怎樣評價(jià)抽樣調查的可靠性?
  施、王兩文質(zhì)疑研究報告的兩個(gè)最主要理由,就是統計局住戶(hù)調查樣本量大,所采用的分層隨機抽樣方法“有著(zhù)較嚴密的科學(xué)依據”;而我們的調查樣本小得多,沒(méi)有采取與統計局相同的抽樣方法,對樣本的選擇“存在主觀(guān)性”,因此缺乏可信度。但這些評論回避了兩個(gè)最重要的問(wèn)題。
  第一,樣本量大小,并不決定樣本是否無(wú)偏。只有當不存在系統性偏差時(shí),大樣本才在精確度上更占優(yōu)勢。與2億城鎮居民家庭相比,統計局6.5萬(wàn)個(gè)住戶(hù)樣本也只占萬(wàn)分之三。但這個(gè)樣本目前的問(wèn)題,并不在于樣本量大小,而在于大量遺漏高收入戶(hù)。首先,由于在抽樣過(guò)程中頻繁遇到高收入居民拒訪(fǎng),而替換的樣本不可能保證同樣的收入水平。這就必然導致樣本覆蓋面的系統性偏差。在這種缺陷未被糾正的情況下,樣本量再大,也不能提高其可信性。
  第二,抽樣方法的“科學(xué)性”,不能彌補數據失真導致的非抽樣誤差。目前統計局樣本的收入數據,根據的是樣本戶(hù)的填報。而我們在調查中發(fā)現,如果沒(méi)有有效措施,70%的高收入戶(hù)有低報收入的傾向,而且報出的收入與他們的真實(shí)收入平均相差幾倍。但在此之前,我們未曾聽(tīng)說(shuō)統計局針對低報收入采取過(guò)措施。
  王有捐先生在文章中說(shuō):“65000戶(hù)樣本量對全國和分省(區、市)有較高的代表性,在置信度為95%時(shí),主要收支指標的抽樣誤差(不含漏報、少報等產(chǎn)生的非抽樣誤差)在5%以?xún)!钡F在的主要問(wèn)題恰恰出在“漏報、少報等產(chǎn)生的非抽樣誤差”。避開(kāi)這個(gè)主要問(wèn)題,抽樣誤差再小也沒(méi)有意義。就像醫生給病人開(kāi)錯了藥,藥品質(zhì)量再好也不解決問(wèn)題。對于抽樣調查的評價(jià),首先應該是結果的真實(shí)性,而不能滿(mǎn)足于理論上的“科學(xué)性”。
  我們的研究項目在抽樣和推算方法上所做的探索,正是針對高收入樣本容易遺漏和收入數據不真實(shí)這兩個(gè)關(guān)鍵問(wèn)題。我們如果采取與統計局同樣的隨機抽樣方法,也難免同樣的系統性偏差。因此我們針對不同收入區間設立了樣本配額,以確保不遺漏高收入樣本;同時(shí)借鑒了社會(huì )學(xué)的調查方法,通過(guò)各地的專(zhuān)業(yè)調查人員直接以他們熟悉的人群(親屬、朋友、同事、鄰里)為調查對象來(lái)收集各項收入支出信息。由于調查人員基本了解調查對象的家庭經(jīng)濟狀況,并存在一定的信任關(guān)系,使嚴重低報收入的情況大大減少。
提到社會(huì )學(xué)調查方法,不能不提到我國老一輩社會(huì )學(xué)家費孝通和他的著(zhù)作《江村經(jīng)濟》。這本書(shū)是他對自己姐姐居住村莊的鄉親鄰里進(jìn)行調查的成果,成為一部解剖中國鄉村經(jīng)濟有代表性、影響深遠的著(zhù)作。沒(méi)有聽(tīng)說(shuō)誰(shuí)批評他的調查“樣本太小”,“沒(méi)有采用隨機抽樣方法”,因此“不科學(xué)”。這首先是因為信息的真實(shí)性和所反映問(wèn)題的代表性。而這些并不是所有的大樣本隨機抽樣調查都能做到的。國際抽樣調查權威Kish在他的著(zhù)作中,也沒(méi)有不適當地強調抽樣方法的“科學(xué)性”,反而把它看做“‘自己創(chuàng )造的藝術(shù)’和它的科學(xué)性的結合”(Kish:《抽樣調查》,中文版1997)。
  在我們的調查中,為進(jìn)一步降低敏感度,我們采取了匿名調查的方式,提供了信息保密和僅用于研究目的的承諾;在問(wèn)卷設計上采取了先問(wèn)消費、后問(wèn)收入,先問(wèn)分項、后問(wèn)合計,不追問(wèn)收入具體來(lái)源等調查方法。調查前,對各地調查人員進(jìn)行了培訓。調查后,對收到的問(wèn)卷進(jìn)行了嚴格的質(zhì)量和邏輯檢驗,剔除了相當數量不合格問(wèn)卷。所有這些措施,都是為了保證數據的真實(shí)性。這使我們得到的調查數據避免了嚴重的系統性偏差。
  由于在特定條件下采取了這種非常規調查方法,我們深知雖然得到的數據比較可信,但樣本分布并不代表城鎮居民的總體分布,不能用來(lái)做總體推斷。我們所采用的恩格爾系數法,就是在這種情況下所找到的一個(gè)解決問(wèn)題的方法。由于基礎數據的可信性和樣本在不同地區、不同收入層次、不同職業(yè)身份的居民群體間分布的廣泛性,我們能夠用它獲取收入水平與恩格爾系數以及其他參數間的真實(shí)關(guān)系,并基于這種關(guān)系來(lái)對一定居民群體的收入水平進(jìn)行推算。
  這一方法得到的結果,并不是一個(gè)總體推斷,而是在統計局分組樣本的基礎上,利用統計局數據中可信度較高的變量(一個(gè)主要變量是恩格爾系數)來(lái)推算其真實(shí)收入水平,以校正其原來(lái)失真的數據。這一方法和總體推斷方法得到的結果非常不同。這在報告中有詳細的數據比較和說(shuō)明。而施、王兩位一直強調我們是在做“總體推斷”,說(shuō)“不是直接推斷也是間接推斷”,是很不客觀(guān)的。他們所批評的“沒(méi)有采用隨機抽樣方法”,也并不構成我們這項研究的缺點(diǎn),反而是在有限條件下能找到的一個(gè)驗證統計數據失真的有效解決方法。
  當然也要說(shuō)明,這項研究的目的,是對統計數據的偏差進(jìn)行檢驗并作出近似推算,而不是要代替常規統計。作為一個(gè)民間研究機構,我們不可能擁有像國家統計局那樣龐大的統計機構和遍布全國的調查隊伍,不可能進(jìn)行能與之相比的大規模調查。但我們充分相信,所得到的高收入群體收入水平的推算結果,遠比現有的統計數據更真實(shí),也能夠為改善統計數據提供一個(gè)參考。
  3 關(guān)于對研究報告的誤讀和錯誤解釋
  施、王兩文,除了對我們的調查樣本量和抽樣方法進(jìn)行批評外,還提出了另外幾個(gè)理由說(shuō)明研究報告的推算結果不可靠。但這幾個(gè)理由都有商榷的必要。
  1.王有捐文章說(shuō),我們的調查方法是通過(guò)“親戚再找親戚,朋友再找朋友”的“滾雪球”方法,不適合用來(lái)“推斷總體”。
  前面已經(jīng)說(shuō)得很清楚,我們并沒(méi)有用自己的樣本來(lái)“推斷總體”。同時(shí),我們的調查也根本不是王有捐先生所說(shuō)的“滾雪球”方法。所有的調查都是由經(jīng)過(guò)培訓的各地調查員直接訪(fǎng)問(wèn)其熟悉的人群所產(chǎn)生,并沒(méi)有經(jīng)過(guò)任何中轉。如果認真讀過(guò)報告全文,應該不會(huì )產(chǎn)生這樣武斷的誤解。
  2.王有捐先生質(zhì)疑我們的調查方法:“試想,這些不愿意向統計局調查員透露自己實(shí)際收入的高收入人群會(huì )僅因為調查員是熟人就如實(shí)相告?”顯然是在暗示我們的調查方法可能也低估了高收入人群的收入水平。然而他卻以此為理由證明我們的“估算結果有過(guò)高之嫌”,這顯然是自相矛盾的。
  王有捐文章還說(shuō),我們在問(wèn)卷中詢(xún)問(wèn)住戶(hù)是否愿意透露真實(shí)收入信息,是具有“明顯的傾向性”、“誘導性”,卻沒(méi)有說(shuō)出傾向何在。而且問(wèn)卷中這個(gè)問(wèn)題只作為參考信息,并不改變任何原始收入數據和推算數據。以此來(lái)說(shuō)明我們的推算過(guò)高,是說(shuō)不通的。
  3.王有捐說(shuō),研究報告在使用外部數據時(shí)“不嚴謹”,把居民儲蓄算高了。
  其一,是說(shuō)報告沒(méi)有區分居民存款和公款私存。實(shí)際上從實(shí)行存款實(shí)名制后,公款私存的情況少多了。仍然存在的公款私存,一般無(wú)非是化“大公”為“小公”,把公款變成某些單位人員小團體的消費資金,實(shí)際上就是灰色收入的一個(gè)來(lái)源。那么這還能算是“公款”嗎?
  其二,是說(shuō)報告沒(méi)有區分居民購房和單位購房。研究報告中計算的僅限于房地產(chǎn)開(kāi)發(fā)商的住宅銷(xiāo)售部分。即便是單位出錢(qián)為個(gè)人購買(mǎi)住宅,難道不應計入個(gè)人收入嗎?
  其三,是說(shuō)報告沒(méi)有區分股市的居民投資、企業(yè)投資和國外投資。這更不客觀(guān)。研究報告中并沒(méi)有把股市、債市投資全部算成居民個(gè)人投資,而是保守地假定只有1/3來(lái)自居民儲蓄。這個(gè)估計也許不準確,但至少有高估和低估兩種可能,而斷定“高估”不知根據何在?
  其四,說(shuō)“房?jì)r(jià)收入比在中國的合理界限為3年的提法也有待于進(jìn)一步探討”。但報告中根本沒(méi)有這樣的提法,而是說(shuō)“根據國外經(jīng)驗,通常商品住宅價(jià)格是居民家庭年收入的3~5倍,是可承受的價(jià)格”。上述說(shuō)法不知來(lái)自何處?
  4.施、王兩文都說(shuō)恩格爾系數與收入密切相關(guān),但也受其他因素影響,因此用恩格爾系數法推算收入水平“存在明顯問(wèn)題”。事實(shí)上我們的研究通過(guò)模型分析法控制了影響恩格爾系數的多種因素,包括地區、城市規模(間接反映物價(jià)水平)、家庭平均教育水平、家庭規模、就業(yè)面等差異,在計算收入水平與恩格爾系數關(guān)系時(shí)已經(jīng)排除了其他這些因素的影響。這再次說(shuō)明兩位商榷者或者沒(méi)有認真讀過(guò)報告全文,或者有選擇地忽略掉了報告的某些部分。
  5.施發(fā)啟提出:“如果采用報告中的計算結果,2008年居民可支配收入占GDP的比重將達到73.9%”,太高了,因此證明計算結果不合理。但施發(fā)啟文章的計算實(shí)際上是將居民收入上調,但假定GDP不變,才會(huì )得到上述比例。這個(gè)假定本身就不合理。報告中已作了說(shuō)明,如果居民收入有大量遺漏,GDP核算不可能沒(méi)有遺漏。例如,有的企業(yè)將內部人員的灰色收入或對外部的行賄等支出,以虛假發(fā)票報銷(xiāo)等方式計入成本,低報了企業(yè)的實(shí)際增值,這些遺漏當然也不可能進(jìn)入GDP核算。
  6.施發(fā)啟文章還批評說(shuō),我們的調查數據是來(lái)自受訪(fǎng)者記憶,“沒(méi)有統計臺賬”,“調查方法不規范”。但就是在調查規范、有統計臺賬的情況下,統計局的高收入居民收入數據發(fā)生了嚴重的系統性偏差。我們的調查把最主要的工作放在保證數據的真實(shí)性方面。雖然舍棄了統計臺賬的方法,憑記憶容易產(chǎn)生數據誤差,但這種誤差是隨機的、雙向的,既可能偏低,也可能偏高。在平均的意義上,它們會(huì )在很大程度上互相抵消。而系統性偏差是同方向的,不可能互相抵消。因此可以有把握地說(shuō),這種隨機誤差會(huì )遠小于現行收入統計數據的系統性誤差。
  綜上述,兩位商榷者提出的論據,有的是對研究報告的誤讀或錯誤解釋?zhuān)械氖钦摀c結論南轅北轍。給人的感覺(jué)似乎是下結論在先,找根據在后,失去了學(xué)術(shù)上應有的客觀(guān)性。
  還有一點(diǎn)需要討論,兩位在共同署名的第三篇文章中聲明,他們同筆者討論的是居民收入數據問(wèn)題,而不是灰色收入問(wèn)題。而在我看來(lái),這兩者是難以分開(kāi)的。雖然在統計上搞清灰色收入是很困難的事情,但鑒于目前灰色收入泛濫的情況,收入統計避開(kāi)灰色收入就很難不失實(shí)。更重要的是,不澄清這些事實(shí),躺在虛假數據上作分析,就無(wú)法合理應對收入分配狀況惡化的挑戰。
  兩位的商榷文章當然也提出了一些有價(jià)值的意見(jiàn)。例如,施發(fā)啟指出,使用年平均人數計算比用年末人數計算更合理(盡管對結果沒(méi)有重大影響),也指出研究報告中雖然模型的解釋變量系數通過(guò)了顯著(zhù)性檢驗,但模型擬合度偏低。王有捐認為,研究報告中用外部相關(guān)數據對收入數據進(jìn)行檢驗的方法值得借鑒。這些意見(jiàn)是合理的,有益于這些問(wèn)題的進(jìn)一步研究。兩位對于改善統計數據的表態(tài),也使人感到我們之間存在共同的基礎,希望保持交流,把收入分配狀況搞清楚。
  (作者系中國經(jīng)濟體制改革基金會(huì )國民經(jīng)濟研究所副所長(cháng))
  凡標注來(lái)源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數字媒體產(chǎn)品,版權均屬新華社經(jīng)濟參考報社,未經(jīng)書(shū)面授權,不得以任何形式發(fā)表使用。
 
相關(guān)新聞:
· 統計局官員澄清:和王小魯討論的非灰色收入的統計問(wèn)題 2010-08-30
· 王小魯回應統計局:房?jì)r(jià)是最好例證 2010-08-26
· 施發(fā)啟:也評王小魯博士的《灰色收入與國民收入分配》 2010-08-25
· “灰色收入”論戰升溫 王小魯回應 2010-08-25
· 灰色收入論戰 統計局刊文質(zhì)疑王小魯 2010-08-25
 
頻道精選:
·[財智頻道]天價(jià)奇石開(kāi)價(jià)過(guò)億元 誰(shuí)是價(jià)格推手?·[財智頻道]存款返現赤裸裸 銀行攬存大戰白熱化
·[思想頻道]左曉蕾:信貸此時(shí)放松調控將前功盡棄·[思想頻道]謝和平:發(fā)展和掌握低碳核心技術(shù)
·[讀書(shū)頻道]《五常學(xué)經(jīng)濟》·[讀書(shū)頻道]投資盡可逆向思維 做人恪守道德底線(xiàn)
 
在线精品自偷自拍无码琪琪|国产普通话对白视频二区|巨爆乳肉感一区二区三区|久久精品无码专区免费东京热|亚洲中文色欧另类欧美