時間:2022-05-21 11:23:19
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了一篇統計數據論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
1問題的提出
近年以來,統計數據質量問題受到社會各界的廣泛關注,我國官方統計數據屢遭質疑,并在2010年上半年達到頂峰,也曾在一時,“被增長”、“被降低”、“被統計”,似乎成了一個時尚的名詞。那么,近年來為什么我國官方統計數據會屢遭質疑呢?我們認為一是源于社會各界對統計信息需求的大幅度提高,二是在于信息披露的多路徑化和低成本化。而要消除對我國政府統計數據質量質疑,我們必須要做好三個方面的工作。這就是一要加強統計研究,進一步推進統計方法制度的科學化進程;二要從源頭數據管理做起,把好統計數據質量關;三要加強統計管理機制建設,遏制官員對統計數據的干預。鑒于統計數據質量的形成源于各方利益的驅動,所以,為了確保上述工作任務的完成,我們必須站在博弈的視角來開展統計數據質量管理的研究。本文擬以“聯網直報”方式下的國家統計數據生成流程為線索,基于地方官員、基本單位和統計機構的理性驅動,來構建國家統計數據質量管理博弈機制,并通過該機制的描述與設計,來研究國家統計數據質量管理的最優戰略。
2國家統計數據質量管理的博弈機制分析
統計數據質量問題產生于統計數據生成路徑,源于統計數據提供者的利益驅動,為此,統計數據的生成過程,也是統計數據質量的博弈過程,依據該過程中所內含的博弈機理,我們終可尋找出國家統計數據質量管理的路徑。長期以來,我國一直推行統計數據上報的“逐級匯總”,并由此而引發了許多統計數據質量問題。為此,國家決定從2011年統計調查年報和2012年統計調查定期報表起,推行統計數據上報的“聯網直報”方式。“聯網直報”作為“四大工程”的一個重要組成部分,其是通過與“一套報制度”、“基本單位名錄庫”和“數據采集處理軟件系統”緊密結合的基礎上,共同來完成統計數據采集、傳輸、匯總、加工、上報任務的。由于“企業一套表”制度的實施,不但統一了統計數據的口徑,而且也消除了數出多門的現象產生;“網上直報”方式的推行,減降了統計數據上報過程中的人為因素干擾;網上“數據采集處理軟件系統”的采用,增加了表內、表間統計指標數據的邏輯審核以及人工審核功能,所以,在“聯網直報”統計背景下,統計數據質量可以得到了進一步保障,但統計數據質量問題仍不可得以消除。這是因為:通過數據采集與處理系統邏輯審核關的基層數據,并不能完全保證就是實際數據,只要基層單位想虛報瞞報,任何先進的統計數據采集與處理技術均是難以全面防范的。所以,“四大工程”實施后,統計數據質量控制仍是一項艱巨的任務,統計法制建設仍然不可松懈。那么,“聯網直報”背景下的統計數據質量問題是如何形成的呢?我們認為,“聯網直報”方式下的統計數據質量問題,主要來源于基層數據的虛報瞞報,這種虛報瞞報現象的產生仍將來自于基本單位利益的驅動,并遵從于博弈的機理。一般來講,基本單位是基層統計數據的起報單位,在填報基層統計數據過程中,是實報還是虛報、瞞報,這主要來自于其本身利益的權衡。首先,這種利益的權衡來自于其自身利益最大化的追求;其次,這種利益的權衡來自于地方官員的壓力;第三,這種利益的權衡來自于統計違規處罰。基于此,地方官員、基本單位、統計機構之間利益的權衡過程,構造了國家統計數據質量管理的博弈過程,地方官員、基本單位、統計機構之間利益的統一,形成了國家統計數據質量博弈的納什均衡。
3國家統計數據質量管理的博弈機制描述
3.1背景假設與符號定義為便于研究,我們假設:理性的官員、基本單位和統計機構構成了源頭統計數據質量博弈的參與人;官員的行動空間為{虛報性干預,瞞報性干預,不干預};基本單位的行動空間為{虛報,瞞報,實報};統計機構的行動空間是{檢查,不檢查};在博弈的過程中,地方官員是先行動者,基本單位是第二行動者,統計機構是最后行動者。在上述背景假設條件下,我們定義:(1)Q為基本單位基層統計數據實際值。(2)πg為地方官員干預基本單位上報基層統計數據的凈收益總額。(3)πf為基本單位上報基層統計數據的凈收益總額。(4)πs為統計機構統計執法檢查凈收益總額。(5)β為地方官員對基本單位的干預傾向,β在1的領域內取值,β>1為虛報干預程度,β=1為不干預,β<1為瞞報干預程度。(6)v為地方官員干預基本單位的收益系數,也即基本單位每上報一單位的虛假數據地方官員所獲得的經濟或行政收益。(7)m為地方官員干預基本單位的支付系數,也是一種激勵系數,當基本單位上報傾向與地方官員干預傾向一致時,體現為地方官員對基本單位的一種經濟支付;當基本單位上報傾向與地方官員干預傾向不一致時,其體現為地方官員對基本單位的一種經濟處罰。(8)k為基本單位的基層統計數據上報傾向,k在1的領域內取值,k>1為虛報,k=1為實報,k<1為瞞報。(9)t為基本單位綜合稅率。(10)λ為基本單位報假被統計機構查處時的統計處罰系數,是指每上報一單位的虛假數據的經濟處罰額。如果假設F為處罰總額,則:λ=F(k-1)Q(1)上式表明,當k-1>0時,λ應取正值;當k-1<0時,λ應取負值。λ與(k-1)Q相組合可以構成統計機構檢查時基本單位報假的總成本:Cf=λ(k-1)Q(11)N為基本單位統計數據上報次數。(12)P為統計機構統計執法檢查概率,也即統計執法檢查次數與基本單位統計數據上報次數的比值。如果假設統計檢查次數為n、基本單位上報次數為N,則:p=nN。(13)c為統計機構單位檢查概率統計執法檢查查實成本系數,也即:c=CspQ(2)其中,Cs為統計執法總費用,Cs=pcQ。
3.2收益函數的建立在對相關符號進行定義的基礎上,依據各利益主體的成本收益分析,可建立各利益主體的收益函數。
3.2.1官員的收益函數。從地方官員理性出發,地方官員干預基本單位基層統計數據的上報行為,是基于其收益最大化的。而這種收益通常指的是一種凈收益,也即總收益與總成本的差額。如此,根據相關背景假設,我們可以將官員的收益函數定義如下:πg=ν(k-1)Q-(β-1)m(k-1)Q(3)其中:(k-1)Q為基本單位在地方官員的干預之下,實際虛報、瞞報或實報的結果,ν(k-1)Q則為這種干預給官員所帶來的總收益,當基本單位選擇虛報時,其數值為正,表現為一種收益;當基本單位選擇瞞報時,其數值為負,負值表現為一種損失;當基本單位選擇實報時,其數值為零。(β-1)m為地方官員干預基本單位上報符合自身要求的基層數據時,對基本單位的經濟補償支付系數,也即地方官員的單位干預成本,(β-1)m(k-1)Q為地方官員對基本單位的干預總成本,當地方官員的干預行為與基本單位的上報傾向一致時,其取正值;當不一致時,其取負值,負值表現為一種收益。
3.2.2基本單位的收益函數。基本單位關于基層統計數據上報行為的選擇,也是基于其成本收益分析的。其中,基本單位上報虛假數據的收益主要來自于地方官員的政策激勵和稅收節約,成本主要來自于統計機構的統計執法處罰。通常,考慮到地方官員的激勵和稅收的上繳情況,在統計機構不進行統計執法檢查的情況下,基本單位的收益為地方官員的激勵與稅收上繳情況的權衡。也即:πf1=[(β-1)m-t](k-1)Q其中:(β-1)m-t為基本單位在考慮地方官員干預行為和稅收繳納的情況下,單位報假凈收益,在虛報的情況下,去取決于地方官員虛報激勵系數與由此而帶來的稅收上繳之間的差額,其差額為正,基本單位選擇虛報,差額為負選擇瞞報。在統計機構進行統計執法檢查的情況下,基本單位的收益為地方官員的激勵與稅收上繳及被統計機構查處罰款之間的權衡。也即πf2=[(β-1)m-t](k-1)Q-λ(k-1)Q其中,λ(k-1)Q為基本單位在統計執法檢查被查處時的罰款總額。考慮到統計機構的統計執法檢查帶有一定的隨機性,也即統計機構的統計執法所采用的是混合戰略,所以,基本單位的收益通常也是帶有不確定性的,為此,其收益函數往往是一個期望收益函數。從而,在假設統計執法檢查概率等于基本單位被查處概率的情況下,我們可以將基本單位的期望收益函數定義如下:πf=(1-p)πf1+πf2?????=(1-p)[(β-1)m-t](k-1)Q+p{[(β-1)m-t](k-1)Q-λ(k-1)Q}(4)對式(4)進行整理可得:πf=[(β-1)m-t](k-1)Q-pλ(k-1)Q(5)我們稱式(5)為基本單位上報傾向期望收益函數。由該函數可知,當基本單位選擇報真時,k=1,πf為零;當基本單位選擇虛報或瞞報時,其是一個不確定的值。
3.2.3統計機構的收益函數。單純從其收益來講,統計機構的收益來自于統計執法檢查的經濟處罰,雖然這種經濟處罰應該上繳國家財政,但我們也可暫且把它看成統計機構的收入,以此相對應的則是統計執法檢查費用的支付,它可構成統計執法檢查的成本。基于此,在統計部門檢查的情況下,如果基本單位報假,其凈收益為處罰收益與檢查成本之差,如果基本單位報真,其凈收益為檢查成本,是一個負值。在統計部門不進行檢查時,無論基本單位報真還是報假,其均無任何收益。這樣,如果假設統計執法檢查概率為p,則在基本單位報假在統計執法檢查中的被查處率為100%的情況下,我們可將統計機構的期望收益函數可以定義如下:πs=p[λ(k-1)Q-pcQ]+(1-p)0(6)其中:λ(k-1)Q為統計執法檢查總收益,pcQ為統計執法檢查總成本。對式(6)進行整理可得:πs=pλ(k-1)Q-p2cQ(7)我們稱式(7)為統計機構收益函數。式(7)表明,當統計機構不檢查時p=0,πs=0。當統計機構檢查時,如果基本單位上報的是虛假統計數據,則統計機構存在πs=pλ(k-1)-p2Nc的收益;如果基本單位上報的是真實統計數據,則統計機構的收益為πs=-p2Nc。也即存在著一種負的收益。
3.3模型體系的構建根據國家統計數據質量博弈機理與路徑,以及動態博弈納什均衡的求解思路,國家統計數據質量管理博弈模型體系及納什均衡的求解,我們將從統計機構的理性行為分析入手。
3.3.1統計機構最優戰略的確定。從統計機構的收益最大化出發,統計機構的最優戰略將存在于其收益最大化取值的一階條件之中。所以,我們對式(7)求解關于統計執法概率的一階偏導數可得:?πs?p=λ(k-1)Q-2pcQ(8)令式(8)為零并進行整理可得:p=λ(k-1)2c(9)我們稱式(9)為統計機構的最優戰略或反應函數。式(9)表明,最優的統計機構統計執法檢查概率與統計機構的處罰收益成正比,與統計執法檢查成本成反比。在統計執法收益不變的情況下,統計執法成本越大,統計執法檢查概率越小;統計執法成本越小,統計執法概率越大。在統計執法成本不變的情況下,統計執法收益越大,統計執法概率越大;統計執法收益越小,統計執法概率越小。
3.3.2基本單位最優戰略的求取。在觀測到地方官員的行動并準確地預計到統計機構將以一個什么水平的概率進行統計執法檢查后,基本單位將依據自身收益最大化的原則來確定自己的最優戰略。首先,我們將式(9)帶入式(5)可得:πf=[(β-1)m-t](k-1)Q-λ2(k-1)22cQ(10)對式(10)求關于k的一階偏導數可得:?πf?k=[(β-1)m-t]Q-λ2(k-1)cQ(11)令式(11)為零,并進行整理可得:k=1+c[(β-1)m-t]λ2(12)我們稱式(12)為基本單位的最優戰略。式(12)表明,基本單位的上報傾向,決定于(β-1)m-t。如果(β-1)m>t,基本單位傾向于虛報;如果(β-1)m<t,基本單位傾向于瞞報;如果(β-1)m=t,基本單位傾向于實報。
3.3.3地方官員的最優戰略的確定地方官員的最優戰略也是在準確地就預計到基本單位的行動后,依據自身收益最大化的原則來確定的。所以,我們首先將式(12)帶入式(3)可得:πg=νc(β-1)m-νctλ2Q-cm2(β-1)2-cmt(β-1)λ2Q(13)對式(13)求取β的一階偏導數可得:?πg?β=νcm+cmtλ2Q-2cm2(β-1)λ2Q(14)令式(14)等于零并進行整理可得:β=1+ν+t2m(15)我們稱式(15)為地方官員的最優干預傾向。式(15)表明,地方官員對基本單位的干預傾向為虛報性干預,其干預力度取決于收益與成本的權衡。在基本單位上繳稅收綜合稅率一定的情況下,收益系數越大,干預力度越大,支付系數越大,干預力度越小。
3.3.4納什均衡的求解。將式(15)帶入式(12)可得:k=1+c(ν-t)2λ2(16)將式(16)在帶入式(9)可得:p=ν-t4λ(17)我們稱式(16)為基本單位的最優行動,式(17)為統計機構的最優行動。式(16)、式(17)與式(15)相組合,可以構成國家統計數據質量博弈的納什均衡。如式(18)所示:{β=1+ν+t2m,k=1+c(ν-t)2λ2,p=ν-t4λ}(18)式(18)表明:地方官員對基本單位的干預傾向為虛報性干預,其干預力度取決于收益與成本的權衡。基本單位的上報傾向具有不確定性,當地方官員的收益系數大于基本單位上繳稅收綜合稅率時,基本單位傾向于虛報;當地方官員的收益系數小于基本單位上繳稅收綜合稅率時,基本單位傾向于瞞報;當地方官員的收益系數等于基本單位上繳稅收綜合稅率時,基本單位傾向于實報。統計機構統計執法檢查的概率決定于地方官員的收益系數與基本單位上繳稅收綜合稅率的差額和統計處罰系數所形成的比率,當地方官員的收益系數與基本單位上繳稅收綜合稅率的差額為正時,我們要重點查處虛報現象;當地方官員的收益系數與基本單位上繳稅收綜合稅率的差額為負時,我們應重點查處瞞報現象。
4國家統計數據質量管理的博弈機制設計
如果假設統計處罰只針對基本單位、不涉及地方官員;統計處罰系數是一個激勵合同;基本單位的個人理性約束和激勵相容約束可以進行整合,則在上述符號定義下,依據委托理論,可對國家統計數據質量管理博弈機制也即最優處罰系數進行設計。
4.1統計機構和基本單位反應函數的引入為了構建國家統計數據質量管理委托模型,我們首先引入統計機構和基本單位的反應函數。統計機構的反應函數:p=λ(k-1)2c(19)基本單位的反應函數:k=1+c[(β-1)m-t]λ2(20)。
4.2委托模型的構建根據委托分析的基本原理,委托模型設計的基本目的在于尋求一個既能使委托人的收益達到最大,又對人具有激勵作用的最優合同。通過上述分析,我們可以看出,λ作為一個激勵合同,滿足式(19)的λ,能夠使統計機構的收益達到最大化,滿足式(20)的λ,可以對基本單位產生激勵作用,能夠同時滿足式(19)和式(20)的λ,就是一個最優合同。所以,將式(19)和式(20)聯立,即可構建國家統計數據質量管理委托模型。如式(21)所示。p=λ(k-1)2ck=1+c[(β-1)m-t]λ2(21).
4.3最優統計處罰系數的求解對式(21)進行整理可得:k-1=2cpλ(22)k-1=c[(β-1)m-t]λ2(23)將式(23)帶入到式(22)可得:2cpλ=c[(β-1)m-t]λ2(24)對式(24)進行整理可得:λ=(β-1)m-t2p(25)式(25)即為統計機構統計處罰系數測算模型。
4.4模型內涵分析由式(25)我們可以看出,統計處罰系數具有如下政策內涵:(1)在統計執法檢查概率降低的情況下,統計機構應提高處罰力度。式(25)表明,λ與p成反比,p反映了統計執法檢查的概率或頻率,所以,在統計執法成本上升而導致統計執法檢查頻率下降的情況下,統計機構應加大統計處罰力度,并借此來彌補統計執法檢查頻率的不足。(2)在基本單位單位違法收益提高的情況下,統計機構應加大統計處罰力度。式(25)還表明,λ與(β-1)m-t成正比。其中,(β-1)m-t為基本單位虛報瞞報數據的收益。為此,可以認為統計處罰系數與基本單位單位違法收益成正比。這樣,在基本單位單位違法收益提高的情況下,應該提高統計執法處罰力度;在基本單位單位違法收益下降的情況下,應該降低統計執法處罰力度。當然,由基本單位單位違法收益我們還可以看出,基本單位的單位違法收益取決于地方官員的干預力度與綜合稅率之差。該差額越大,基本單位的單位違法收益越大,該差額越小,基本單位的單位違法收益越小。所以,當地方官員的干預力度加大時,統計機構也應該加大統計處罰力度,在地方官員干預力度減小時,統計機構可以適當減小統計處罰力度。(3)統計處罰系數可能存在正負兩個值,其所表明的是對不同報假傾向的處罰。式(25)表明,統計處罰系數的測算,存在著正負兩個值。其中正值對應的是基本單位虛報的處罰系數;負值對應的是基本單位瞞報的處罰系數。這種取值也保證了基本單位收益函數的成本項,在基本單位采取虛報行動時,統計執法處罰構成了其違法成本;在基本單位采取瞞報行動時,統計執法處罰仍構成了其違法成本。
5實證研究
5.1背景資料與數據的獲取為了說明本文所構建模型的可操作性,我們的實證研究工作將基于河北省的區域范圍,并就此而獲取了相關背景資料與數據如下:(1)財政部、國家稅務總局關于固定資產投資稅收抵免相關政策。(2)中華人民共和國統計法第四十一條規定《統計法》相關處罰規定。(3)某省2011、2012年相關統計數據,如表1所示。
5.2相關指標統計數據的整理(1)地方官員干預收益系數v指標數據的整理依據表1計算如下:ν=DyDi=17285.60-16059.8212311.85-8866.56=1225.783445.29=0.36也即本實證分析中的地方官員干預收益為0.36。(2)地方官員干預支付系數m指標數據的整理根據財政部、國家稅務總局關于固定資產投資稅收抵免相關政策,我們假設地方官員干預支付系數m為10%。(3)基本單位綜合稅率t指標數據的整理依據表1,我們計算某省基本單位綜合稅率如下:t=947.59+1067.1216059.82+17285.60=2014.7133345.42=0.06也即本實證分析的基本單位綜合稅率為0.06。(4)統計報假處罰系數λ指標數據的整理根據中華人民共和國統計法第四十一條第二款和中華人民共和國統計計法實施細則三十二條第一款的規定,如果認定虛報瞞報率達到100%的為情節極為嚴重者,并執行20萬元的罰款,則每1%的虛報瞞報率的處罰額度將達到0.2萬元。據此,我們認為統計報假處罰系數為0.2。(5)統計執法成本系數c統計執罰成本系數的測算,我們將在統計執法收益等于統計執法成本的基礎上,來進行。首先,我們利用某省統計執法檢查典型案例材料,整理匯總成表2。然后,我們以單位虛報瞞報率處罰額度為0.2,推算出各單位應交處罰額。在此基礎上,我們來測算統計執法成本系數:c=統計執法檢查總費用統計執法檢查概率′統計數據實際值=46.480.33′9975.35=46.483291.87?=0.0141也即在統計執法檢查中,平均每次統計執法檢查的單位查實成本為0.0141。
5.3存在地方官員干預的國家統計數據質量的博弈機制分析根據上述研究結論,在存在地方官員干預的情況下,國家統計數據質量管理博弈的納什均衡為:{β=1+ν+t2m,k=1+c(ν-t)2λ2,p=ν-t4λ}據此,我們可以求解地方政府、基本單位和統計機構的最優戰略:β=1+ν+t2m=1+0.36+0.062′0.1?=2.1k=1+c(ν-t)2λ2?=1+0.0141′(0.36-0.06)2′0.22?=1+0.004230.08?=1.053p=ν-t4λ?=0.36-0.064′0.2?=0.375也即:{β=2.1,k=1.053,p=0.375}(26)式(26)為地方官員、基本單位、統計機構的最優戰略組合。其說明,在地方官員虛報干預且干預力度為2.1的情況下,基本單位具有虛報傾向,但受到統計機構統計執法處罰的威懾,其只能將虛報傾向確定為1.053,也即存在5.3%的虛報份額。在此背景下,統計機構最優的行動是以37.5%的概率進行統計執法檢查。
5.4不存在地方官員干預的國家統計數據質量管理的博弈機制分析在不存在地方官員干預的情況下,國家統計數據質量管理博弈納什均衡中的地方官員干預收益系數v和地方官員干預支付系數m將等于零,這樣,地方官員不干預背景下的國家統計數據質量管理博弈納什均衡將轉化為:{β=1,k=1+c(ν-t)2λ2,p=ν-t4λ}如此,依據上一節中的數據我們可以求取基本單位、統計機構的最有戰略組合:k=1-ct2λ2?=1-0.0141′0.062′0.22?=1-0.0008460.08?=1-0.0106?=0.9894p=t4λ?=0.064′0.2?=0.075也即{β=1,k=0.9894,p=0.075}式(27)為地方官員、基本單位、統計機構的最優戰略組合。其說明,在地方官員不進行干預的情況下,為了逃避納稅,基本單位存在著瞞報統計數據的傾向,但限于統計執法檢查的威懾,其瞞報程度只能達到1.06%。在此情況下,統計機構的最優行動是以7.5%的概率來進行統計執法檢查。
5.5最優統計處罰系數的測算根據上述數據,我們可以對統計機構統計處罰系數進行測算。在存在地方官員干預且干預力度為的m=0.1的情況下,如果t=0.06、p=0.33,則將最優的統計處罰數為:λ=(β-1)m-t2p?=(2.1-1)′0.1-0.062′0.33?=0.075(28)式(28)表明,在存在地方官員干預時,基本單位存在虛報現象,如果地方官員的干預力度為0.1、綜合稅率為0.06、統計執法檢查概率為0.33時,統計機構的最優處罰力度為0.075。也即每1%的虛報率罰款0.075萬元。如果不考慮地方官員的干預傾向,也即m=0時:λ=-t2p?=-0.062′0.33?=-0.091(29)式(29)表明,在不存在地方官員干預時,基本單位存在瞞報現象,如果綜合稅率為0.06、統計執法檢查概率為0.33,統計機構的最優處罰系數為0.091。也即每1%的瞞報率,處以0.091的罰款。
6結論與建議
本文的上述研究,得到了如下結論與建議:(1)源頭數據是當前國家統計數據質量管理的重點“聯網直報”方式下的統計數據生成路徑表明,伴隨著基本單位名錄庫、企業“一套表”制度、數據采集處理軟件系統和聯網直報等“四大工程”的建設,我國國家統計數據的生成流程正在發生一種質的變革,在這種變革中,統計數據傳輸流程中的統計誤差,可以得到有效的控制。從而,“四大工程”全面推開后,我國國家統計數據質量管理的重點,將推移到源頭數據。(2)源頭數據質量問題源自于地方官員、基本單位以及統計機構利益的權衡對源頭統計數據的生產過程所進行的分析表明:在源頭數據的生產過程中,存在著地方官員、基本單位和統計機構等三個利益主體,同一質量的數據對三個不同的利益主體會產生不同的利益,為了自身的利益最大化,三個利益主體都在追求著不同的統計數據質量,從而伴隨著地方官員、基本單位以及統計機構利益的權衡,也就產生了國家統計數據質量管理的博弈。(3)基本單位是國家統計數據質量管理博弈的核心在國家統計數據質量管理博弈中,基本單位的利益受到來自地方官員和統計機構正反兩個方面力量的沖擊。從自身利益出發,基本單位本身具有瞞報傾向,但地方官員從自身利益出發卻引誘其虛報,統計機構從自身職責出發,又以法律為準繩督促其實報。從而將基本單位推入到了三難境地,以基本單位上報傾向選擇為核心,構成了國家統計數據質量管理的三方博弈。(4)地方官員的干預具有正反兩個方面的作用在國家統計數據質量博弈中,地方官員的干預行為具有正反兩方面的作用,正面作用在于其可以促使基本單位實報,反面作用是可以導致基本單位虛報。因為基本單位通常都具有瞞報的傾向,地方官員通常都具有虛報傾向。在地方官員的干預下,如果地方官員的干預力度恰好與基本單位的瞞報傾向相等,則會促使基本單位實報,如果地方官員干預力度大于基本單位的瞞報傾向,基本單位將轉瞞報為虛報。(5)統計處罰系數應具有激勵作用,可以基于委托論來測算在統計執法檢查過程中,統計處罰不是目的,而是手段,其應具有促使基本單位按照統計機構的意愿來選擇上報傾向的激勵作用。為此,統計處罰系數的測算可以在委托理論的指導下來完成。在委托理論指導進行統計處罰系數測算時,相關目標函數與約束條件的設計要充分考慮動態博弈的特點,并可基于該特點將個人理性約束條件和激勵相容約束條件加以整合。(6)作為統計監督檢查的工具與手段,統計處罰力度與統計檢查頻率具有相輔相成的關系統計執法檢查加之統計執法處罰為統計機構維護自身利益的兩大手段。最優統計處罰系數測算模型表明,統計執法處罰力度與統計執法檢查概率存在著反向關系,加大統計執法力度,可以提高統計執法檢查的威懾力度,因而可以降低統計執法檢查頻率;減低統計處罰力度,會減降統計執法檢查的威懾力度,所以要提高統計執法檢查的頻率。因此,統計執法處罰力度與統計執法檢查頻率具有相輔相成的關系。
作者:張玲芝 單位:河北經貿大學經濟管理學院
論文摘要:隨著社會主義市場經濟的不斷發展,統計失實的的現象日漸嚴重,統計工作者應當本著對本職工作高度負責的精神,進行全過程的、全員參加的、以預防為主的統計數據質量控制。要盡可能采用計算機處理統計資料,最大限度的減少人工參與,加強對統計人員的職業道德和專業水平培訓以及加大統計執法力度等,以保證源頭數據的準確性,使我們的統計工作更好的地為現代社會經濟服務。
現代經濟正步入以世界統一市場為標志的世界經濟一體化軌道,企業的成敗,取決于信息獲取、識別、處理、轉換、傳遞的準確性、效率與速度。因此,信息在企業經營管理中的重要作用也將愈來愈顯著。隨著我國改革開放,確立市場經濟體制,和加入WTO,企業要能在國際國內激烈的市場競爭中求得生存與此同時發展,一個重要的條件就是——必須要有一個健全的高效的信息系統,以滿足企業經營管理決策所需的各種內外信息。因此,作為提供信息的企業統計必將在其中扮演重要角色,發揮重要作用。特別是對我們***系統來說,隨著“大企業、大市場、大品牌”的形成,以行政區劃為單一的卷煙市場割據將很快被打破,搬掉門檻推倒墻是大勢所趨。再下一步就有可能是***專賣法的取消,所有這些都告訴我們,***行業也將馬上面臨著國際國內激烈的市場競爭。想在這種激烈的競爭中生存發展,必須要有一支能夠為企業的決策和管理者提供準確數據的素質過硬的統計隊伍。
近年來,我國統計工作取得了比較顯著的成績。從總體上來看,我國現有的統計數據,基本上還是能夠反映客觀實際的。但是,隨著社會主義市場經濟的不斷發展,經濟結構復雜化,利益主體多元化,再加上體制轉化過程中經濟秩序混亂,人為干擾增多,因而搞準統計數據的難度也就日益增大,統計失實的潛在危險性也就日漸嚴重,并將逐步暴露。對此,我們必須要有清醒的認識,要始終不渝地把提高統計數據質量問題,擺到統計工作的首要位置,并采取綜合治理措施,切實抓緊抓好。下面就統計數據質量問題談談自己一些粗淺的看法。
一、統計數據質量控制的意義
企業統計的目的是為企業經營決策管理提供統計信息。在市場經濟條件下,企業經營決策極具風險性,風險產生于不確定性并由不確定性程度決定風險的大小,而不確定性又與信息的準確和及時程度直接相關,信息愈準確及時,不確定性愈低,反之,亦然。所以,準確性和及時性是對統計資料的兩項基本要求。其中,準確性的要求是第一位的,是統計工作的生命。它確定著統計資料是否有效和價值的高低,是衡量統計數據質量的根本標志。準確可靠的統計數據,便于決策和管理者正確地把握形勢,客觀地剖析問題,從而作出科學的決策。反之,有水分的、失實的統計數據,相互矛盾的統計數據,給決策者以錯誤的信號,將會誤導決策和調控,對企業的發展將會造成重大損失。因此,統計工作者必須以對本職工作高度負責的精神,以統計數據為對象,以消除統計數據的差錯為目標,千方百計搞準統計數據,達到強化統計數據質量控制的目的。
二、常見的統計數據質量問題及分析
(一)、數據虛假
這是最常見的統計數據質量問題,也是危害最為嚴重的數據質量問題。這類統計數據完全是虛構的杜撰的,毫無事實根據。造成統計數據虛假的因素多種多樣,比如,有意虛報,瞞報統計數據資料,指標制定不嚴密,統計制度不完善,不配套等。
(二)、拼湊的數據
這種數據是把不同地點,不同條件,不同性質的數據在收集、加工、傳遞過程中,人為地拼湊成同一時間、地點、條件和性質下的同一數據。這種東拼西湊的數據,雖然分別有事實根據,但是從整體上看數據是不符合事實的,其性質與數據虛構相同。
(三)、指標數值背離指標原意
這是由于對指標的理解不準確,或者是因為指標含義模糊,指標計算的隨意性大等原因造成的數據質量問題,表現為收集整理的統計數據不是所要求的統計內容,數據與指標原意出現走樣,面目全非。
(四)、數據的邏輯性錯誤
這是指統計資料的排列不合邏輯,各個數據、項目之間相互矛盾。例如,企業卷煙庫存商品中主要的組成部分是省產煙、省外煙、國外煙,如果企業報送的統計資料中,卷煙庫存商品總金額顯著下降,而省產煙庫存金額大幅度上升,省外煙和國外煙庫存金額只是持平或只有小幅度的下降,這就存在矛盾,表明數據有邏輯性錯誤。
(五)、數據的非同一性
它是指同一個指標在不同時期的統計范圍、口徑、內容、方法、單位和價格上有差別而造成的數據的不可比性。例如,2003年的統計資料中不含稅價在30元以上的卷煙為一類卷煙,而在2004年的統計資料中,不含稅價50元以上的卷煙為一類卷煙,如果在此基礎上來比較兩年的一類卷煙的銷售量,而得出一類卷煙銷售量大幅度下降的結論顯然是不合理的。
(六)、數據不完整
這里指調查單位出現遺漏,所列項目的資料沒有搜集齊全,不符合統計資料完整性的要求。數據不完整,就不可能反映研究對象的全貌和正確認識現象總體特征,最終也就難以對現象變化的規律性做出明確的判斷,甚至會得出錯誤的結論。
(七)、統計手段和統計分析落后
目前許多企業統計工作仍處于手工狀態,很原始!即使采用計算機也僅僅是減少工作量去做一些匯總、指標計算,并沒真正引用先進的計算機技術和網絡技術。所做的統計分析也局限于事后分析,即對統計數據進行單純的講解說明;不能利用網絡技術實行信息共享等方式進行事前分析和預測。換句話說,“統計預測”這一職能根本沒有發揮作用,缺乏對信息的收集、綜合和系統化。
此外,常見的統計數據問題還有計算錯誤、筆誤等。
可見,統計數據質量問題既可能是來自于設計階段,也可能是來自于統計資料的整理階段。
三、統計數據質量控制方法
(一)、統計數據質量控制的原則應當是全過程的、全員參加的、以預防為主的數據質量控制。
首先,統計數據質量控制要貫穿于統計工作的全過程。每進行一步,都要對已完成的工作進行檢查、對已發生的差錯及時進行糾正,做到層層把關,防止差錯流入下一個工作環節,以保證統計數據的質量。其次,參加統計數據質量管理和控制的人員應當是全面的。全體統計工作者都要樹立數據質量意識,各個主要的工作環節都要落實專人負責。統計數據質量的好壞,是許多工作和許多統計工作環節質量的綜合反映,牽涉到統計工作的所有部門和人員,因此,提高數據質量需要依靠所有統計工作者的共同努力,決不是單純靠某一個部門或少數人所能搞得好、抓得了的。只有人人關心數據質量,大家都對數據質量高度負責,產生優質的統計數據才有堅實的群眾基礎。因而,統計數據質量控制要求把差錯消滅在它的形成過程中,做到防檢結合,以防為主。這就要求有關人員在質量控制中具有超前意識,拋棄那種出現了統計數據問題才想辦法解決問題的被動的局面。
實行全員性的質量控制,就要把統計數據質量目標及其關鍵交給廣大統計工作者,落實到每個工作崗位,使每個崗位都有明確的工作質量標準,做到合理分工、職責明確,職責越明確,數據質量控制就越有保證。
(二)、統計設計階段的質量控制
統計設計是統計工作的首要環節,統計數據質量的好壞,首先決定于這個過程,它是提高統計數據質量的前提。如果設計過程的工作質量不好,就會給統計數據質量留下許多后遺癥。設計過程的質量控制需要抓好以下幾項工作:
1、正確規定統計數據質量標準。數據質量標準是指根據不同的統計目的對統計數據精度所提出的要求。滿足統計目的精度的統計數據就是準確的,高質量的統計數據。首先要作充分的調查,系統地收集市場和用戶對統計數據的反映和實際使用效果的情況;其次要分析研究過去統計數據的主要質量問題,找準統計數據質量控制的主攻方向;最后要進行反復論證,考慮到統計工作中實際能夠達到的水平。
2、合理設計統計指標體系及其計算方法。
統計指標設計得是否合理,也是影響統計數據質量的因素之一。采用統計報表搜集資料,首先要實行標準化管理,制定的指標要符合統計制度的規定,范圍要全,分組要準,指標涵義的解釋和計算方法要精確;其次要對統計報表的設計、頒發、填制、匯總的全過程實行全面質量管理。
(三)、資料整理鑒別階段的質量控制
統計資料整理鑒別階段出現的差錯是統計數據質量問題的重要方面。如果資料不準確,就會影響結論的正確。因此,要特別注意審查資料的可靠性和適用性,要弄清楚統計指標的口徑范圍、計算方法和時期時點。對于口徑不一致或不完整的資料,需要進行調整、補充;對于相互比較的資料,必須要注意有無可比性;一旦發現數據有嚴重的質量問題,應進行核實,避免有質量問題的資料進入匯總處理階段。總之,對搜集到的資料,經過鑒別推敲、核實審定、使之準確無誤,才能使統計數據的質量得到保證。
(四)、人為錯誤的質量控制
1、盡可能采用計算機處理統計資料,同時提高統計分析水平。
計算機作為當今社會不可缺少的高科技產物已滲透到我們生活、工作中的各個環節。運用計算機整理、匯總統計資料,速度快、效果好,其優越性是手工整理無可比擬的。現在國內大部分著名企業基本上實行網絡化、全球化,利用網絡資源了解世界先進行業信息,采用科學先進的統計分析方法和手段,進行橫向、縱向對比,找差距挖潛力,努力趕超世界先進企業。要能夠寫出有一定深度的統計分析預測報告,系統、全面、科學地去挖掘利用網絡資源和從市場取得的第一手資料,完善整個分析、預測手段方法和過程。但是,也應重視計算機處理數據的質量問題,提高計算機數據處理的關鍵在于提高錄入數據的可靠性。
2、統計工作者本身應提高自身素質。
統計人員沒有深厚的專業知識和豐富的實際工作經驗,沒有跟上時代及時進行知識更新,不善于統計調查獲取第一手資料,寫不出有一定深度關于本企業某一方面對決策層有參考價值的統計分析報告。因此,對統計人員應該加強培訓工作,企業內部應建立配套的培訓機制,對每一層次統計崗位實施針對性的培訓,必要時到企業外請有關專家學者授課,或到相關先進單位進行考察學習,做到取長補短。統計工作者本身也應該努力學習統計知識,鉆研業務,不斷提高統計業務素質和水平,杜絕因業務不熟悉而造成的數據質量問題。
3、加強對統計人員的職業道德培訓。
目前,上級部門下達計劃和各類政績考核對統計數據干擾不可低估。有些地方,以是否完成計劃和各類數據的高低作為考核地方政績的依據,導致很多下級部門所報的統計數據高于計劃數或持平,這并不是計劃部門的計劃多么精確合理,而是說明某些統計對象或統計部門受某種利益的驅動而使統計數據的質量得不到保障。當然,數據不真實、不準確的原因是多方面的,其中統計人員的思想道德對統計數據的影響是很大的。這就要求我們加強對統計人員的思想品德和職業道德教育,要求每一個統計工作者必須堅持實事求是的工作作風,認真對待每一個統計數據,如實地反映情況。
4、加大統計執法力度,保證源頭數據的準確性。
統計部門今后應在加強統計信息工程建設的基礎上從數據采集的圈子中跳出來,重點加大統計執法檢查,對弄虛作假的單位要堅決嚴肅查處。在立法上,罰款數額應該大幅增加,以威懾統計違法者,逐步建立全社會的統計誠信體系。
以上是本人對統計數據質量控制的一點膚淺的認識,旨在喚起統計部門和廣大統計工作者更加重視統計數據的質量,抵制統計上弄虛作假的行為,提高統計數據的質量水平,使我們的統計工作能更好的地為現代社會經濟服務。
【摘要】我國政府于2002年4月15日正式加入了數據公布通用系統。統計雖然“入世”了,但不論是與社會各界對統計信息的需求相比,還是對統計核算和統計數據公布的國際準則的運作要求相比,我國的統計數據質量目前都還有一定差距。為了更好地滿足社會經濟發展過程中社會各界對統計數據的需求,使我國統計進一步與國際接軌,有必要對我國統計數據質量管理進行研究。
【關鍵詞】統計數據;質量問題;國家統計局
統計數據質量問題是衡量統計工作的核心指標。尤其是我國加入WTO,與世界經濟接軌的今天,社會各界對統計信息的需求量越來越大,對統計信息質量的要求也越來越高。統計信息質量的高低直接影響和決定著統計信息的可利用性。統計數據質量低下將會直接導致錯誤的決策。因此,努力提高統計數據的質量,實現統計信息的準確、有效、全面、有著重要的意義。
一、統計數據質量的含義
傳統的統計數據質量僅僅指其準確性,通常用統計估計中的誤差來衡量。但如今“質量”的概念被拓寬了,“統計數據質量”的概念也有必要拓寬。目前各國統計機構和有關國際組織對統計數據質量含義的解釋和理解仍存在一定的分歧,對統計數據質量應涵蓋哪幾個方面,還沒有統一的標準。各國從本國的實際情況以及對數據質量含義的理解出發,確定了不同的數據質量標準。如英國政府統計數據質量標準是準確性、時效性、有效性、客觀性;韓國的質量標準則是適用性、準確性、時效性、可索取性、可比性、有效性。在我國,統計數據質量主要包括統計數據的核心質量、形式質量及延伸質量三大方面。
二、我國統計數據質量管理現狀及存在問題
改革開放以來,我國統計人員大膽探索,辛勤實踐,在指標體系、調查方法、統計標準、技術手段、數據報送與處理方式等方面進行改革,較好地滿足了社會各界對統計信息的需求,推動了統計事業的發展。但是,浮夸風以及片面追求假、大、空現象仍然存在,這些都違背了統計工作的基本要求,阻礙了統計工作的發展。目前我國統計數據質量管理上存在的問題主要有:
1.統計數據失真。統計制度不夠完善是造成統計數據失真的內在因素,表現在:統計部門內部各專業在統計方法、指標涵義、口徑上還存在一定程度上的不統一;專業間統計方法改革不同步;統計范圍、口徑的理論值與實際值出入有時還比較大;統計與財會在核算周期上還存在一些差異,并且在統計數據質量管理上各級統計管理部門在統計執法過程中力度不夠,對統計過程缺少制約與監督,對統計數據缺乏校驗與復查的有力措施。
2.設計時需求不明確,缺乏遠見。數據庫與文件管理系統的重要區別之一在于不僅存放數據,而且存放數據之間的相關性。相關性不僅表現在數據依存的時間、地點、類型和名稱等原始屬性上,還會在數據的轉移過程中產生再生的相關性。搜集數據階段使用的方法不正確,應用需求不明確等都會影響數據完整性和準確性。
3.數據處理手段發展不平衡。數據處理手段出現從基層的手工操作到省、國家一級政府統計數據處理的高度信息化。就地域而言,占全國70%以上的地方統計數據處理是手工操作或半手工操作,速度慢、效率底,可靠性差,這與統計的及時性要求不相符合。統計所反映的當前經濟現象的真實性難以確定。
4.質量管理監督措施不夠健全。由于多數檢索系統沒有進入實際應用階段,數據質量的控制和監督往往被人們忽視。絕大多數單位在數據準備、錄入階段缺乏審核等質量控制、監督措施,著錄標引的檢查,一般采取自己審核或互相審核的方法。缺少科學的統計數據質量評估和監控造成統計數據不同層次脫離實際的偏差,給決策帶來極大的不便。
5.統計人員隊伍素質不高。基層統計工作薄弱,統計手段落后,統計人員素質比較低,基層統計隊伍不穩定都影響了統計數據質量。
三、我國統計數據質量管理問題的原因分析
在目前我國統計數據質量管理中,以單項數據質量管理為主,缺乏綜合的、全面的質量管理體系;對數據質量內涵的理解相對來說仍較為狹隘,在實踐中主要圍繞著數據準確性進行評估,對數據質量的其他方面重視不夠;在評估過程中,沒有讓社會公眾和用戶充分參與進來,評估機制缺乏必要的透明和有效性,未能取得社會各界對數據資料的充分理解和認可;對于多種經濟成分的數據質量評估方法不夠明澈;缺乏明確的數據質量管理要求和目標。
從數據質量管理的角度來看,我國統計數據質量管理存在諸多問題的原因在于:
1.統計數據質量理論及其控制技術與政府統計實踐脫節。各種統計數據質量控制技術在我國的實際統計工作中的研究和應用不多,對于經常性統計數據質量控制,實際上還主要是采用事后的分析評估和擠水分的方法,而事前的分類預防控制不多,建立誤差模型進行分析的也不多,所應用的僅有的一些事后質量控制技術和統計數據質量管理的組織活動沒有實現很好的結合,雖然指定了主要統計數據質量的評估方法,但具體方法的應用、由哪些部門負責以及這些部門的質量責任、職權和義務并不明確。
2.統計數據質量管理中的全面質量管理并不全面。全程性上,只重視調查環節,不重視統計設計環節對數據需求的研究,從而影響數據相關性、及時性的提高;全域性上,所實行并取得很大成功的統計數據全面質量管理的措施及經驗,主要集中于幾個專項的普查,應用范圍較窄;全員性上,只重視統計系統內部的人員控制,而對統計系統外部的,占統計工作人員2/3的基層統計人員卻無從控制。
3.缺乏明確的質量管理目標和統一的質量管理規范。對統計數據質量管理缺乏明確的質量方針和質量目標,缺乏相對統一的統計數據質量管理標準和規范,導致了統計數據質量的混亂。
4.控制措施與事后評估結果及發現的問題沒有很好結合。統計是一項循環往復的過程,因此每一次新的修訂統計設計都應反映出上一次數據質量評估的結論以及質量改進的要求。但是從公布實施的統計調查制度上看,事先的控制措施,如填表要求中的平衡關系,邏輯審核關系用于質量控制的設計內容較少。
四、提高我國統計數據質量管理的對策和建議
多年來,國家統計局一直把統計數據放在首要地位,通過不斷努力與實踐的,摸索出一套方法,即一靠科技,二靠法制,對統計數據實行全面質量管理。在此,結合專家學者對統計數據質量管理的研究,筆者提出一些自己的看法。
1.搞好統計調查方法的改革是提高統計數據質量的前提。國家統計局在《國家統計制度的總體方案》中提出了我國統計調查方法改革的長遠目標,即“建立以必要的周期性普查為基礎,以經常性的抽樣調查為主體,同時輔之以重點調查、科學推算和少量的全面報表綜合運用的統計調查方案體系”指明了抽樣調查作為新統計調查體系的主題,精簡全面統計報表。要提高統計數據質量,必須推廣抽樣調查方法的應用,它避免了對總體單位的逐一調查和較多的中間環節,在較大程度上減少了各方面對統計數據在調查過程中的干擾,因而使得調查的數據較符合客觀實際。它具有事先計算及控制抽樣平均誤差和便于對樣本指標進行檢查,避免調查工作中間環節的弄虛作假的特點。大大提高了統計數據的準確性和及時性。
2.強化統計基礎工作是提高統計數據質量的保證。首先要搞好統計調查表的設計。企業綜合統計部門應根據上級部門和本企業生產經營管理的需要,會同會計等部門統一設計企業內部套表,在設計中應體現新的國民經濟核算體系,各指標之間應相互聯系,相互配套,統計指標的涵義、范圍、計算口徑應一致。統計表的設計,統計分類標準和各種編碼應當統一,以適應計算機整理、匯總、分析的需要。新的統計報表的采用,可以克服企業統計工作中存在的雜亂、重復、矛盾等弊端,也有利于報表的規范化、系統化,更有利于統計數據的準確性。其次,實現原始記錄、統計臺賬的標準化。我們知道,原始記錄是業務核算、會計核算、統計核算的共同基礎,只有這樣才能使三種核算結果相互銜接,口徑一致,而要保證核算數字的準確性,要求核算的數字來源,都有真實的原始記錄為依據。從原始記錄開始一直到整理、場內報表及三種核算,數字來源通過逐級加工,都是有據可查的。只有這樣核算,數字的準確性才有確切的保證。
3.加強統計法制法規建設是提高統計數據質量的法律保障。在企業統計工作中,主觀隨意性是影響統計數據質量的重要因素。領導者的法制觀念和對統計數據質量的重視程度以及統計人員的綜合素質,對統計數據質量有著直接的影響。只有具有強烈的事業心和責任感,具有高度的統計法制觀念,具有基本的工藝技術知識和統計技能的統計人員,才具有做好統計工作的前提和基礎。因此,要加強統計法制建設,健全統計法規,防止某些企業領導和統計人員對統計數據弄虛作假,要確定統計犯罪的界限,作出良性的具體規定,以強化統計法規的法律效力和約束力。應通過典型案件的查處和暴光宣傳《統計法》,引起全社會的關注,提高社會公眾的法制觀念和執法自覺性,使《統計法》真正成為提高統計數據質量的法律保障。
4.提高統計人員的業務素質是提高統計數據質量的關鍵所在。統計數據質量與統計人員的業務素質和隊伍穩定有直接的關系,企業統計人員是提高統計信息最基礎、最原始數據的源泉,因此,為了提高統計人員的業務素質,必須搞好他們的上崗和在崗培訓,要實行“統計員資格”考試制度,達到合格標準并取得上崗合格證方可上崗。要提高統計人員的統計分析能力,掌握多種使用統計分析方法,例如聚類分析法、判別分析法、回歸分析法、相關分析法、主成分分析法等。其次還要提高統計人員對現代統計分析軟件的應用能力做到“一專多能”。依靠科技手段快速提供高質量的統計數據。企業還應按規模大小、統計業務的難易程度,配備有一定統計職稱的綜合統計人員,以提高統計工作質量,保證統計數據的準確性。
5.用科學的統計分析方法對數據質量評估是提高統計數據質量的方法保證。首先,可運用抽樣調查法推斷總量指標的準確性,它是對全面報表、普查、重點調查的基層統計數據或匯總統計數據進行可靠性檢驗或誤差判斷的科學方法。其次,運用回歸分析法檢測統計數據的可信度。例如,在對匯總數據的評價中,可利用回歸分析,發現矛盾,提高數據的可靠性,并可用計算機建立模型,對各類數據縱橫比較,以確定其質量。另外,還可用主次因素排列分析圖、因果分析圖來分析各種統計數據質量。在多種經濟成分的統計數據中,要尋求一種能夠多因素同時考慮的方法,不能只局限與一些單一因素的評估方法。例如運用模糊評價法等。要加快成立相對獨立的專門從事統計數據質量評估的社會終結組織結構,確保統計數據評估的獨立性和公正性。
6.加大新的統計技術的應用是提高統計數據質量的必要途徑。計算機技術不僅可以實現數據處理高速化、數據傳輸網絡化、數據貯存資源化,從而降低統計數據在人工處理、傳輸、貯存等環節上的技術性誤差和邏輯性差錯,而且有利于從機制上形成強有力的統計質量管理體系,維護統計數據管理相對獨立性并有效地遏止隨意虛報、瞞報以及統計數據質量的其他腐敗行為。
總之,提高統計數據質量是統計工作的永恒主題,要在明確什么是統計數據質量的基礎上,抓住影響統計數據質量的關鍵,采取切實有效措施,最大限度地保證提高數據的質量,確保統計三大職能的發揮。
五、結語
統計信息是社會經濟信息的主要組成部分,在社會經濟生活中發揮著越來越重要的作用。作為其表現形式的統計數據的質量也受到越來越多人的關注。而目前我國的統計數據質量管理,不論是與社會各界的需求相比,還是與相關國際準則的運作要求相比,均存在一定差距。完善我國統計制度是一項長遠的任務,這需要統計人員與社會各界的共同努力。
[摘要]統計工作的精準對我國國民經濟發展的影響至關重要。準確、全面、及時、系統的統計數據,是各級黨委政府在進行科學決策和管理,制定宏觀調控措施,做出科學、合理、正確決策的必要依據。要確保統計信息的質量,必需重視基層,夯實基層,才能使整個國民經濟保持協調、穩定、快速、健康發展。但是在實際的統計工作中卻存在著這樣那樣的問題,文中分析了我國統計工作存在的不足及其原因,并針對這些缺陷提出了相應的對策。
[關鍵詞]統計工作、數據誤差原因、策略
一、目前我國統計工作現存的不足之處
領導的重視程度不夠,或者說,一些領導干部在如何正確看待統計工作的問題上存在有一定的誤區,從而出現了“拍腦袋、湊數字、瞎估計”的現象,統計工作,由于統計方法、手段等的不合理、不完善,造成了統計性誤差的存在統計數據的真偽,由于缺乏有效的監管措施,在一定程度上,存在著人為地虛報或瞞報的成份。
二、存在于統計工作中的“數據誤差”產生的主要原因
第一,行政部門領導干部的干預,領導干預對統計信息的準確性的影響非常大,多年以來,由于受到領導干部業績考核指標的影響,許多基層干部出于無奈,不得不故意虛報統計數據,來為自己的“政績”增光添彩。同時,其主管部門對此也處于無奈的窘境。第二,統計數據采集不準確。數據采集是統計數據的源頭,力求統計信息準確就必須保證所采集的數據是真實的。現在的現狀是:(1)報表人責任心不強,報表隨意性大。(2)報表人員素質不高,對報表不理解。(3)很多的企業不重視統計,有的則是會計人員兼職。(4)某些地區、部門、行業,出于對自身利益的考慮,故意瞞報統計數據,以達到少繳、甚至不繳國家規定必須繳的一些規費、稅金,從而導致了國家的相關規費、稅費的大量流失。而這些地區、部門、行業,卻因此而得到了大量的不當收益。第三,雖然我國的統計工作已經與國際接軌,但由于我國正在建設有中國特色的社會主義市場經濟,現階段仍處于發展中國家的階段。統計工作中的統計方法、手段,還需要進一步的規范和完善。因此在數據采用及事理分析中,就容易產生錯誤,造成統計數據質量下降,影響統計工作。
三、針對我國目前統計工作中存在的“數據誤差”應對的策略
1.加大對統計工作的宣傳力度。力爭使每一位統計參與者,特別是黨政領導干部都要了解統計工作對我國國民經濟建設起的巨大作用,努力提高他們對統計工作的正確認識,得到他們對統計工作的支持。開展統計法制教育,以法治統。通過多種多樣的形式進行普及《統計法》的教育,從思想上提高他們對提高統計數據質量的認識,促使他們在實際工作中堅持原則,敢于同影響統計數字真實性的違法行為作斗爭,真正做到以法治統。其次,還可對統計人員進行《統計法》的理論考試,讓法深入人心,以便他們理直氣壯地按法辦事。再次,對大中專學校經濟類專業應加設一門《統計法》基本知識課,以便學生將來走上統計工作崗位后能夠依法辦事,知法工作,把保證統計數據質量放在首要地位,為黨政領導及企業管理和決策提供可靠的依據。
2.對目前干部考核中一些片面強調GDP增長的業績考核制度進行改革。長期以來,統計工作中存在著“以數字論英雄”的局面,從而出現了“官出數字、數字出官”的怪現象。淡化統計數字的政績觀,建立科學的干部考核制度。這是走出“官出數字、數字出官”怪圈,讓統計數據不受個人意志左右的治本之策。首先應當在調查研究的基礎上,制定切實可行的考核目標,防止因考核目標不切實際而引發的虛報浮夸的歪風蔓延。其次,應完善干部實績考核統計制度,將定量考核與定性考核有機結合起來,改進目標考核實績的統計方法,確保目標考核實績數據的準確性最后,應建立干部政績公議制度,擴大干部政績考核的民主。實施領導干部政績公議制度可改變過去那種干部只“對上負責、不對下負責”的弊端,提高干部工作的公開化、民主化程度,不斷增強干部政績考核準確性。增強他們工作的責任感和為民服務意識。
3.完善統計工作中的統計考核指標體系,以及與此相適應的統計方法,從而在源頭上來遏制問題產生的基本動因。必須對我國統計工作現狀進行深入的分析,總結出統計工作中的行之有效的方法。在現實工作中,政府已經相應成立了國家統計局直屬調查隊,其隸屬關系不在當地,因而可以免受許多人為因素的干擾,為我國宏觀經濟決策提供重要的參考依據。
4.努力提高我們統計從業工作者的自身素質。統計工作者自身素質的提高,是做好統計工作的首要的、基本的條件。試想,如果一個統計工作者對統計工作不太了解,統計手段落后,基層統計隊伍不穩定,我國統計工作的質量的提高又從何談起?
5.綜合使用行政手段、法律手段和經濟手段,提高統計違法成本。可以從以下三方面著手:一是對違法的統計工作人員除依法處理外,一律清除出統計隊伍。二是對參與違法的領導,一經查實,必須依照有關法規從重從快處罰,決不手軟,達到以儆效尤的目的。三是將處罰費用與統計違法行為責任人掛鉤,從經濟上處罰責任人。這樣,就可以把行政手段、法律手段和經濟手段有機結合起來進行綜合處罰,讓違法者得不償失。
四、結論
統計工作必須還要強調“以人為本”,以人的全面發展來帶動統計工作的正確發展并通過統計工作的正確發展,反過來推進人的全面發展。此外,充分運用現有的科技成果,使政府各職能部門數據共享,使得虛報、瞞報者無處藏身。與此同時,還可以利用網絡資源,在查出虛報、瞞報的同時,去引起、帶動職能部門對其進行專項調查,從而使統計工作能真正地服務于國家建設,同時服務于黨風廉政建設,服務于人民的需要。但這是一個漫長的過程,需要一步一步地去努力。我相信統計工作在國家宏觀調控和微觀管理下,在廣大統計工作者的努力下,其可靠性、真實性和權威性會逐步提高,統計數據失真的現象會得到有效的控制。統計工作會隨著大家的共同努力會不斷提高。
摘要:企業一套表的率先實施是經濟發展新常態下國家統計局為做好統計數據工作而進行的制度改革與創新,很好的詮釋了現代化統計的優越性和時效性。從新常態下的數據采集過程來看,其實踐意義也是相當明顯的,但新常態提出了諸多新要求,特別是三新統計,是時展的需要,應對新常態下復雜多變的經濟環境,深化統計改革的新舉措。現就現行體制下的統計數據采集在新常態下源頭數據采集過程中所面臨的一系列問題進行探討,并提出相應的對策及建議。
關鍵詞:新常態;統計數據采集;企業一套表
隨著社會的發展,科學技術的突飛猛進,大數據、云計算、物聯網的新時代隨之到來,我國經濟發展進入了新常態,傳統的統計數據采集過程以紙介質填報,級級匯報,層層匯總模式,已不能適應新形勢下統計發展需求,利用互聯網改進統計數據采集過程已經成為現代統計發展的必然趨勢。“互聯網+統計”的數據采集模式實現了統計數據“質”與“量”的飛速跨越。
一、新常態下統計數據采集現狀及實踐意義
2008年以來,“企業一套表”改革從部分省市試點到全面實施,取得了重要的突破性成果。隨著一套表的不斷深入實施,現在大部分行業數據統計采集過程都已納入了聯網直報,是統計數據采集工作步入現代化統計的一個重要標志。現行統計制度下的數據采集主要有聯網直報、PDA數據采集、電子報表、記賬戶記賬、現場采價、實割實測、電話訪問等方式,根據不同要求,采取合理的采集方式采集原始數據。其中:聯網直報和PDA數據采集分別利用IP地址和GPS定位功能對統計源頭數據采集進行實時監控,防止源頭數據失真。近年來,統計工作一直緊跟科技發展的腳步不斷改革和創新,現代化統計數據采集的實踐意義已相當明顯:第一減少報表環節,可以準確、及時、全面地提供統計信息,提高統計數據質量的真實可靠性和社會公信力。互聯網下的統計數據采集過程,使統計生產過程完全透明、可控,更好地接受各級政府統計機構、填報單位以及人民群眾的監督和檢查。尤其是新經濟下的個體戶數據的直接采集,實割實測GPS定位專用工具的地畝數測量,將統計誤差盡可能地縮小到最小,既提高了統計數據質量,又確保了統計數據的時效性。從根本上提高了統計數據質量的真實可靠性和社會公信力。
第二避免重復交叉統計,減輕統計員的報表負擔。實施統計聯網直報和PDA數據采集,統一布置,統一上報,有效避免統計任務重復填報,大大減輕企業統計人員報表負擔,保證數據的準確性,有利于對經濟社會形勢準確把脈。第三數據資源高度共享,采集的數據更易長久保存及查詢。一方面統計聯網直報和PDA數據采集都實現了統計系統內部資源共享,提高了統計數據查詢、檢索、評價環節的透明度。另一方面通過統計聯網直報平臺、PDA數據采集、企業一套表采集上來的歷史數據保存完整,不易丟失,有利于內部系統對歷史數據的查詢和對比工作。第四及時、充分、準確地反映創新驅動戰略的落實情況,體現區域經濟轉型升級,大眾創業、萬眾創新發展成效。新常態下提出的“三新”統計(即新產業、新業態和新商業模式)成為經濟發展新的經濟增長點,是推進現代統計體系建設的新創舉,也是新常態下統計部門的歷史擔當。它通過互聯網大數據、云計算、物聯網,對其發展進行全面、真實、準確、及時的監測,客觀解讀和描述經濟運行的新特征、新變化、新規律。
二、新常態下統計數據采集過程面臨的一系列問題
(一)“三新”統計數據采集尚不能適應
現行的數據采集方式第一現行的《國民經濟行業分類》無法完全匹配“三新”發展,給“三新”數據采集帶來較大困難。三新”企業具有跨界的特點,經營模式多元化,業務邊界區分較模糊,很難進行統計上的產業劃分和行業界定。第二現行統計制度下“三新”統計數據的采集難以做到不重不漏。隨著時展不斷轉型升級,很多企業既存在實體店售賣,也通過各種網絡平臺進行網售,統計數據采集時很容易出現重復統計;餐飲平臺上的大量私廚、租車平臺上的大量私家車并未納入常規統計,會導致漏統。另外,百度外賣涉及的平臺、第三方、或證照存疑、或無門面、或多家一地等復雜情況的處理,都是“三新”統計中的難點之所在,與當年在地統計的經營地、注冊地原則不同,無論這個原則如何劃定,都會造成統計數據或重或漏采集。第三“三新”統計部分指標匹配不銜接,不適應基層統計數據采集,影響數據采集質量。“三新”統計制度下的居民人均可支配收入,就存在指標不匹配現象,從2012年城鄉住戶一體化以來,基層統計部門不管是居民人均可支配收入還是居民人均消費支出的數據采集都仍處于城鎮與農村分別采集的過程,并沒有一個統一的城鄉居民可支配收入及消費指標,數據采集上就出現了采集困難的問題。
(二)正常報表期間服務器設備運行不穩定
現行的統計聯網直報數據采集,主要流程為專業報表選擇定期開網,在開網期間基層統計人員在基層登錄聯網直報平臺進行數據的填報工作,PDA數據采集模式與聯網直報基本相同,所以說在報表期間由于數據采集平臺登錄人群量較大,勢必要有強有力的服務器運行設備支撐。然而我們現有的服務器設備并不給力,聯網直報平臺穩定性不高,報表期間極易出現平臺登不上、重置瀏覽器、證書過期及匯總較慢等一系列問題,甚至在報表高峰期服務器還會出現系統崩潰現象,導致不能正常報表,甚至存在錄入數據丟失現象,必然引起基層統計員對統計聯網直報平臺的不認可,對統計上報工作的不重視,難以保障統計數據的時效性和真實性。
(三)PDA后期數據處理工作有待加強
近年來,經濟普查、人口普查、農業普查及其他統計調查工作都采用了PDA數據直接采集模式,然而,PDA作為一個現代化的數據采集工具,對已采集數據的備份措施尚不完善,統計員在數據采集過程中,PDA設備發生硬件故障、軟件系統故障或丟失等問題引起的數據丟失現象時常發生,導致普查員的二次錄入,如果調查工作時間緊、任務重,會出現在一些指標有遺漏或有差錯的情況下強制保存數據上報的現象,影響調查數據質量。另外,PDA數據上傳需要網絡支持,采集數據易被通過網絡等手段竊取,數據安全性得不到保障。
(四)現有統計人員低配備與現代化統計的高素質要求不匹配
從統計員配備現狀看,基層統計人員由于政治和經濟待遇較低,更換頻繁,部分企業統計人員身兼數職,對統計工作不夠重視,統計法律意識淡薄,不認真執行統計制度,填報的報表隨意性大,不規范,基層數據得不到有效的保障,嚴重影響了基層統計數據質量和統計工作的穩步推進。
三、對策及建議
(一)完善“三新”統計制度方法,適應新常態下統計數據的采集
一是加強統計基礎制度建設、構建科學合理的統計指標體系。加強與相關部門、企業、行業協會的溝通協作,捕捉新的統計信息咨詢,在保持原有的統計指標體系架構的基礎上,適當增加統計指標,構建靈活多變的統計指標體系,以適應當前社會經濟發展需要,確保統計數據“來有蹤,去有影”。二是采集數據時要依托互聯網進行全程監測,時時掌握瞬息萬變的經濟運行環境。“三新”經濟的跨界、共生、滲透、融和等典型特征,要求出廠產品要具備“二維碼”識別標志,依托互聯網做好產品的生產、流通、消費的全過程跟蹤,確保產品進入流通環節體現產品流向,進入終端消費領域體現產品最終使用去向,做到產品有來源,有去處。三是精心組織、狠抓落實、確保實效,全面準確及時地反映“三新”發展狀況,以促進建立現代、科學的統計體系架構。
(二)加大服務器定期維護投資力度,保證報表期間服務器的正常運行
保證統計數據采集系統的網絡穩定性是做好統計報表的前提條件,我們必須繼續加大對統計數據采集系統服務器的投資力度,并在非報表期間對服務器進行定期維護,給予統計數據采集系統的上報工作有力的后勤保障,努力做到報表期間系統正常穩定運行,讓每一個報表人都能夠及時、準確、高質量的完成統計數據報送工作。
(三)強化組織領導,夯實統計隊伍建設
統計基礎工作是整個統計工作的基石,要提高統計數據質量就必須加強基層統計組織的建設。第一定期組織針對性較強的業務培訓,對統計人員知識進行更新,扎實有效地推進統計工作的質量與效率。第二基層報表單位設置專門的統計人員。避免統計員因為兼職所引起的填報統計報表時間緊張,負擔過重而應付報表的現象發生。第三基層單位要建立完善的統計工作交接制度。嚴格遵循“先補后調”的原則,確保統計工作銜接的好、交接的上、統計資料不丟失,從而保障統計工作的連續性不受影響。
(四)建設統計數據安全防護體系,保障數據的安全可靠
網絡安全是統計數據質量的生命線,做好統計數據的安全防護工作,是我們的首要任務。一通過優化防火墻和網關性能,完善政務環境、局域邊界,數據信息三個安全防護機制,確保統計信息的安全上報;二嚴格遵守信息安全等級保護和風險評估制度,對機房開啟24小時故障報警檢測,定期開展應急預案措施,提高外界攻擊應對能力;三做好數據安全教育工作,杜絕木馬侵入,數據丟失和泄露等情況的發生,真正從思想源頭上加強預防和管控。
(五)實現統計數據資源完全共享,便于已有數據的應用查詢
經濟發展新常態下,現代化的統計數據采集方式實現了統計資源的共享,既保障了數據的時效性和真實性,又提高了數據的保存時效,然而,在系統內部應用上并沒有完全與現代科技同步,統計成果尚未實現資源完全共享。譬如:年鑒資料還處于文本成冊階段,在部門統計數據運用上還處于比較落后的傳統查詢階段——紙介質人工查詢。開發內部應用統計數據查詢平臺,建立電子年鑒數據庫,專業定期報表數據庫內部查詢系統,最終實現互聯網+統計的整體模式,讓統計成果得到充分有效的利用,簡便、快捷地服務于社會各界。堅持做到只要有網絡,我們就可以通過內部鏈接隨時隨地查詢到分省市、分行業、分年限的每一項統計數據,甚至可以一目了然的看到數據近幾年的發展現狀,及時準確的為領導提供有效數據,為下一步決策做好參謀。
作者:吉立爽
摘要:
從傳統統計數據與大數據之間的演變歷史、數據特征等方面展開討論,厘清兩者之間存在的千絲萬縷但又千差萬別的聯系,提出傳統統計數據是大數據的簡單形式和初期階段,大數據是傳統統計數據的復雜演化形態的論斷,指出兩者在數據分析思維方式上存在巨大差異,并對數據質量管理內涵、全周期數據質量保證等問題提出不同的解決思路和方案。
關鍵詞:
傳統統計數據;大數據;數據分析;數據質量
0引言
傳統統計數據的內涵在于揭示數字背后信息與現實世界的關系。大數據是指巨量數據,是無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合。從傳統統計數據到大數據的持續演變導致在理論層面大數據內涵復雜,并與傳統統計數據在信息界限上概念模糊。從傳統統計數據到大數據不僅是量的積累,更是質的飛躍。厘清傳統統計數據與大數據之間的內涵辯證關系,是有效利用數據的基礎和關鍵。
1傳統統計數據向大數據演變的動力
信息技術的進步為傳統統計數據向大數據演變提供了物質和技術基礎。隨著互聯網的日益發展,每一次網絡存儲技術的進步都使信息的生產、存儲、傳輸成本大幅度降低,而流通的范圍、深度、速度則顯著提升。JimGray的新摩爾定理認為,每18個月全球新增信息量是計算機有史以來全部信息量的總和,新摩爾定律以信息量的維度確定了數據化演變信息的節奏。這種趨勢導致的基本形態就是數據信息空前豐富,大數據成為了研究和利用熱點。信息需求多樣化與個性化是傳統統計數據向大數據演變的基本動力。數據最終是為信息需求服務的,用戶信息價值最大化才是數據應用的關鍵所在。在數據化趨勢下,隨著人們認知實踐與需求狀態的變化,數據一方面從滿足基本特定信息需求到利用復雜的數據屬性解析出多樣化信息需求轉變,另一方面從被動滿足簡單需求到主動發掘復雜有效需求,并探知用戶個性化信息需求轉變。這兩方面成為傳統統計數據項大數據內涵演變的基本動力。相應地,數據內涵也從樸素的信息真實業務邏輯向滿足復雜需求的數據化邏輯遷移。隨著信息技術的發展和用戶需求的變化,信息效率價值的實時化及數據泛濫造成數據噪聲增強和有效信息稀缺現象,大數據應運而生。傳統統計數據是大數據的簡單形式和初期階段,大數據是傳統統計數據的復雜演化形態。
2傳統統計數據與大數據的數據特征差異
數據量增多是人們區別傳統統計數據與大數據的第一個認識。傳統統計數據數據量小,以MB、GB、TB等為存儲單位。大數據數據量大,一般以PB、EB、ZB等為存儲單位。但這兩者之間特征區別并不僅僅是體量,還包括數據類型、研究對象的范圍、信息視角等方面。
2.1傳統統計數據與大數據的數據類型對比
傳統統計數據是一種結構化的標準數據。其數據類型單一,主要以結構化、體量小、標準化、價值密度高及周期化數值為特征,數據產生和變化的速度慢。其數據特點是樸素真實、簡單有限、準確性高及被動有用性。大數據統計范疇擴大、數據類型復雜,其中包括:a)非結構化非標準數據,如動態實時時序數據。b)半結構化數據和非結構化數據,如文本、圖像、視頻等。c)現有的結構化數據,如傳統統計數據。其數據模型具有復雜多維的特征,統計結果多是非精確多種相關性趨勢數據。大數據具有4個V基本特征,即Volume(體量浩大)、Variety(模態繁多)、Velocity(生成快速)和Value(價值巨大但密度很低),且具有來源多樣、實時、多元的信息化特點。這些特點導致數據在產生、獲取、存儲、傳輸和計算過程中,因體量大、快速多變易產生沖突和不一致,人工很難檢測和修復。
2.2傳統統計數據與大數據的研究對象范圍不同
傳統統計數據的研究對象是宏觀視角下有限的隨機樣本數據。隨著信息化的發展,實踐中產生大量冗余沉淀數據,這一時期經過清洗的全樣本數據是數據挖掘的研究對象。而大數據面對的則是原生態全樣本數據,也就是所謂的總體數據。從隨機樣本數據到經過清洗的全樣本數據再到原生態總體數據,數據內涵總體信息視角從宏觀向中觀和微觀擴散。研究對象范圍向寬度和深度兩個方向不斷擴展,不斷深入系統微觀的多維度個體感知,信息能力和價值也不斷提升。這種轉變來自技術和需求的驅動,新型數據處理技術及需求獲取能力成為演變的關鍵因素。
3大數據相對傳統統計數據分析方式的變革
數據中蘊含的寶貴價值成為人們存儲和處理數據的驅動力,數據分析是實現數據價值的必要途徑。由于傳統統計數據與大數據在體量、結構、內涵等方面有著本質的區別,所遵循的數據分析理論基礎、分析思路、相關技術也不同。
3.1傳統統計數據與大數據數據分析的理論基礎
對傳統統計數據進行數據分析的理論基礎是分布理論,以概率為保證,即根據樣本去推斷總體特征,其邏輯關系是“分布理論—概率保證—總體推斷”,分析過程是“假設—驗證”基礎上的“定性—定量—再定性”。對大數據進行數據分析是以全體數據為基礎,以數據信息相關為保證,其邏輯關系是“實際分布—總體特征—概率判斷”,可以不受任何假設的限制去尋找關系、發現規律,分析過程是“定量—定性”及“發現—總結”重要數量特征和關系基礎上的定量回應。
3.2傳統統計數據與大數據數據的分析思路
傳統統計數據價值的實現路徑為“數據到信息再到知識和智慧”。傳統統計數據分析著力于經典嚴密封閉系統的精確性和因果關系的探索,找到事物屬性之間的因果關系,比較容易實現。對于開放復雜的巨系統,傳統的因果分析難以奏效,因為系統中各個組成部分之間相互有影響,可能互為因果,因果關系隱藏在整個系統中。因果關系本質上是一種相互糾纏的相關性。大數據數據分析無法檢驗邏輯上的因果關系,不能致力于尋找真正的原因。Mayer-Sch觟nberger在《大數據時代》一書中指出了大數據時代處理數據理念的三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。因此,大數據分析邏輯體現為走“數據直接到價值”的捷徑。大數據數據分析關注事物相關性認知分析,所謂相關性是指兩個或兩個以上變量的取值之間存在某種規律性,即對數量巨大的數據進行統計性的搜索、比較、聚類、分類等分析歸納。相關分析的目的是找出數據集里隱藏的相互關系網(關聯網),一般用支持度、可信度、興趣度等參數反映相關性。
3.3傳統統計數據與大數據的數據分析處理技術
進行數據分析需要相應的數據分析處理技術以及技術人員的全力參與。數據分析領域面臨的主要矛盾是快速增長的數據信息需求與有限統計資源和滯后數據處理能力的矛盾。信息技術應用成本的低廉化和性能效率的聚變成為數據需求和質量要求快速增長的基本動力。傳統統計數據的分析和處理遵循一般的關系數據庫的數據分析和處理技術,技術人員經過一定的訓練即可勝任。對大數據進行分析和處理需考慮以下技術因素:a)數據清洗。大數據價值密度低、冗余數據增多、垃圾數據泛濫,大數據清洗需要專業和細致。數據不能清洗過細,否則會增加數據清洗復雜度,甚至有可能過濾掉有用信息。數據也不能清洗過粗,要保證數據篩選的效果。b)以MapReduce(一種編程模型)和Hadoop(Apache基金會所開發的分布式系統基礎架構)為代表的非關系型數據庫的非關系型數據分析技術,因其具有良好的橫向擴展性,在大數據分析處理中得到廣泛應用。c)要深入分析數據,數據分析人員既要熟悉數據分析技術和工具,又要具備相關領域的專業知識。
4傳統統計數據與大數據的數據質量內涵
高質量數據是進行數據分析的前提和基礎,是數據發揮效能的保證。傳統統計數據數據質量以有限信息邏輯的因果性、確定性、清晰且高度的結構化為主要特征,主要關注數據自身本源的質量問題,例如準確性、完整性和客觀性。質量標準至少應該包括指標解釋(含義、范圍、口徑)、數據特征、調查方法、統計誤差、獲取時間、頻率及渠道等方面的內容。大數據以既定邊界內總體數據系統相關性的隨機、自身的不確定性以及總體的非結構化為特征。由于數據質量問題在大數據環境下會被不斷放大,因此,大數據主要關注數據可信與溯源等非數據本源性質量問題,即數據資源產生后在傳輸、存儲和應用過程中產生的突顯問題。下面重點從流程和管理兩方面分析傳統統計數據和大數據所面臨的數據質量的挑戰及應對措施。
4.1從流程視角看數據質量保證
從流程的角度(即從數據生命周期角度)來看,可以將數據生產過程分為數據采集、數據存儲和數據使用三個階段,三個階段對傳統統計數據和大數據的質量保證提出了不同的要求。
1)數據采集過程中數據質量保證問題
數據采集階段是整個數據生命周期的開始,這個階段的數據質量對后續階段的數據質量有著直接的、決定性的影響。傳統統計數據數據量小,通過編寫簡單的匹配程序,甚至是人工查找即可實現多數據源中不一致數據的檢測和定位。大數據由于數據來源復雜,數據之間存在著沖突、不一致或相互矛盾的現象。因此,需要在數據獲取階段保證數據定義的一致性及元數據定義的統一性,以保證數據質量。
2)數據存儲過程中數據質量保證問題
數據存儲是實現高水平數據質量的基本保障,如果數據不能被一致、完整、有效的存儲,數據質量將無從談起。傳統統計數據以結構化數據為主,主要采用傳統的結構化數據存儲架構(如關系型數據庫)進行數據的存儲。大數據數據結構多樣、數量龐大、數據結構復雜、變化速度快,需要使用專門的數據庫技術和專用的數據存儲設備進行大數據存儲,以保證數據存儲的有效性,方便對數據進行快速讀取。數據庫一般采用分布式文件系統和分布式并行數據庫(如HDFS〔分布式文件系統〕、BigTable〔Google設計的分布式數據存儲系統〕等),在數據存儲過程中,數據格式的轉換非常關鍵和復雜,要根據大數據結構的要求和特點合理設計數據存儲和使用規則。
3)數據使用過程中數據質量保證問題
數據價值的發揮在于對數據的有效分析和應用。傳統統計數據的使用需要遵從關系型數據的完整性約束和數據一致性保證技術要求。由于大數據使用人員眾多,數據規模龐大、變化速度快,對數據的處理速度要求較高,很多時候需要同步、不斷地對數據進行提取、分析、更新和使用,因此需要保證數據使用的一致性。
4.2從管理視角看數據質量保證
傳統統計數據一般由業務部門負責掌管數據,IT部門負責信息技術的應用,這種分離式的運營管理方式容易造成業務人員不了解分析不同數據所需的不同IT工具,而IT人員在運用IT技術分析數據時不了解數據本身的內涵,甚至會做出錯誤的數據解釋,影響了企業決策的準確性和有效性。為了更好地利用大數據,保證大數據的質量,企業高層管理者應給與重視和支持,需在高層配備專業數據管理人員。在大數據生產過程的任何一個環節,企業都應該配備相應的專業數據管理人員,如由專門人員負責記錄定義并記錄元數據,收集原始數據,建模、提取并利用隱藏在大數據中的信息。
5結束語
傳統統計數據和大數據是數據科學發展過程中由于技術的發展和客戶需求的多樣化、個性化而必然出現的數據階段。由于兩者之間關系不清,界限模糊,采集、分析、處理等技術多樣,難度大,因此,從業者難免存在模糊認識和畏難情緒。本文從兩者的演變歷史、數據特征、數據分析和質量管理等方面對兩者的異同進行辨析,指出傳統統計數據是大數據的簡單形式和初期階段,大數據是傳統統計數據的復雜演化形態,大數據從廣義上來講包含了傳統統計數據。試圖通過對兩者的辨析為從業者提供一個辯證和清晰的思路。數據的分析應用無止境,任重而道遠。
作者:李敬華 賈蓓 李倩茹 單位:西安通信學院
1概述
工業經濟增長率一直是宏觀經濟和產業經濟研究的重點內容(Barro,1993;Krugman,1994)。在以全要素生產率(TFP)為重要測度指標的工業及分行業增長率研究中,實證研究已經成為主流的方法(DiegoComin,2006)。但是,在實證研究中,數據起始時間的確定并未引起足夠重視。在已有的研究中,不同的學者根據自己的研究需要,采用不同的基年。如黃勇峰等(2002)和張軍(2003)把1978年作為基年,鄭玉歆和羅斯基(1993)把1979年作為基年,陳勇、李小平(2006)把1980年作為基年,劉建國、李國平、張軍濤、孫鐵山(2012)把1990年作為基年,張軍等(2004)、吳延兵(2008)把1993年作為資本存量折算的基年,薛鋼、陳思霞、蔡璐(2015)把2005年作為基年。在對工業基礎數據進行全要素生產率分析時,對基礎數據的來源及處理也缺乏足夠的認識。劉建國、李國平、張軍濤、孫鐵山(2012)運用Malmquist指數模型測度了1990-2009年中國省域的經濟效率和全要素生產率,并對其影響因素進行了分析;梅國平、甘敬義、朱清貞(2014)測度了我國29個省級地區2001~2011年全要素生產率的變動及其區域非均衡性;薛鋼、陳思霞、蔡璐(2015)基于2005~2012年的省級面板數據,利用DEA-Malmquist非參數分析方法,研究了城鎮化對全要素生產率的增長效應以及公共支出政策的作用機制。但是,以上學者在基礎數據處理中或許是忽視,或許是由于篇幅的原因,并未對工業統計數據的來源、統計口徑調整等數據處理問題做出詳細說明。
綜合來講,目前從工業經濟統計數據的選擇和使用來看,存在的主要問題是:①工業經濟實證研究數據時間起點選擇的一定程度的隨意性。②忽視了工業經濟統計數據標準和口徑調整變化對數據的影響和相關處理。文章創新性貢獻工作主要體現在如下三個方面:第一,對中國工業數據的來源數據庫按照時間發展階段,進行了科學、合理的劃分,并給出了理論依據。第二,提供了工業基礎數據實證研究時間起點確定的方法及其理論依據。第三,系統地對工業數據及來源數據庫進行了分析。全文結構安排如下:第二部分主要分析我國工業經濟統計數據庫,第三部分,對不同的工業經濟統計數據來源,借鑒企業生命周期理論,首次提出了我國工業經濟統計數據庫的三階段劃分,并給出了理論依據。第四部分從全要素增長率的維度,按照實證建模的視角,分析了工業經濟增長中最核心的產出和投入要素。第五部分是研究結論與建議。
2中國工業企業的主要統計經濟數據庫的來源
目前,對于工業經濟增長的理論和實證研究中,主要采用國家統計局數據庫、研究機構和公司數據庫。本質上,國家統計局和國家部辦委及研究機構和公司數據庫,在工業經濟原始數據上是完全一致的。綜合統計數據庫和專題統計數據庫。綜合統計數據庫主要有:中國統計局工業統計數據庫;“中經網”“、國研網”工業經濟統計數據庫;其他綜合統計數據庫。專題數據庫是同綜合數據主要有:人口調研數據庫;其他專題統計數據庫。
3工業經濟統計數據庫的分類及理論依據
根據我國工業數據庫與我國宏觀實體經濟發展的匹配狀況、數據庫的穩定程度、數據庫的完整狀況和與現代國際數據的接軌程度,借鑒企業生命周期理論,把我國改革開放(1978年)以后中國工業數據庫分數據庫的初創期、成長期和成熟期三個發展階段。
3.1第一個階段:社會主義市場經濟工業統計數據庫的初創期(1980~1997年)中國社會主義市場經濟建立的過程。1978年十一屆中全會的召開,拉開了以經濟建設為中心的序幕(吳敬璉,2015)。因此,具有實質市場意義的數據測度才有可能建立。中國工業城市改革一直到1984年才開始1(陳康、謝千里、辛格,1992)。1992年以前,我國采用的蘇聯及東歐等社會主義國家采用的物質平衡核算體系(MPS),1993年新的國民經濟體系核算建立,建立了國民經濟核算體系(SNA),GDP就成為新體系中的核心指標。總體而言,1993年以后的數據比較完整(陳詩一,2008)。
3.2第二個階段:工業經濟統計數據庫的成長期(1998~2010年)1997年以前,我國是按照行政隸屬關系來統計各類報表。在1998年以后,工業經濟的統計指標轉變為按照工業經濟的體制屬性和經濟規模為統計標準。2008年全部工業統計指標主要是按照規模以上工業企業和規模以下工業企業。規模以上工業企業科技活動統計指標。許多學者在實證分析時,把1998年作為起始時間2(孟連、王小魯,2000;張軍、陳詩一、GaryH.Jefferson,2009)
3.3第三個階段:工業經濟統計數據庫的成熟期(2011年~目前)在這個階段,有一個重要的調整時間是2011年以后的工業企業數據,規模以上工業企業的統計門檻從每年工業總產值500萬元,提高到每年工業總產值的2000萬元。從我國工業經濟發展歷程看,除了上面的時間分類,還有幾個關鍵時間是可以作為劃分時間點的,分別是1984年的工業歸類變化和1994年財稅改革。但是由于1980~1984年時間太短,不適合依次劃斷。1994年的財稅改革同1998年的統計標準變化來講,后者更具有普遍意義。因此,采用上面的工業數據庫的發展階段分類。在工業企業統計數據庫的階段劃分主要依據如下原則:工業經濟統計數據與宏觀經濟發展階段相匹配的原則;數據庫各項統計指標調整的頻率和相對穩定程度;數據庫的完整程度;與現代數據庫接軌的程度。
4工業產出投入變量數據選擇、構建現狀
在對工業經濟增長率的實證研究中,需要關注產出變量和投入變量。具體一點講,就是一個增長率模型中的解釋變量和被解釋變量。在模型的左端,工業產出的變量選擇爭議不大,在模型的右側,被解釋變量的選擇,則非常廣泛。其中最核心的無疑是資本和勞動這兩大基本變量,因為它揭示了經濟增長的基本動力。
4.1產出變量在產出變量中,經常作為實證模型的被解釋變量的有:工業總產值、工業增加值、工業凈產值。我國統計部門自1986年以后,就了工業行業和39個工業分行業的相關產出指標。
4.1.1工業總產值總產值指標的數據一般與會計的主營業務收入數據接近,所以普查中會出現企業以主營業務收入代替總產值的情況,特別在規模以下工業企業中比較常見。許多學者把工業總產值指標作為工業產出的替代指標。如謝千里等(1993)和李小平等(2005)計算工業部門的TFP時采用的是工業總產值。
4.1.2工業增加值、工業凈產值工業增加值和工業凈產值的關系為:工業增加值=工業凈產值-支付給非物質生產的費用-利息支出+固定資產折舊+大修理基金。從理論上說,兩種組合在投入產出的相關分析中結果一樣,但實際上兩種組合都存在無法回避的數據構造的難題。陳勇、李小平(2006)采用的方法是:根據工業凈產值推斷出工業增加值,然后根據統計年鑒提供的工業品出廠價格指數進行平減3。根據1993年年鑒中的1992年工業凈產值和工業凈產值的數據對照,分析發現,1992年整個工業行業的工業增加值相對工業凈產值的偏差只有2.91%,偏差較小(陳勇、李小平,2006)。同時,如果研究時間范圍不是關注于改革開放以來的長期序列數據“,工業凈產值”作為一個工業的過去常用的經濟指標,在后續的研究中,可以逐步得到解決。
4.2投入變量作為測度經濟增長的模型,最基本的投入要素變量有資本存量、勞動投入變量和中間投入變量。部分工業行業或工業分行業增長測度模型,只用到了資本存量和勞動投入變量。
4.2.1資本的估算資本投入的測量和估算是一個非常復雜的理論問題4。許多經濟學家對于資本測量方法這個問題進行研究。國外Triplet(1998)有較詳細的論述,Harcourt(1972),Diewert(1980),Burmeiste(r1990),Hicks(1981),Hulten(1990)都進行了相關綜述,Jorgenson(1980,1986,1989,1992,1996)對資本投入進行了持續研究。從操作層面講,OECD(1993,1999,2001)的資本測量手冊非常詳細地介紹了資本測量的步驟。目前,在資本存量的估計問題上的分歧逐漸減少,PIM的方法已經被廣泛認同。
4.2.2勞動投入勞動投入是工業增長率研究的另一個重要投入變量。對于勞動投入,使用比較多的變量是“職工人數”“、從業人員人數”、“受教育年限”和“工資水平”等變量5。需要說明的是,由于中國二元經濟結構的影響,我們目前的就業和失業的統計方法和標準,與國際上通行的就業和失業標準并不一致6。我們目前統計的失業率是城鎮登記人口失業率,一是“城鎮人口”,而非全部人口,二是“登記人口”,這些問題是在實證研究中使用勞動投入數據中需要考慮的地方。
4.2.3中間投入采用工業總產值為模型的解釋變量時,需要估算中間投入。鄭玉歆(1998)和黃勇峰等(2002)在計算國有和集體工業的中間投入時,采用的推算方法為:中間投入=(工業總產值-折舊-大修理基金)/平減指數。如果考慮細分工業行業,這種估算方法容易使人無所適從(鄭玉歆、羅斯基,1993)。李小平等(2005)也通過構造中間投入平減指數估計了工業各行業的中間投入,不過他在計算等式中忽略了大修理基金。謝千里、羅斯基、鄭玉歆(1990)測度國營企業和集體企業的生產率時,采用的指標是勞動、資本和中間投入等三個投入的柯布道格拉斯生產函數(C-D),總產出按照1980年為基期調整的工業總產值。
5結語
中國工業數據源自中國工業從計劃經濟轉向社會主義市場經濟的實踐。由于中國的工業經濟轉型時間非常之短,只有30~40a的時間,給數據調整和處理提出很大的挑戰。對于我國工業數據庫的初建期、成長期的投入產出數據,在實證時,需要充分考慮到統計標準的調整頻繁而導致實證的結果的可靠性和科學性,對于我國工業企業經濟統計成熟期的數據,只需要關注統計口徑的微調即可。因此,在進行工業經濟增長、經濟波動等實證研究時,如果不是針對改革開放后的全區間實證研究,或者一定需要某一特定時段的工業數據,可以選擇時間稍晚一點的數據庫為宜。從研究時間的起點來看,以2003年,2000年,1998年,1995年等為研究起點,都是不錯的選擇。
作者:王濟平 劉亞菲 單位:武漢紡織大學 管理學院
對于企業的統計工作來說,其所統計出來的數據信息是核心內容。保障數據信息的真實性、準確性是十分關鍵性的問題,它是管理者進行正確決策、保障企業方向發展穩定、是否利于企業可持續發展的前提條件。統計的質量及效率的等重要因素都是由計人員所需要重視的問題,特別是基層統計人員的工作效率及質量,影響著整個企業統計工作的順利進行,結合自身實際的經驗之談,筆者用以下的內容進行具體的闡述。
1基層統計人員與企業統計數據質量的聯系
1.1基層統計人員的自身觀念對于基層統計工作來說,以外界看來,十分的簡單易上手,只需要將數據信息進行整理即可,方式方法也不復雜,大多數的工作人員都可以勝任。其實,對于基層統計人員來說,其所面對的是第一手的數據,需要足夠的責任感及統計數據的準確無誤才能為上級服務,作為基礎工作性質應該得到重視。但是,對于大多數的企業來說,企業的統計工作只是作為決策者進行決策的一個參考性意見存在,所以管理者對其不夠注重,也就缺少了對基層統計人員的職業水準及職業素養的培訓。因此,工作人員的積極性很難調動,甚至存在著被忽略感,在此工作崗位上很難持久,崗位人員的流動性比較大。這就會導致基層統計工作效率很難提升、質量很難確保準確,工作職責劃分不明確,工作人員之間互相推卸責任等等。在樣的發展趨勢下,很難存在比較優秀、經驗豐富的從業人員為企業所服務,統計工作的順利進行收到一定的阻礙,為企業的發展戰略決策工作帶來了一定的困難或者誤區。
1.2基層統計人員的流動性大每個行業中都存在佼佼者,統計工作雖然工作程序比較一致,但是真正的進行工作起來,也會具有一定的復雜性及難度,統計工作者大都有如此感受。當前各大企業之中,對于統計工作的開展遇到的難題大多是人員的流動性比較大,很難在崗位上持久的發展,這就造就了一種懶散的局面產生,對于下發的任務完成即可,主動意識差,不會對收集數據的準確性進行考察,只是按照程序依次進行整理、提交。除了這些問題以外,基層統計人員的基礎知識儲備量不足,對待統計工作的執行方式及統計的規律不夠了解與掌握,導致統計工作存在一定的誤區及效率低下,如若剛開始就是錯誤的方向,將會影響整個數據統計的進度及領導決策的及時性。因此,企業的整體發展受到阻礙,基層統計工作很難正常的開展。其發展前景也不容樂觀。
1.3被統計對象的多樣性統計人員是統計工作的主體,那么被統計的對象是統計工作的客體存在,需要統計什么是統計人員的具體工作內容。由于其具體的數量及特征是不一定的,具有多變性。這種工作特性造就了統計工作具有一定的復雜性及增加了難度,為統計人員的工作帶來了一定的難題。與此同時,在統計人員進行工作的過程當中,數據的統計計算具有一定的系統誤差,無法閉合。這種誤差都是由統計客體的本身特性造成的,所以工作人員應該盡最大可能來規避誤差,保證數據信息的準確,為企業的發展貢獻一份力量。
1.4基層統計人員的自身素質問題基層統計人員作為統計工作的一個重要的組成部分,其自身的素養對于企業來說十分重要,其工作態度及工作能力會影響到工作效率及質量的好壞。企業的統計工作正常情況下應該由具備專業知識的統計學專業人員進行從業,然而有些企業對于統計工作不夠重視,對其了解甚淺,同時為了節約開支的成本,將專業外的工作人員雇傭來進行從業,這就很大程度上導致了統計工作的不規范性、不科學性以及不能按照一定的規章制度進行開展工作。統計學中具有一定的專業術語需要從業人員進行了解,方便編制報表等。然而在非專業人員的操作過程中,往往對于術語的真實含義不清楚,只是從字面上進行理解,刀子數據記錄的混亂,整個統計工作無法進行。對一些看似簡單的數據加減法,其實具有很深層的含義很難被了解及應用。因此,企業對于統計人員的從業資格應該予以審查,聘用正規的統計學專業從業人員進行管理,將大大的提高工作效率。
2改善企業統計工作的質量的方法
2.1作為統計工作的基層工作人員,應該具有一定的熱愛集體、熱愛崗位的熱忱,積極的投入到工作中,提高工作效率,企業應該加大對于基層統計人員的重視,明確其工作的重要性的同時,幫助員工獎正確的社會價值觀樹立起來,使員工清楚認識到自身工作的重要性,積極性調動起來,變被動為主動,為公司基礎的數據信息更加的準確無誤。
2.2企業要重視對于人才的培育,特別要加強統計人才隊伍的建設,將隊伍建設作為企業發展的前提標準并及時的放在企業重要議程上,同時做好機構設置及完善的人員配備工作,經常性的進行培訓,激發員工的工作熱情,盡可能的保證基層統計隊伍的穩定。
2.3統計主體在對統計客體進行實際研究時,應當選取適當的統計指標和方法進行統計工作的標準,以保證數據的準確性,克服誤差的影響。
2.4企業加大對基層統計人員的培訓力度,統計工作人員應當不斷強化自身知識水平與能力,積極參加后續職業培訓,讓自己的知識結構和知識水平能夠不斷與現實社會的變化接軌,同時單位要加強考核,對不合格的統計工作人員進行批評督促,對優秀的統計人員進行獎勵,獎罰分明,提高工作積極性。
2.5統計方法對統計工作而言十分重要,正確的科學的統計方法能夠對統計工作起到事半功倍的效果,錯誤的統計方法會降低統計效率,影響數據的易得性和真實、準確與完整程度。所以,建立正確的統計方法,規避繁雜程序,是統計工作中的前提和基礎。“工欲善其事,必先利其器”,只有有了良好的統計方法,才能在實際工作中取得事半功倍的成績。
3統計工作的發展前景
隨著我國的信息時代的到來,企業的統計工作也逐漸的被網絡信息化,初步的實現了統計政務電子化、統計工作流程電子化、統計辦公電子化,統計生產力實現了跨越式的發展。此基礎上應該更加注重基層人員的職業水平及素質水平的提升,并且滿足時代背景下的技術要求,提高統計工作的效率的同時,統計工作也將有無序變得有制有序。更好的為企業的發展提供有價值的意見。結束語從上述文章中我們不難看出,基層統計是企業整個統計系統的基礎保證與核心內容,也是為管理者提供正確決策及利于企業發展方向的數據信息。應該統計數據是一個企業決策的參考性存在,所以其真實、準確性十分的重要。因此,企業應該積極的進行從業人員的職能培訓與素質提升,保證其工作效率穩定提高,統計工作的順利開展,為企業提供正確的發展方向。
作者:王光明 單位:遼寧省大石橋市統計局
隨著全球化進程的日益加深,國與國之間的商品貿易與服務貿易規模在不斷擴大,貿易統計數據的非對稱問題變得越來越突出。例如,2011年中國內地報告的對香港商品貿易出口額達到733.4億美元,而香港報告的從中國內地進口商品貿易僅有142.13億美元,雙方報告數據差異之巨大讓人費解。貿易統計數據非對稱背后折射出來的是統計數據準確性問題。目前,研究貿易統計數據的非對稱已成為評價貿易統計數據準確性和國際可比性的一種較為普遍的方法。隨著中國服務貿易規模的迅速擴大,服務貿易統計薄弱性日益凸顯。加強對服務貿易統計數據非對稱問題的研究,對進一步改進我國服務貿易統計工作,提升服務貿易統計數據準確性具有積極意義。
一、問題緣起
國際貿易統計非對稱問題最早是20世紀90年代提出的(Tsigas,1992),自此之后一直是政府部門和學術界主要關注的領域。其中,最經典的案例就是對中美(FungandLau,1998)及中國內地和香港特別行政區間的貿易非對稱問題(FerrantinoandWang,2008)的研究。目前的研究主要集中在商品貿易領域,少有對服務貿易領域的研究。已有研究認為,導致商品貿易領域中出現統計數據不對稱的原因主要有三種。第一種,不對稱主要來自一些不可避免的因素,其中最主要的是在貿易實踐中報價基礎不同。國際貿易實踐中,進口一般按CIF報價,出口一般按FOB報價。IMF(2011)認為CIF價中包含運費和保險費,因此CIF價一般比FOB價要高出10%左右。Federico和Tena(1991)以及Makoul和Otterstrom(1998)在控制了因CIF和FOB報價導致的差異后發現,發達國家以及總體水平上,貿易統計數據基本是對稱的。Pomfret和Sourdin(2009)認為,如果貿易伙伴國之間距離更遠以及商品貿易的權重增大,CIF價與FOB價之間的差異會更大。在剔除運輸成本因素后,結果是中性的。第二種,不對稱主要來自貿易伙伴國之間統計結構上的差異,如貿易記錄時間的不同、貿易記錄門檻的不同以及匯率波動等。第三種,不對稱主要來自不同的分類以及故意誤報。不同的分類主要來自人為的誤差,或者是海關官員缺乏經驗,又或者是國家貿易統計體制的不同。特別是在轉口貿易的情況下,各國分類口徑的不同導致貿易統計數據的非對稱性很大。海聞、芬斯闕(2000)等認為中美各自公布的貿易逆差值不一致最重要的原因是香港的轉口貿易。如果將從中國內地運往美國的產品和從美國運往中國內地的產品各自在香港的附加值都歸為香港的出口值,中美貿易逆差差異則會大大降低。故意誤報主要來自騙稅、走私等。因此,貿易統計數據非對稱還被用于檢測逃稅和其他貿易中的灰色地帶的存在。研究表明,較高的關稅、腐敗、貿易中的灰色地帶與雙邊貿易統計的較大差異有關(JavorcikandNarciso,2007;BergerandNitsch,2008)。此外,Yeats(1995)發現,發展中國家的貿易數據非對稱非常顯著,這些顯著性差異不能僅僅被不可避免因素或結構型因素所解釋。Hamanaka(2011)發現哥倫比亞貿易統計數據在進口數據以及細項數據的準確性上存在嚴重的問題。HeliSimola(2012)通過與其他貿易伙伴國統計數據對稱性的比較,發現俄羅斯的進口數據質量逐年改善,但與其他發達國家仍有很大差距,尤其在細類統計數據方面。這種問題主要是由錯誤的分類以及故意誤報導致的。
二、鏡像數據和測度指標
(一)鏡像數據的內涵理想狀態下,貿易國與其伙伴國之間相對應的貿易統計數據應該是相等的,即A國對B國的商品或服務的出口(進口)應該等于B國對于A國的相同商品或服務的進口(出口)。這就是貿易統計數據完美對稱的情形。但現實中,這種情況很少發生。兩個國家間對應的貿易數據差異越大,說明兩個國家間的非對稱問題越突出。這里,伙伴國相對應的貿易數據被稱為鏡像數據(mirrordata)。貿易統計中的非對稱性主要通過比較統計數據與鏡像數據間的非對稱性來衡量。歐洲統計局(Eurostat,1998)將鏡像統計數據定義為“對一個貿易流的兩個基礎測度之間的雙邊比較”,“是發現非對稱原因的一種基本工具”。鏡像數據可以檢測每個報告國所報告的貿易額與其伙伴國報告的貿易額的差距情況。當報告數據與鏡像數據差異過大時,有助于識別報告國是否相對某個伙伴國所申報的數據偏高了或是偏低了,從而查找出現差異的原因,甚至查找統計環節中是否存在系統性誤差、定義上的差異或者統計上的錯誤做法。
(二)非對稱系數的測度目前,學術界大多采用的是Ferrantino和Wang(2008)提出的貿易差異度指標來衡量貿易統計數據的非對稱程度。為了能更好地反映差異與均值的偏離程度,本文對該指標進行了修改,將貿易伙伴間的統計數據差異與他們報告數據的均值進行比較。本文將該指標稱為非對稱系數,主要用兩種表達方式:一種是報告國是出口方,另一種是報告國是進口方。當系數為0時,貿易統計數據是完美對稱。系數偏離0越多,說明貿易統計數據之間的非對稱性越強。貿易差異度可以為正數也可以為負數,它可以用于估計一個國家相對于其貿易伙伴公布的數據而言,所報告貿易流是偏高了還是偏低了。
三、服務貿易雙邊鏡像數據的比較
我國服務貿易統計始于1982年,最初的進出口總額僅為44億美元,占全球服務貿易總額的0.6%。2013年我國服務貿易進出口總額達到5396.4億美元,占全球總額的6%,居全球第三位,同比增長14.7%。在服務貿易大發展的背景下,高質量的服務貿易統計數據是加強對服務貿易的理論研究和政策支持、強化對服務貿易的國內管理和國際協調的前提。目前,我國國際服務貿易統計體系正在逐步建立,但是現有體系下所產生的統計數據能在多大程度上反映我國國際服務貿易的真實交易量是首先需要解答的問題。本文通過與主要貿易伙伴鏡像數據的比較來對中國服務貿易統計數據的準確性進行初步探討。本文中中國與貿易伙伴國的雙邊服務貿易數據主要來源于WTO官網、UNservicetrade數據庫以及OECD數據庫。
(一)我國主要服務貿易伙伴本文選取了與中國服務貿易交易量最大的中國香港、美國、歐盟、日本及韓國作為主要伙伴國(地區)進行研究。如表1所示,無論是“一般商業服務”還是分類服務貿易,中國與上述五個國家(地區)的服務貿易額大體都處于前五位的關系。中國與上述國家(地區)實現的服務進出口額占中國服務進出口總額的六成以上。其中,中國香港為中國最大的服務貿易伙伴,雙邊服務進出口總額約占中國服務進出口總額的1/4。中國香港仍為中國最大的服務出口目的地、進口來源地和順差來源地。通過對與這些國家(地區)服務貿易統計數據非對稱性的研究,有助于找出我國服務貿易統計數據存在的主要問題以及問題的主要方面。
(二)我國服務貿易統計數據的非對稱性考慮到數據的可獲取性以及時效性,本文主要以中國、中國香港、歐盟、美國、日本、韓國2011年雙邊貿易數據作為研究對象,分別對運輸服務、旅游服務、其他商業服務以及一般商業服務四個類別進行研究。表2列出了2011年各國(地區)與其伙伴國(地區)之間出口數據和進口數據的非對稱系數。系數為正,說明報告國(地區)的數據相對于鏡像數據偏高;系數為負,說明報告國(地區)相對于伙伴國(地區)報告的數據偏低。此外,本文通過均值的比較來反映我國服務貿易統計數據非對稱程度的整體水平(見表3)。系數絕對值越大,說明差異度越高。尤其是當系數的絕對值大于0.5時,屬于統計數據極度不對稱狀態。從表2、表3中可以看出以下幾點:第一,總體上,我國服務貿易統計數據的非對稱情況要遠高于商品貿易。但有一點值得注意的是,在商品貿易領域,中國進口數據非對稱性異常突出,明顯高于其他伙伴國(地區)水平。第二,我國服務出口數據非對稱情況要比服務進口數據非對稱情況嚴重,如表3所示,中國各類服務貿易出口統計數據的不對稱性要高于其他貿易伙伴國(地區)。“其他服務貿易”統計數據不對稱性最嚴重。其次是“運輸服務貿易”。第三,其他商業服務貿易方面,各國(地區)統計數據不對稱情況最普遍。在五個貿易伙伴國(地區)中,除歐盟外,進出口數據都與伙伴國(地區)存在極度不對稱的情況。第四,運輸服務貿易方面,中國對中國香港的出口數據以及中國對歐盟的進出口數據都存在極度不對稱狀態。第五,旅游服務貿易方面,數據非對稱情況相對要少很多,但中國與美國旅游服務貿易的進出口數據存在嚴重的非對稱。第六,在五個伙伴國(地區)中,與中國服務貿易出口統計數據差異最大的地區是中國香港。如圖1、圖2所示,中國內地與中國香港在所有四個服務部門的非對稱系數都超過了0.5,尤其是運輸服務和其他商業服務非對稱系數甚至超過了1。中國與其他貿易伙伴國的非對稱性情況不如與中國香港這么突出,主要在某個部門存在較明顯的非對稱性。例如中國與韓國主要在其他商業服務方面存在顯著不對稱,中國與歐盟在運輸服務貿易方面存在顯著不對稱。
四、統計數據非對稱的原因分析
(一)與其他國家服務貿易統計體系存在較大差異由于服務的無形性,服務貿易統計存在很大的難度。雖然目前國際上有通行的《服務貿易統計手冊》和BPM5標準作為各國服務貿易統計制度的指導,但是各國的服務貿易統計體系仍存在很大的差異。首先,各國BOP范疇下服務貿易統計數據的采集方法不同。目前國際上通行做法有結算、調查混合三種。我國BOP服務貿易統計以間接申報制度為主,主要依賴結算系統來獲取數據。中國香港的服務貿易數據以各項有關機構和住戶的統計調查搜集為主,輔助行政記錄而得。美國主要通過商務部經濟分析局的調查問卷來獲取服務貿易數據。而歐盟各國正逐漸由結算系統向混合或調查方式轉變。隨著網絡技術的發達,許多服務貿易是通過電子轉移的方式進行的,并沒有向相關機構進行申報,并且大量的跨國公司內部交易的存在導致結算系統越來越難以反映真實的交易情況。目前,由結算系統向調查系統和混合系統轉變是BOP服務貿易數據采集的一大趨勢。我國主要通過結算系統來獲取統計數據的做法已經落后服務貿易實踐的發展。其次,各國對服務貿易統計口徑貿易記錄制度、貨幣折算標準不同及統計時間差異等原因都會造成統計結果的巨大差距。中美之間關于貿易順差和逆差的多次爭論就是例證。這種情況在服務貿易領域尤為明顯。
(二)我國服務貿易統計制度環境不夠完善從成功開展服務貿易統計的國家或地區看,它們都是在法律、制度的保障下有效地開展服務貿易統計工作的。美國國會于1985年通過了《國際投資和服務貿易調查法》,授權美國商務部經濟分析局(BEA)為美國服務貿易的首要統計機構和首要機構,并授權經濟分析局進行各行業服務交易的強制性調查以及國際直接投資的強制性調查,從而保障了美國服務貿易統計工作的順利進行。中國香港則根據《普查及統計條例》(第316章)及附屬法例收集服務貿易統計數據,這是中國香港服務貿易統計領域的最重要立法。長期以來,由于缺乏服務貿易統計制度,缺乏服務貿易統計歸口管理部門,中國的服務貿易統計工作明顯落后于發達國家(地區)。雖然《國際服務貿易統計制度》(以下簡稱《制度》)于2008年1月1日正式實施,并且2012年進行了修訂,但整體而言,《制度》對數據(尤其是占服務貿易總額一半以上的運輸、旅游、通信、金融和保險數據)的采集和使用等方面的指導過于籠統,缺乏可操作性。例如,在《制度》中指出“運輸、旅游、通信服務、金融服務、保險服務等進出口數據則利用相關部門行政記錄、統計資料以及測算數據和其他信息源進行統計”,但是具體、統一的指導意見和要求卻缺位。這導致各省(直轄市、自治區)采集的服務貿易數據不完整、不可比。《制度》中雖然強化了企業直報的調查方式,但卻對拒報、遲報、偽報、篡改統計數據的行為缺乏監管和懲處力度。另外,目前我國服務貿易統計是商務部、外匯管理局以及各個服務業管理機構并行的多頭統計管理體系,各自統計口徑的差異也影響統計數據質量。
(三)服務貿易統計工作自身的復雜性《服務貿易總協定》將國際服務貿易分為12大類共155個服務項目,涉及經濟生活的各個方面,相關服務企業數量眾多。服務貿易有跨境交付、商業存在、境外消費和自然人流動等四種模式,涉及服務、人員、資本等流動。服務貿易調查對象廣泛,服務經濟活動形式多樣,都為服務貿易統計增加了極大的難度。由于服務的特殊性,有許多服務是依附在貨物上的,服務價值很難剝離。如運費大部分時候是與商品的價格打包以報價的形式反映出來。此外,如嵌入在出口或進口貨物上的軟件、知識產權的價值等。隨著網絡通信技術和交通運輸技術的發展,服務貿易量激增,貿易形式日新月異,許多服務貿易數據很難被捕捉。另外,許多服務貿易數據基本上來自政府或民間機構的定期調查和普查。調查包括對國內外公司合同的調查、對服務業雇工情況的調查、對服務價格信息的調查等。普查一般不間斷進行,涉及的范圍更廣一些。但由于經費和人力有限,采用調查或普查的方法會面臨一些潛在的問題,例如,一些國家在調查或普查時更多地采用抽樣方法獲得服務貿易數據,多少帶有猜測估計的因素,缺乏應有的可靠性和真實性。如果在調查過程中匆忙行事,對樣本缺乏必要的評估,對調查程序缺乏嚴格控制或對調查資料缺乏嚴格的審核等,就會使調查結果以偏概全,錯誤百出。本文中研究的“其他商業服務”是一個雜項類,是不包含運輸與旅游服務之外的所有商業服務。根據BPM5中的定義,“其他商業服務”應包括通信,建筑,保險,金融,計算機和信息,專有權利費和特許費,其他商業服務,個人、文化及娛樂服務,視聽及相關服務等。這些服務類別涉及門類多、交易形式多樣,不同采集方法下產生的數據差異值將更大。“其他商業服務”作為多種細項服務類數據的加總,也會導致各種差異的疊加,將進一步加大統計數據間的差異程度。
(四)與某些國家間可能存在系統性差異本文前面的分析適用于解釋各國之間統計數據差異的一般性原因,但卻不能有效解釋中國與貿易伙伴國(地區)在特定服務貿易領域中長期存在的顯著差異。例如,在運輸服務和其他商業服務領域,中國出口數據與中國香港的鏡像數據一直處于差異異常顯著的狀態。要解釋這些差異產生的原因,需要了解兩個國家(地區)間貿易及其統計的實踐特點。本文以運輸服務貿易為例,嘗試分析統計數據不對稱的系統性原因。自中國入世以來,中國香港的轉口貿易功能進一步強化。經香港轉口出口額占全部香港出口額的比重近年來一直呈上升趨勢,2001年為89.63%,而到2010年一路上升為97.71%,到2011年7月,這一比重又上升0.2個百分點,為97.91%。在中國香港的轉口貿易中,內地一直扮演著最重要的角色。1998年以來,轉口貿易中來源于內地的貨值占總貨值的比例一直穩定在60%左右,2010年來源于中國內地的轉口額占香港全部轉口貨值的61.5%。本文認為轉口貿易可能加劇了兩地之間運輸統計數據差異。我國運輸服務貿易的出口主要基于國際收支統計間接申報,根據我國運輸服務企業提供的服務國際收支數據獲取。當我國的承運人將貨物運至香港轉口時,這段運輸服務記為中國內地對中國香港的“運輸服務出口”。在運輸服務進口方面,當前國際范圍內廣泛應用的是依據貨物進口數據進行估算。估算方法如下:貨運服務進口=按CIF計算的商品進口總額×運費系數×外國承運人在外貿運輸市場的份額。在貿易實踐中,在中國內地輸往香港的貨物中,如果其中有些貨物在香港解釋作轉運或者是過境,這些貨物不在香港做進一步的加工,也不在香港消費、轉賣,那么這些貨物按照香港特別行政區的規定就可以不必向海關提交報關單。因此,這些貨物也就不列入香港統計的內地的進口。而香港運輸服務進口也可能因為貨物進口數據的缺失而缺失,即不存在相對應的香港從中國內地的“運輸服務進口”。因此,轉口貿易的大量存在以及兩地之間在統計實踐上的差別,可能是造成兩地運輸服務統計數據差異的一個重要原因。
五、改進的對策
(一)建立內外協調、統一的服務貿易統計制度服務貿易統計涉及門類眾多,經濟活動形式多樣,是一項十分艱難的工作。一個健全的服務貿易統計制度首先要做到內外協調統一。外部體現在,我國的統計制度應與國際通行的統計準則相協調。當前,《國際服務貿易統計手冊》(以下簡稱《手冊》)從廣義上提出了一個國際公認的國際服務貿易統計編制和報告的框架,包括編制國際服務貿易統計的指導性意見和操作流程。我國應進一步提升服務貿易統計制度與《手冊》的協調統一性,盡可能按照《手冊》的要求來設計制度和相關實施細則。只有加強對外的協調統一,才可以進一步提高服務貿易統計數據的國際可比性。內部體現在,加強服務貿易統計與已有統計體系間的協調。其一,加強與國際收支統計體系下服務貿易統計的協調。我國以前的服務進出口統計主要通過國際收支核算體系獲取,由外匯管理局負責。《國際服務貿易統計制度》實施后,商務部負責服務進出口數據的匯總和編制。兩者在統計分類、歸口管理、統計手段上都存在很大差異,兩套統計體系并行會造成服務貿易統計方面的混亂。其二,加強與已有外資及對外直接投資統計的協調。建立FATS統計可以充分利用現有的外商投資統計和對外直接投資統計,加強與現有外資和對外投資統計的協調,能節約大量社會成本。其三,加強各地區間服務貿易統計實踐的協調。服務貿易統計實施細則的缺位導致各地服務貿易統計具體操作存在一定差異,對地區間統計數據的可比性產生負面影響。
(二)完善服務貿易統計立法和執法工作雖然《中國服務貿易統計制度》為服務貿易統計工作奠定了一定的立法基礎,但是具體實施層面卻缺乏立法保障。從國外經驗來看,完善各種形式的服務提供者和消費者的貿易登記制度,并以法令的形式加以規范,將極大地提高服務貿易信息反饋的數據和質量。因此,我國需進一步加大對服務貿易統計實踐環節的立法工作。除了需要立法保障外,還應加大執法檢查力度。根據有關法律對拒保、遲報、偽報、篡改統計數據的單位進行嚴肅查處,直到追究法律責任,以保證統計數據的真實性。
(三)加強與其他國家服務貿易統計的經驗交流和學習目前,美國已形成最科學、最完整和最具推廣意義的服務貿易統計體系和統計方法。美國還是世界上最早能夠提供與GATS服務貿易概念一致、連續、系統的雙向服務貿易統計數據的國家。歐盟國家也較早地進行了有益的探索并付諸實踐,目前歐盟大多數國家均能依據BPM5收集服務貿易統計數據,并可提供內外向FATS數據。上述國家的做法和經驗豐富了國際公認的《國際服務貿易統計手冊》內容,對我國具有許多可借鑒之處。我國應通過與具有豐富統計經驗的國家的交流和學習,發現和比較各國的做法,促進國外好的經驗和做法在我國的推廣。例如,在數據采集渠道方面,通過借鑒美國和歐盟等服務貿易統計數據收集方面的先進經驗,更多地采用抽樣調查、問卷調查、重點調查等方法收集服務貿易數據。
(四)構建與伙伴國的雙邊數據交流機制一個國家分國別地進行服務貿易進口統計,能反映有關伙伴國對本國服務貿易出口的基本統計信息。因此,盡可能地編制主要伙伴國雙邊服務貿易統計數據,同時加強與伙伴國構建雙邊數據交流機制,實現數據互換、信息共享,有利于我國及時跟蹤我國服務貿易流與鏡像數據貿易流之間的差異程度和差異方向,及時發現問題,找出原因。此外,我國還應建立服務貿易統計信息交換平臺,與國際組織、國家(地區)、國內有關機構加強信息資源的共享與合作開發。
作者:楊麗琳 單位:江西財經大學國貿學院
1數據挖掘技術在統計工作中的適用性分析
1.1較高的有效性數據挖掘技術作為一種數據的深加工技術,其本身是帶有鮮明的目的性的,在實際應用活動中能夠對長時間積累下來的經濟統計數據進行基于數據使用者要求的深入加工。在實踐應用活動中主要有兩種重要的應用形式,一種是對積累經濟統計數據的管理高效化處理,一種是對現有經濟數據的目的性分析。其中第一種分析方式是從經濟數據管理的角度出發的,在應用中主要是以固有數據信息的統計、分類為基礎,將原本混亂的數據庫信息進行科學、系統的歸類,保證統計數據管理的高效性和使用的便利性。另一種工作方式是一種經濟數據的再加工過程,以鮮明的數據統計、分析目標為指引對原有數據的呈現形式、組成內容和關聯形式進行重新加工,以保證經濟統計數據能夠最大限度地服務于管理者的需求。
1.2綜合應用性強如前文所述,數據挖掘技術是一個工具系統而不是單一的工具,能夠實現使用主體的各種信息需求,隨著現代社會經濟的快速發展,當前我國經濟管理的各個部門都需要大量的經濟統計信息來作為經濟管理決策的基礎。但是因為各個管理部門經濟管理的領域不同、經濟管理的方式不同、經濟的管理權限不同,所以相應的經濟統計數據呈現形式的需求就不同。這就為經濟數據統計系統提出了更高的要求,其不僅要對符合各個經濟管理部門需求的數據內容進行統計,同時要將統計完成的數據換算成各種不同的呈現形式,并根據統計信息的來源和統計信息的計算方式對其可靠性進行評估[2]。最終這些數據信息的輸出格式還應該符合所服務的經濟管理部門管理系統的格式要求,保證統計數據能夠在管理部門的管理系統中正常錄入、應用,數據挖掘技術很好地滿足了上述的復雜經濟數據管理要求,其功能的綜合性促進了其應用深度的提高和范圍的擴大。
1.3宏觀數據庫有利于數據挖掘技術的應用當前因為經濟管理部門的職權較為分散,各個經濟管理部門的經濟統計數據需求不盡相同。所以我國的經濟統計活動絕大多數還采用傳統的經濟統計方法,統計收集的經濟信息存在一定的局限性,不能夠服務于經濟管理活動的整體,或者造成一些數據統計工作的重復,對經濟數據統計工作造成了一系列的質量和效率上的影響。經濟數據統計活動急需一個能夠整合各個統計系統,實現統計數據信息融合的新技術。宏觀經濟統計數據庫為數據挖掘技術的開展提供了平臺,數據管理系統的經濟統計信息要正確無誤,然后經過數據挖掘技術的整合,就能得到更加豐富的數據資源[3]。
2數據挖掘技術的應用
在社會經濟管理活動中,管理主體對經濟統計數據的要求主要有兩個。一個是統計數據的真實性、一個是數據統計信息的實用性。單就這兩個經濟統計數據要求而言,數據挖掘技術能夠很好地滿足經濟統計工作的需求,是適用性極強的一種經濟數據統計技術,其在具體的經濟數據統計活動中主要有以下三種應用方法。
2.1預處理方法在經濟數據統計活動中,最為基礎的一種處理方式就是經濟數據的預處理方法,因為數據挖掘本身是一種基于提供基礎信息的智能分析技術。其本身是受基礎經濟信息限制的,不可能無中生有代替經濟數據收集系統的功能。所以所有作為數據挖掘系統數據基礎的經濟統計數據信息都應該進行預處理,處理的內容主要包括對這些數據中不正確、不真實、不準確,以及不同經濟統計數據信息之間差距較大的現象。對這些基礎數據存在的問題進行處理的過程被稱為數據清理,當前數據清理主要采用的方法有均值法、平滑法和預測法。其中均值法是現代分析技術中模糊理念的一種應用形式,當基礎數據中的一個數據點是空值或者噪聲數據的時候,可以采用均值法進行處理,即用數據庫中所有該屬性已知的屬性均值來填補空缺。保證數據挖掘系統對基礎數據的分析和整理能夠正常進行,得出相對而言準確度較高的統計分析數據。其中Ci表示當前數據點的取值,Cj表示當前數據點前后不為空的數據點,K表示當前數據點進行計算所取的參考數據點數量[4]。平滑法依然是對基礎數據中空值和噪聲數據的計算方法,其與均值法的區別是用加權平均數代替了平均數,考慮了計算過程中提取的每一個數據對數據結果的影響權重,所以計算出的結果往往更加接近真實的數值。其中Ci表示當前數據點的取值,Cj表示當前數據點前后不為空的數據點,K表示為對當前數據點進行計算所取的數據點數量。WJ表示Cj數據點的權值。
2.2集成化處理方法在數據挖掘技術的應用活動中,因為相同地區的數據統計主體不同,或者在不同地區對相同經濟數據的統計標準不統一,會產生一系列的數據集成問題,如何對這些調查方向不同或者是呈現方式不同的數據進行有效集成而不影響經濟數據統計的準確性,是數據挖掘技術的重要任務。在具體的數據集成過程中主要考慮以下幾個方面的問題[5]。
2.2.1模式集成當前因為社會經濟活動中經濟數據的統計內容過于廣泛,很多經濟數據統計并不是來自于官方的統計局而是來自一些民間統計組織,或者是由一線社會經濟主體直接提供的經濟數據,在數據挖掘過程中將這些來自多個數據源存在多種數據呈現模式的經濟數據信息進行集成就涉及實體識別的問題。例如在數據挖掘過程中如何確定一個數據庫中“std-id”與另一個數據庫中的“std-no”是否表示同一實體,當前一般使用數據庫與數據庫之間的含元數據對比來保證實體識別高效率和高質量[6]。
2.2.2冗余問題數據挖掘本身是對經濟統計數據的一種深加工技術,經過其加工的經濟統計技術應該在本質上達到最簡狀態。在數據挖掘過程中要將與其他數據呈現某種正相關關系的數據項目進行精簡,以保證數據庫中數據量維持在一個較低的水平,為數據管理和應用提供便利。在經濟數據挖掘活動中人均國民生產總值就是典型的冗余屬性,因為其數值是可以通過國內生產總值和總人口屬性計算出來的,所以類似人均國民生產總值這種冗余屬性在數據挖掘過程中就應該精簡,應用的時候在利用國民生產總值和人口屬性計算得出[7]。對冗余屬性的判斷主要通過相關度對比來實現。其中n表示元組的個數,分別是屬性A和屬性B的平均值,分別是屬性A和屬性B的標準方差,在這一公式中如果則表示A、B兩個屬性是正相關,也就是說A越大B就越大,值越高二者的正相關關系就越密切;如果則表示屬性A、B之間沒有直接關系,是相互獨立的;如果則表示A、B兩個屬性呈負相關,屬性B會隨著屬性A的減小而增大,的絕對值越大,二者的負相關關聯關系就越密切。
2.3決策樹方法在數據挖掘技術應用過程中,經過系統的分析和總結以后,分析數據的輸出是一個關鍵的環節,其輸出的數據形式會對使用者的經濟管理決策產生直接的影響。決策樹是一種較為常見的、直觀的快速分類方法。其應用的關鍵是決策樹的構建,具體而言主要分為兩步:第一步是利用訓練集建立并精簡一棵決策樹,建立輸出分析的模型;第二步是利用構建完畢的決策樹進行輸入數據的分類,這一分類是一個遞歸的過程,從決策樹的根部開始進入到樹干、枝丫,直到輸入數據的分類滿足了某種條件而停止。在具體的應用中停止分割的條件有兩個:一個是當一個節點上的所有數據都屬于同一個類別的時候;另一個是沒有分類屬性可以對輸入數據進行再分割[8]。在決策樹構建完成后,還要根據使用者的具體要求對決策樹進行“剪枝”,剪枝的主要目的是要降低因為使用訓練集而對決策樹本身數據輸出產生的起伏影響。
3結語
經濟統計活動是現代社會經濟管理的重要基礎數據提供主體,其本身對社會主義現代化市場經濟建設的影響是廣泛而深遠的,所以其運行過程中的質量和效率至關重要。數據挖掘技術是針對現代數據管理活動中存在的數量基數大、構成復雜和數據缺失現象嚴重等客觀問題而研發的一種高效的數據深度加工技術,其在經濟統計中的應用能夠更好地滿足經濟統計的需求。本文從數據挖掘技術概述、數據挖掘技術在統計工作中的適用性分析、數據挖掘技術的應用三個方面對這一問題進行了簡要的分析,以期為數據挖掘技術在經濟統計中應用水平的提升提供支持和借鑒。
作者:李榮單位:懷化學院經濟系
一、統計道德風險產生的原因
(一)監督得不到有效合理的控制,導致統計工作產生風險我們大家都知道統計數據一般都是反映宏觀整體現象,這種宏觀整體現象往往都掩蓋了事物的個體本質,因此大多數公眾與某些部門對它產生懷疑卻無從下手去監管,另外統計部門在統計信息時,占有主動權,具有權威性,這種信息的不對稱性也容易產生職業道德風險,再有統計部門的垂直領導形式,使其工作都是“上派下行”,從而導致一些統計數據都是現有目標,再有統計,最后達到預期結果,統計工作的這種被動與尷尬已經成為普遍現象,這種從上到下無人監督,無人管理的現象所產生的后果是距離現實在越來越遠,“此地無銀三百兩”的故事距離我們越來越近,社會將進入顛倒是非,真假難辨的惡性循環之中。
(二)統計法的力度不夠,加速統計數據的風險產生從上邊統計風險產生原因我們可以看到都是由于某些政府和個人短期利益的因素,而導致統計產生巨大的風險,這種短期的效益與其產生的長期風險是遠遠不對稱的,但是許多政府與某些單位以及個人卻還是選擇了這一瞬間的短期利益,這是為何?我們常常聽到某些單位或個人由于違反各種會計法、經濟法,最后導致嚴重違反財經紀律、貪污腐化從而導致受到行政法律的制裁,嚴重者觸犯刑法,最高可判無期乃至死刑和罰金。但是統計法律法規卻沒有這么大的力度,即使提供了虛假數據,即使受到行政處罰,也都是輕描淡寫、隔靴搔癢而已,從根本起不到懲戒、震懾和遏止作用,卻反而助長了統計數據失真的力度,加速了統計風險的速度。最后形成了“統計統計,三分統計,七分估計”的熟語。這也很好地回答了上述問題產生的根本原因。
二、針對當前我國統計工作職業道德產生的風險應采取的措施
(一)全面提高相關業務人員的綜合業務素質統計工作涉及面廣,對理論知識與實際工作能力要求高,它要求相關業務人員不僅懂得國家的法律法規,而且還要求相關業務人員掌握一定的財務、審計、經濟、統計分析等一定理論知識,并且還特別強調了統計人員應該加強愛崗敬業、盡職盡責的職業道德,德才兼備,以德為先的職業道德和業務素質修養永遠是統計人員的最起碼要求,也是有效地避免統計風險的基本前提,所以統計人員應該通過各種渠道提高自己的綜合水平,如參加各種統計相關的考試、學習輔導班以及業務比賽活動,使他們融入當今社會潮流之中,這樣可以增強統計人員的自我提升、自我風險保護意識,這也是抵制社會上統計工作不正之風最有效的措施。
(二)政府及主管領導要用正確的發展觀去指導統計工作我們大家都知道統計是為政府部門服務的,這是國家參與宏觀調控的重要手段,但是在當今的市場經濟體制下,以市場微觀調控為主,國家宏觀調控為輔的理念指導下,統計需要減少政府的干涉,甚至消除人為干預,這樣才有助于國家的經濟建設。所以各級政府應該轉變職能態度,從而合理地引導各級主管領導具有科學的世界觀,進而正確指導統計工作,引導寬松的統計工作環境,使統計工作者在良好的工作氛圍中,放下包袱,努力工作,為國家制定合理有效的重大決策提供真實的數據,從而真實地反映國家的宏觀目標,這樣更有力促進社會經濟的發展,促進人們的安全、社會的和諧。
(三)加強統計數據的監督反映統計數據失真給統計工作帶來了一定的風險與隱患,其最大原因就是統計數據缺乏像會計工作那樣的監督機構,另外統計數據的公布也非常籠統化,不如財務指標那樣詳細,計算方法與方式也不像會計那樣進行詳細地披露。所以國家應該盡早地出臺一些法律法規以及有關政策,讓統計部門加大信息披露的力度,如時間間隔應該縮短,披露的數據來源、方法、處理的過程等統計信息應該詳細,讓數據的使用者與監督者能夠很好地分析數據的真實可靠程度,這樣不僅增強了統計的公眾監督力度,又有利于公眾對統計的了解與認可,進而也讓統計工作者工作起來有的放矢,避免了其左右為難的工作情緒,更避免了統計工作的重大隱患風險的存在。
(四)加強統計法律法規建設,完善統計規章制度目前國家對會計、經濟等各種法律法規都進行了不斷的完善與調整,此種方式方法得到了有效的反映,如偷稅漏稅逐步減少,行賄受賄、大吃大喝公款的現象極度收斂,這樣不僅促進國家經濟的發展,也受到了百姓的擁護與好評。那么如果在這種良好的氛圍下,大力加強統計法律法規的建設,對那些原來不合理、不完善、不適合市場經濟體制下的統計法律法規及規章制度進行刪除或者合理的更新,并加以完善和必要的補充,如加大對政府與部門人為反方向干擾統計工作的監督與懲罰,加大脅迫統計工作者編制虛假數據而承擔的法律后果,以及統計工作者在此過程中給予抵制而受到的獎勵制度和聽之任之、同流合污而承擔的法律后果等等規定。這樣統計工作者才能堅定地拿起法律的武器來保護自己,使自己勇敢地面對不法分子堅持真理,永不膽怯。因為誰也不能拿自己的一生和終身的家產去賭注,迫使不法分子沒有可乘之機。這是杜絕統計工作職業道德風險,強化統計職業道德意識最有效的措施。
三、結束語
總之,時代在發展,經濟在騰飛,信息網絡飛速更新升級,統計數據愈加重要,統計工作也愈加復雜、愈加引起人們的關注,統計人員的使命感愈加突出,其統計職業道德風險就愈要加以防范,為了更好地促進金融危機下國家經濟的正常發展,抓好統計工作勢在必行,科學有效地防范統計風險愈加重要。
作者:修偉單位:遼寧省丹東市中心醫院
《科技傳播雜志》2014年第十八期
1統計學的數據整合,利于發揮新聞的監測功能
統計學的介入,讓專題新聞的表現形式多元化,由多媒體制作的統計圖片,表格等具有直觀、準確、全面、深入等特點。這也便于以調查為歸宿的專題新聞有了屏障。通過對比,綜合分析事件背后的原因,將真相呈現在大眾眼前。《今晚800》一期名為《暴雨之后成都菜價波動調查》的節目中,2013年7月,特大暴雨襲擊成都,造成蔬菜市場價格的巨大波動。蔬菜一天一個價,就像坐過山車一般,時高時低。在整個新聞調查中,數據成為了真相的證據,也為之后政府的決策提供了依據。大雨侵襲后,平日里普通的蔬菜也悄然漲價。就拿萵苣來說,從過去的1塊/斤漲到了現在5元/斤。萵苣這類葉子菜普遍比大雨前漲了3倍以上。數據描述了現象,就需要從現象中看到事件的本質。記者通過調查周邊地區的菜農得到了答案。因為暴雨降臨,成都、綿陽、雅安等地受災嚴重。截至7月15日9時統計,此次暴雨洪澇災害已造成阿壩、德陽、成都、雅安、綿陽等15市(自治州)90個縣(區、市)344.4萬人受災。農作物受災面積156.5千公頃,直接經濟損失200.8億元。對于蔬菜基地的破壞尤為嚴重,一個生產基地破壞,源頭大量減產,商戶去收菜,收不到。菜價出現波動,交易量出現下跌,遠一點的菜受到交通影響,一車菜都出來不了,商戶繞道5、6百公里,花三倍時間,運輸成本大幅上升,蔬菜質量比原來下降的多,要么大量的菜同時進入市場、要么全部堵在路上,價格波動明顯。受災規模大,商家運輸困難造成了蔬菜價格大漲。為了應付而四川盆地7月的這場特大暴雨,成都市農委和成都市商務局著情下藥,該中心立即啟動了市場調節機制。外地蔬菜之前供應成都市場占到了40%多不到50%、是走向成都區域的,雨季期間供應成都市場的量占到了60%以上了,大部分貨源走向了成都區域,彌補了成都區域貨源不足。新聞中的數據為政府宏觀調控提供了便利,蔬菜價格的異常在宏觀調控中得到合理的控制,通過政府對市場的干預和調節,這種突發性的漲價,很快就可以得到回落。
2統計數據在專題新聞中的應用
2.1數據信息含量大,增強新聞的底蘊在所提供的數據中,很多包含了新聞的背景信息,這些信息不僅延伸了新聞的深度。更重要的是,信息含量大,意味著新聞的角度越寬。對于記者來說,他能選取到更佳的報道角度來反映主題。而對于觀者來說,也能從不同的角度去解讀同一件事情。為什么現代的連續劇有這么多版本,但是每個版本表現的內容卻不同。這就是因為導演收集的資料和表現的方式不同。在老三國中,導演著重以蜀國的視角來解讀三國。因此,開篇選用了桃園三結義來表現蜀漢的情義。為了表現蜀漢忠于漢室,難免貶低曹操、孫權等。可隨著時代的變遷,人們不在拘泥于過往傳統小說的解讀模式,而是以新角度、包容的態度去接納這類影視作品。才有了《新三國》被稱為《曹操傳》的“事實”。其實,這些都和已有的數據有關系。過往人們的思維總認為,傳統給予的信息是對的。但事實并非如此,收集的數據資料越豐厚,可供選擇的信息就越多,解讀的角度也會不同。專題新聞很多時候講究多維度表現,從多方面反映新聞事件。比如,采訪“公交防狼法”時,除了要采訪到當事人、交管部門、市民之外,律師、防狼教練、醫生也是必須要采訪到的,使節目更具立體感,調查也顯得深入。
2.2統計數據全面,深度解析實事專題新聞中的數據引用量大于普通新聞,數據的跨度比較大,為了說明一個現象時,會大量出現與現象相關的關聯數據。這些數據幫助專題新聞能從時間和空間多層面展現事件全貌,挖掘新聞真相。比如,《今晚800》—25年成都駕考那些事節目中,就對自1987到2012年全面實行電子化駕考做了全面的數據分析。先是說明改制后,考生的合格率,據成都市車管所提供的數據顯示:成都全面實現電子化駕考第一天,參加考試的1500名考生中,有540人通過考試,合格率為36%。到了第三天,共有3183人參加考試,考試合格為953人,合格率為30%。相比于改制前,合格率明顯下降了不少。1988年時全市擁有駕照人數占總人數比例為0.006%;也就是說平均每10萬人中,僅有6個人擁有駕照,2010年擁有駕照人數占總人數比例為24%。也就是說平均每100人中有24人持有駕照。駕駛員人數機動車數量增長了29倍,駕駛人總數增長了59倍,成為中國汽車第三城;會開車也從一種工作技能,變成了一個人的生活基本能力。成都駕考所走過的25年,無論是從考試場地、評判手段,還是從考試規模上都發生了巨大的變化,這也從一個側面折射出成都社會經濟的巨大變化。
3結論
統計數據能完美地融于新聞學中,它不但能讓新聞展示出更為真實有效的信息,更能提高新聞的表現力。記者在專題新聞中引用的數據并非空穴來風,而是經過深入調查得來的。這些數據能幫助新聞從業者進行更深入地調查,也能便于他們理清新聞脈絡。更重要的是,這些寶貴的數據便于政府部門對癥下藥,快速有效地找出問題的癥結,及時處理,解決老百姓生活中的疑難雜癥。
作者:程一丁單位:成都理工大學
一、墾區勞動工資統計出現的新情況和新問題
改革開放以來,隨著墾區經濟體制改革的不斷深入,職工家庭農場逐步興起,墾區農業職工原有的固定等級工資已不能客觀地反映職工實際所得的勞動報酬,不能再作為年終工資統計的依據。職工家庭農場是在墾區計劃指導下,對國有土地實行定期承包、自主經營、包干上交、獨立核算、自負盈虧的經濟活動單位。隨著家庭農場的興起,墾區內部生產組織形式發生了變化,同時在用工方式和分配方式上也發生了很大的變化。主要變化表現為:在用工制度上,改革了原來固定工制度,全面的實行勞動合同制;家庭農場根據生產需要,雇用了一些短期幫工或長期幫工,其人數少則三、五人,多則十幾人;分配方式方面的變化也很大,近兩年,家庭農場職工種地上交完農場利費糧,盈余部份可自行分配,但是很難在盈余部份中劃清有多少是工資,有多少是凈利潤。面對這些問題,如何將家庭農場職工的工資收入劃分清楚并如實統計出來,是勞動工資統計面臨的新問題。
二、農業勞動工資統計數據控制思路及辦法
從目前農業從業人員分類看,有機關、事業管理人員,這些人勞動報酬容易統計,可以從其單位財務部門直接取到;還有打工人員、兼職人員,這些人的勞動報酬可以調查獲得;另外一大部分就是從事農業生產的農場職工,他們的工資就較難直接取到,常常會出現漏報、工資總額少報等問題,其主要原因是統計方法出現了問題。為了真正使勞動工資統計數據反映客觀實際,確保主要數據能客觀地反映勞動經濟運行趨勢,為宏觀決策和制定政策提供準確、可靠的依據,我們可以將其控制在一定的區間內,力爭在趨勢上把握農業職工平均工資的水平,保證所上報的數據不偏離甚至背離正確的趨勢。
(一)勞動工資統計數據控制思路
由于對農業職工的平均工資進行全面統計是不可能的,為了保證統計數據質量,力爭在趨勢上把握農業職工平均工資的水平,我們為農業職工工資確定一個區間,保證所上報的數據不偏離甚至背離正確的趨勢。以黑龍江墾區年報210表第一產業人均純收入為基礎,來估算年報202表農業(農、林、牧、漁業,下同)平均工資,給農業職工工資確定下限和上限。
(二)具體控制辦法
1.確定下限。
農業人口是墾區轄區內直接從事農業生產的常住人口,以戶主為準,家庭其他成員也算做農業人口。換而言之,農業從業人員從農業生產中獲得的收入供養轄區內的人口,若用農業人口數除以農業從業人員得到一個系數K1,根據墾區近幾年的年報數據計算出此系數K1,那么K1×a(a為黑龍江農墾年報制度“農場職工家庭人均純收入調查表”中的指標家庭經營收入與工資性收入的和)就是農業在崗職工平均工資的下限。對于系數K1,可以理解為每一個農業職工所能扶養的家庭人口數。從事農業生產的每個農業職工和每個其他從業人員從單位土地(或其他)上得到的收入可以說是相同的(去除個別因素),農業職工和其他從業人員家庭成員構成上大體相同,這樣每個農業職工所能扶養的家庭人口轉換為每個從業人員所能扶養的農業人口。系數K1可以得到,用系數K1與a乘積就是平均每個家庭從第一產業得到的純收入,而這個純收入是由該家庭農業職工所創造的。
2.確定上限。
用農業人口減農業其他從業人員的差除以農業職工作為系數K2,系數K2代表每一個農業職工的收入既供養其家屬又供養其他從業人員的家庭成員,實際的農業職工平均工資應小于K2與第一產業人均純收入的積。這樣就確定了區間的上限。
三、對農業勞動工資統計數據控制辦法的驗證
我們用墾區2007-2012年數據進行測算后,計算得到下限系數K1為1.8,上限系數K2為2.4。我們用墾區某農場2012年全年數據進行了驗證,結果是科學合理的。2012年該場人均純收入31906元,從農場人均純收入構成來看,其中農業人均純收入14950元,占總收入的47%,財產性收入和轉移性收入4124元,占總收入的13%;家庭經營純收入20521元,占總收入的64%。依據人均純收入調查表推算農業從業人員勞動報酬是可行的,該場人均純收入31906元,農業人均純收入14950元,農業在崗職工工資應該在26910-35880元之間,是比較合理的、是可行的。
作者:于傳文單位:黑龍江農墾工業學校