關於臺灣選舉中民調那些事

愈臨近選舉,各種民調也就愈令人眼花撩亂。眾皆曰,蔡英文在初選民調作弊,陳水扁甚至公開嗆曰,五家民調公司數據幾乎一致,肯定是民進黨中央提供給民調公司的“母體”出了問題。什麼是“母體”?觀察民調又應該具備哪些基本知識?

首先對一些關鍵名詞進行解釋。

關於臺灣選舉中民調那些事

母體與樣本

在學理上,母體(population)意指研究對象全體所構成之集合。以選舉民調為例,臺北市有合格選民220萬,市長支持度民調的母體就是這220萬人。

所謂樣本(sample),學理意義就是從母體選取一些代表性子集合,一般而言,隨機抽出母體約1000-1200位選民,這些受訪者便是樣本。

母體是民調可信度的基礎,若民調公司手上的母體(受訪者名單)有所偏差,其結論便無可能正確可信。

普查與抽樣

普查(census)意指對所要研究的某種現象進行全面性調查。此法曠日廢時,所費不貲,但所獲得資料較為完整可靠。

抽樣(sampling)意指對所要研究的某種現象進行部分調查,此法省時省力省錢,但抽樣品質深度影響結論的可靠性。

一般即時性民調,無法做到深度而詳細的普查,因此皆為抽樣。抽樣要做到貼近事實並不容易,以全區域性選舉為例,每個縣市的選民結構不同,做抽樣就依賴該地區樣本名單是否貼近選民結構,否則誤差值會過高。

舉例,檢查一箱長途運送的橘子完好率,抽樣不能只取接近箱子頂部的橘子,因為最可能損壞的是箱子底部的橘子。

有效樣本數、抽樣誤差、信賴區間、信心水準

有效樣本簡單說就是指可信的樣本,抽樣誤差的存在乃因母體中不可避免的特殊樣本,以上兩者皆有統計學上的複雜公式,此處不細表。

反覆投擲銅板,出現正面的機率為p,若投擲n次得到X次的正面,則p大約可用X/n來表示。但是由於p不可能完全等於X/n,因此研究機率者會給p一個範圍,也就是區號水準(以百分比表示)。d則是抽樣誤差。

因此,有效樣本數應為多少,取決於抽樣誤差與信心水準,三者連動。信心水準是研究者所定的數據,一般被定為95%。再者,抽樣誤差愈小愈好,一般被定為正負3%以內,由此反推有效樣本數。

看民調時,通常有效樣本數是1068份以上,便是按照抽樣誤差與信心水準的數據反推出來的。

按常理,有效樣本愈多,誤差愈小,但因為其投入的成本過大而難以實現,因此民調必然要容許誤差,以降低有效樣本數。

取得1000份有效樣本,並非受訪者只有1000人,依據母體的規模與複雜度不同,採樣的規模也不同。有時甚至需要採樣上萬份資料,才能篩選出1000份有效樣本。

分層抽樣與機構效應

抽樣方法很多,於此不一一細表,選舉民調一般採取隨機抽樣,並也搭配分層抽樣。隨機抽樣很好理解,什麼是分層抽樣?

舉例,教授想調查某大學學生的消費傾向,設使母體有5000人,為了讓結果更貼近真實,教授分年級採取抽樣,一年級有2000人取樣200人,二年級1500人取樣150人,三年級1000人取樣100人,四年級500人取樣50人。按照母體中不同屬性族群分開處理分別觀察,即稱為分層抽樣。

上述針對各縣市選民結構不同的民調方式,便應採取分層抽樣的方法,較能得出可信的數據。一般而言,政黨內部所做的選區參考民調,就必須精細到分層抽樣。若是全島性選舉民調,即便是公開的民調也會採取分層抽樣,方能證明其可信度。

機構效應意指做民調的機構因自身立場而對數據產生的干擾,例如,一個“反核”團體做能源政策的民調,能否得出“擁核”支持度較高的數據,基本是可疑的。因為該民團大可在可控範圍內,從母體、有效樣本、抽樣方法、題目設計上誘導出有利於“反核”信念的數據。

由於機構效應的存在,選舉民調嚴重受到干擾,政治立場五花八門的機構,各自做出影響選情的民調,也就不足為奇。“九合一”選舉,凡是政治立場偏綠的民調機構,皆做出與結果偏差度極大的數據,連美國人都上當,即可證明此現象難以消弭。

手機民調爭議

傳統民調採取市話訪問的道理在於,市話(電話簿為母體)可確認受訪者所在區域,有利於分層式抽樣方法,且較為省時省錢。然而由於進入手機時代,室內電話數持續減少,且一般接聽市話者年齡層偏高,因此為了民調的正確性,民調機構逐漸嘗試採用手機民調與市話民調結合產生數據。

不過,手機民調存在缺點:其一,無法確認受訪者所在區域;其二,受訪者接聽電話的當下狀態較為複雜,因此成功受訪率降低,費時費錢;其三,手機受訪者難以確認其年齡,由於年輕選民會得到加權,因此有新的受訪者可謊報年齡,以影響民調結果;其四,有心者可以大量收買手機門號,以確保自己參加民調的機率,組織性影響民調結果。

由於以上缺點,手機民調並未被廣泛使用,所有相關機構都缺乏有效的經驗法則以規避以上風險,簡言之就是容易作弊。不過,由於有市話者不到七成,為求民調的全面性,採納手機族勢在必行,只是比例尚不宜高於市話,方乃持平之論。

以民進黨初選民調為例

陳水扁說打死也不信這次民進黨初選民調,理據是五家民調公司的數據高低差過於整齊,如蔡英文得票率都維持在34%-36%,賴清德都維持在26%-28%。這說法大方向無誤,但容有斟酌空間。

在一般狀況下,各民調公司掌握的母體不會完全一致,所以得出的數據理應有所落差,不可能整齊。綜合多家掌握不同母體的民調公司數據所得到的平均數,是一般較為可靠的做法。如網路上長期整合民調的“無情真實的未來預測”,就是綜合各家民調以預測結果的單位。

由於這次民進黨初選的母體由黨中央提供,五家公司拿到的名單都一樣,因此得出的數據理論上本來就不會相差太遠,因此嚴格說來,母體確實出現問題沒錯,但民調公司並沒有作弊,作弊的是提供母體的民進黨中央。

既然手機民調容易作弊,比例高至50%,其母體必然大有問題,尤其最大電信公司是半公股,根本是蔡英文當權派可以掌控的對象。這便是為何在民調展開前,便有挺蔡者預言8%差距,萬分準確的緣故。

其實,光是蔡賴差距“剛好”高於正負誤差範圍,即見此份民調作弊斧鑿明顯。

如何判斷負責可信的民調

確認民調的可信度,有如下標準:

1. 該機構長期做民調,有歷史資料可供查閱其數據變化的軌跡。

2. 詳細載明母體、樣本、加權、抽樣方法、題目與將近交叉分析者,可信度愈高。

3. 機構效應愈低者,可信度愈高,反之則愈低。

調查機構若是媒體,較為可信的民調機構如: TVBS、東森、聯合報、遠見、“美麗島電子報”、臺灣指標民調(風傳媒)均有一定可信度。

一般民間機構較為可信者為山水民調、典通民調、趨勢民調、循證民調,以上皆為親綠人士成立,但具有歷史資料可供查詢其公信力。

大學機構由於較具客觀性因此保有一定可信度,如政治大學、世新大學。

民情變化快速,民調雖為統計科學,但其中變數甚多,沒有哪一家民調機構不會出錯,但因為這已經成為一門有利可圖的生意,正規盈利的民調機構,會比較在意自己的公信力,特意作弊的狀況較為少見。

反而是那些有政黨色彩的各種基金會,以民調帶風向的成分居多,基本不可信。

今年選情空前複雜,致使民調公司大發利市,對關切選情的民眾而言,長期觀察,避免偏看偏聽,注意檢查機構是否詳列必要資訊,參考歷史資料驗證機構可信度,方能得到比較正確的趨勢見解。

相關推薦

推薦中...