fbpx

會不會說故事,差了 1200個人的生存機會

會不會說故事,差了 1200個人的生存機會

~ 《#資料故事時代》 如何更有效地用數據說故事

幾個月前,我讀了一些遊戲產業報告,在自己臉書牆上分享了兩個觀察,分別是誰在課金,以及哪些遊戲類別吸金能力更好。兩個都做了圖,兩組圖上都寫了摘要,迴響卻差了8倍以上。

關於誰在課金、課多少、多少是多,親朋好友們熱烈的討論,連很少玩遊戲的認真老師妹妹都分享她花了近萬元在寶可夢拼輸贏的親身體驗。但是說到整個市場哪類遊戲大家花更多錢,一次花多少錢,哪些的年增幅更大,卻只獲得禮貌的“恩…”

為什麼會這樣?

哪些人花錢多只花了我幾十分鐘讀報告跟畫圖,

哪類遊戲課金多單價如何增長如何卻是好幾個小時。

迴響卻完全相反。

.

在《#資料故事時代》中,Brent Dykes講了很多跟用資料講故事有關的事情,其中有一組比我的體驗更戲劇化:

一個錯過了拯救1200個產婦的機會,另一個則讓729個士兵免於傷亡。

.

第一個,是1846年在維也納,有個叫 Ignaz Semmelweis的年輕醫師。

他所在的第一診所產婦死亡率是9.9% :10個進去就有1個走不出來,連帶剛出生的小孩也被感染過世。我們可能以為那是兩世紀前的常態,其實並不是。當時同在維也納的第二診所,死亡率只有4.5%,是第一診所的一半不到。

第一診所的經費還有條件比第二診所差嗎?也不是。第一診所是培育醫師的診所,第二診所是培育助產士的。第一診所的各項條件其實第二診所比較好。

那怎會這樣?整個診所的醫師都在找原因。

Semmelweis 正好有同事在解剖時意外感染身亡,他在悲痛之餘為過世同事做了解剖,發現狀態與許多過世的產婦相近。

他大膽假設,問題可能出在被屍體感染;於是推動其他年輕醫師們,接生前務必先用消毒藥水充分清洗雙手後才開始接生;死亡率很快就降到1% 以下。

他欣喜若狂地到處宣揚自己的發現,想推廣到整個醫院。

醫院大佬們卻不樂意了:死亡可能原因那麼多,你只是運氣好,憑什麼往自己臉上貼金,還要我們配合?

爭論越演越烈,第一診所解雇了Semmelweis。

在首都維也納找不到工作的他,只好回到家鄉匈牙利;但他不是個容易放棄的人,十多年的沈潛後,出版了五百頁的關於產婦感染的巨作,並在裡面用數據與事實證明自己的看法,啪啪打臉醫界大老。

打臉有多大力,霸凌就有多強烈。Semmelweis這次不只是被維也納第一診所的醫師們排擠,他被整個歐洲醫學界嘲笑:你怎麼會以為問題就只是洗手?受不了強烈的霸凌,Semmelweis被送入精神病院,並且很快在裡面過世。

2008年,有人把他論文中提到的65年死亡率數據比較重新繪圖,還給他一個公道:

1823年前,維也納診所的產婦死亡率與都柏林相仿都是3.5%以下,但自從開始做病理解剖案後,維也納第一診所產婦死亡率飆高到了8%甚至15.8%,只有在Semmelweis推廣洗手期間有效下降。

Semmelweis的數據的確能啪啪打臉醫界,但一來他沒有善用自己的盟友(那些年輕醫師們),二來他沒有學會把自己的數據用圖表表達,而是堅持用說服難度高的數據表格,抱著只要事實是不證自明的念想,最終不但在47歲就早早辭世,也喪失了拯救1200名產婦性命的機會。

.

另一個讓我們看到數據洞察之美的,則是南丁格爾與他的玫瑰圖。

南丁格爾是在1854年克里米亞戰爭時,帶領護士團隊在戰地醫院工作。

她發現戰爭期間因為感染死亡的患者數量遠高於因為傷重而死亡的數量。換句話說,改良戰地醫院的衛生條件,能拯救的性命可能不亞於一組好的後勤。

問題是怎麼把這個發現傳達給決策階層?南丁格爾除了是護士,還是個統計學家。她使用圓形的直方圖,讓閱讀者很容易看出來,從1854年4月到隔年3月,不斷擴大的圓圈主要來自淺藍色區域,也就是因為感染造成的死亡。

南丁格爾的洞察主張與統計圖表強而有力,很快就獲得大量的傳播與行動響應,克里米亞戰爭後,他改善了印度的醫院環境,讓死亡率從6.9% 下降到1.8%,拯救了729名士兵。

這個逐漸盛開的圓形直方圖,有個漂亮的名字叫做玫瑰圖。而南丁格爾也在這過程中獲得英國皇家統計學會的肯定,打破不收女性會員的傳統,收他為會員。

南丁格爾以一己之力開創了近代護理專業,他本人也獲得了包含皇家紅十字勳章等榮譽,最後以90歲的高齡過世。

.

47歲與90歲,1200個沒被拯救的產婦以及729個被救回來的士兵,是會不會用數據圖表說故事帶來的差異。

.

《#資料故事時代》的Brent Dykes 不但用神經學與心理學解釋了為何故事比數據更有力,更解釋了該如何剪裁數據圖表,讓讀者更容易理解

  1. 去除雜訊:資料新手最容易踩到的坑,就是以為儀表板等於洞察。其實儀表板的數字充滿各式各樣的雜訊,例如折線圖中十來條線只有三條有代表意義,剩餘的都是類似的走勢;又例如超過5個分類的圓餅圖沒有解讀的價值,合併細項後留下4-5個比較妥當。
  2. 使用比較:為什麼業績逐月上升可能是問題數字?當我們跟獲客速度比,當獲客速度上升遠超過業績上升比例。代表的每個單位客戶貢獻持續下降。沒有比較沒有傷害啊。
  3. 增加輔助:有些圖表加上參考值、指引線、或是凸顯區塊會更容易讀。最常見的案例就是:為什麼業績創新高老闆卻不滿意?因為跟目標比仍遠遠落後啊。
  4. 提供脈絡:資深的數據分享者應該有經驗,圖表也做得盡善盡美、參考值輔助線也都到位了。但聽眾的大腦就是沒跟上,怎麼回事?有時候是我們忽略了要創造共同的脈絡、參考值。例如前面提到的客戶貢獻度持續下降的案例,單放這個折線圖看起來固然乾淨利落,但業務經理心中記得的是業績蒸蒸日上。如果能把兩個圖放在一起,更能強化“儘管業績蒸蒸日上,但都是來客量換來的,客單價其實是持續下降。我們還有很多該努力的!”

去除雜訊、使用比較、增加輔助、提供脈絡

.

回到我的兩個圖表,雖然都把數據轉成圖了。但一個更有共鳴,另一個則不上不下,踩到的坑還真不少呢。

談起哪些人課金更多的,容易引起共鳴(是我嗎是我嗎?)以及行動(那多花一點錢也沒關係了);

分析哪類遊戲能賺更多以及賺得比前一年多的,卻不上不下:對專業人士而言太淺又沒有行動建議,對一般人來說又沒啥好關心的(讀者OS:所以我是該高興自己玩角色扮演遊戲卻花錢花得比較少嗎?)。

.

對這個領域熟悉的人會覺得這些主張不陌生,其實從英文書名《Effective Data Storytelling》 也可以猜到這是個美國強大的數據分析分支,台灣之前賣得很好的《Google必修的圖表簡報術》《哈佛教你做出好圖表實作聖經》,都是相同體系。

本書英文版的推薦人星光熠熠,從MIT麻省理工學院管理教授又曾任賭場總經理的Thomas H. Davenport,到近年來新書不斷的Bill Frank 以及 Alberto Cario ,各個的資料科學與數據分析相關著作在Amazon 的書評都是本本4顆星起跳。

不看這些推薦人,作者架設的網站有很多延伸素材都值得去逛逛下載。繁中翻譯得不錯,故事又好讀。很推薦不管是數據專業或者是任何一種專業但覺得同事或者平行部門不知欣賞與理會的人看看,也都會很有啟發。