編者按:這是張,他介紹如何制作圖表。作者是尤金·衛(wèi),亞馬遜戰(zhàn)略規(guī)劃部的第一位分析師(后來擔(dān)任Flipboard和Hulu的產(chǎn)品負(fù)責(zé)人,Oculus的視頻負(fù)責(zé)人)。
第一部分:經(jīng)驗(yàn)
我的第一份工作始于Amazon.com。我是戰(zhàn)略規(guī)劃部的第一位分析師,接手了分析包的工作。之所以專門做資本化,不僅是因?yàn)樗且粋€(gè)嚴(yán)肅的工具,讓我們的業(yè)務(wù)清晰起來,更是因?yàn)樗鹪碌纳a(chǎn)工作,統(tǒng)治了我一年多的一生。
1997年,分析甚至不是一個(gè)真正的詞。我知道是因?yàn)槲以囍フ倚g(shù)語,希望能找到我想做的事情,但是我找不到,無論是字典里還是網(wǎng)上都找不到?;叵胍幌履銊傞_始大規(guī)模使用互聯(lián)網(wǎng)的時(shí)候,一般搜索引擎返回的結(jié)果很少,你會(huì)意識(shí)到自己老了。那時(shí)候,智慧還藏在新聞組里,雅虎還要手工整理網(wǎng)頁目錄,很多Google搜索也沒什么結(jié)果。當(dāng)時(shí),如果俄羅斯人想干涉選舉,他們可能會(huì)把一些故事放進(jìn)娛樂藝術(shù)漫畫里,激怒一些極客,但這是唯一的辦法。
雖然這個(gè)詞沒有定義,但不難猜出是什么。某種名詞形式的分析。此外,分析包本身就說明了一切。真的。它會(huì)附帶一頁的后記,總是有簡短的前言來闡明目的,然后跳轉(zhuǎn)到一個(gè)文本摘要,其中的信息與論文摘要的形式相同,或者是給股東的一封信。我想貝佐斯多年后創(chuàng)立的著名公司政策,即支持張文禁止PPT的做法,可能在當(dāng)時(shí)的《分析包》后記中找到一些淵源。他們的靈感都是一樣的:如果你不能用書面語言解釋清楚一件事,你自己真的理解了嗎?
我面試過程的最后一部分花了一個(gè)小時(shí),面試官是當(dāng)時(shí)負(fù)責(zé)招聘的萊恩·索耶。在經(jīng)歷了許多挑戰(zhàn)之后,包括幾乎所有的高級(jí)管理人員和我一生中預(yù)見到的最好的人,比如貝佐斯和喬伊·科維,我認(rèn)為這個(gè)不可避免的人力資源面試只是一種形式。但是后來瑞安讓我用他能理解的方式解釋我能理解的最復(fù)雜的事情。為我的工作熱身。
分析包包含哪些需要書面解釋的內(nèi)容?圖表,一頁一頁的圖表,亞馬遜業(yè)務(wù)各個(gè)方面的圖表。收入、時(shí)評(píng)、營銷、運(yùn)營、客服、人員配備、G & A、客戶感知、市場(chǎng)滲透、客戶生命周期價(jià)值、庫存周轉(zhuǎn)率。通常一頁有四張圖片,橫向布局。
如果分析本身是一個(gè)名詞,包裝這個(gè)詞似乎有點(diǎn)麻煩。但是如果你看過其中一個(gè),你就知道為什么叫Package了。當(dāng)我1997年去亞馬遜時(shí),分析包大約有30到50頁的圖表。一年后我轉(zhuǎn)行做產(chǎn)品管理,已經(jīng)擴(kuò)展到100頁了,還在做客戶訂單趨勢(shì)的失敗報(bào)告。分析可能指的是可交付分析或分析實(shí)踐,但分析包就權(quán)重而言就像一本電話簿或恢復(fù)硬件公司的目錄。
當(dāng)時(shí),公司沒有專注于開發(fā)內(nèi)部儀表板和分析工具,因此分析包是由以我們今天的標(biāo)準(zhǔn)來看似乎完全過時(shí)的東西組成的。我把數(shù)據(jù)手工輸入Excel,生成圖表,調(diào)整版面,然后打印成冊(cè)。
整件事最糟糕的一點(diǎn)就是把頁碼弄對(duì)了。分析包的背后是一個(gè)完整目錄的鏈接電子表格。由于不同的圖表來自不同的工作簿,我必須打印出整個(gè)分析包,對(duì)其進(jìn)行排序,然后通過一些模糊的打印設(shè)置菜單手動(dòng)插入頁碼??傊?,確保頁面按預(yù)期排序就像拆炸彈一樣。
到目前為止,公司墻上掛著平板電視,不間斷地顯示各種圖表。大部分都沒人注意。時(shí)刻保持透明沒有錯(cuò),但對(duì)人性的理解沒有錯(cuò)。我們忽略任何時(shí)候都能看到的東西。但是,如果你每個(gè)月在桌面上扔一大摞圖表,加上一個(gè)總結(jié)結(jié)果的后記,如果CEO和你的同事在同一天收到了同一個(gè)報(bào)告,同事報(bào)告里要包括你那部分業(yè)務(wù)的運(yùn)營情況,你肯定會(huì)關(guān)注,就像任何人都會(huì)關(guān)注一本關(guān)于自己公司的書的索引里有沒有提到自己一樣。儀式很重要。
該報(bào)告將發(fā)送給全公司的高級(jí)經(jīng)理。學(xué)長的定義一開始是以職級(jí)為基礎(chǔ)的,但就像職場(chǎng)上大多數(shù)事情的趨勢(shì)一樣,誰加入分配就成了每月競(jìng)爭的來源。可能有人會(huì)懷疑這是我的想法,因?yàn)槭俏易龅陌l(fā)行,但其實(shí)我在意這個(gè)是因?yàn)槊總€(gè)月都要打印復(fù)印紙質(zhì)版。
現(xiàn)在我已經(jīng)很少用復(fù)印機(jī)了,但那一年我用的次數(shù)比我前后所有日子加起來還多,所以我可以很自信地說,這些機(jī)器是人類制造過的最不可靠的機(jī)器之一。
這是一個(gè)游戲,它唯一的目的就是減少痛苦。一百份一百頁的文件。復(fù)印機(jī)復(fù)印時(shí)會(huì)出故障。過一會(huì)兒,紙就會(huì)卡住。墨盒將耗盡墨水。你愿意一次冒多少份的風(fēng)險(xiǎn)?太少了。您必須再次重復(fù)設(shè)置過程。太多可能會(huì)有中間出錯(cuò)的風(fēng)險(xiǎn),而這又會(huì)變成一系列更復(fù)雜的任務(wù),比如只復(fù)制剩下的沒有復(fù)制的,和之前已經(jīng)完成的合并。(如果你想知道我為什么手動(dòng)插入頁碼,不僅僅是為了方便引用具體的圖表,也是為了在復(fù)印機(jī)壞了的時(shí)候找出哪個(gè)文檔缺了哪一頁。)
當(dāng)然,你也可以在清除卡紙后恢復(fù)打印,但事實(shí)上這種方法從未奏效。后來才知道,這種量級(jí)的卡紙,復(fù)印機(jī)是永遠(yuǎn)無法挽回的。
我成了總部所有復(fù)印機(jī)的大師。我知道哪些復(fù)印機(jī)可以承擔(dān)這個(gè)繁重的任務(wù),也知道每一臺(tái)的可靠性。我對(duì)每臺(tái)機(jī)器的可靠性、使用情況和最后維護(hù)時(shí)間的波動(dòng)了如指掌。由于我平時(shí)每天加班到很晚,所以我會(huì)把大規(guī)模的復(fù)印任務(wù)保存到最后,因?yàn)楫?dāng)時(shí)整棟樓的復(fù)印機(jī)都可以由我支配。
有時(shí)候只是聽復(fù)印機(jī)內(nèi)部復(fù)印滾筒和發(fā)動(dòng)機(jī)的聲音,就能看到卡紙。有問題的機(jī)器會(huì)打呼嚕,就像抽煙的人一樣。復(fù)印機(jī)為我服務(wù)時(shí),有時(shí)我會(huì)把手放在機(jī)器上,就像醫(yī)生把手放在病人身上一樣。我會(huì)稱自己為復(fù)印機(jī)竊竊私語者,但當(dāng)我與他們打交道時(shí),我總是反復(fù)詛咒,從不耳語。后來在分析師任期結(jié)束的時(shí)候,我拿到了預(yù)算,每個(gè)月雇一個(gè)臨時(shí)工幫我完成打印工作,因?yàn)槲覀兌汲惺苤鵁o休止的勞動(dòng),我們還有聯(lián)系。
我痛苦的另一個(gè)來源是另一個(gè)工具的極端脆弱性:Excel 97鏈接表單。直到今天,我還是Excel的粉絲。Excel是微軟Office套件中最好的工具,如果你從事的是正經(jīng)工作的話,它依然是世界頂級(jí)的電子表格工具。但是我永遠(yuǎn)忘不了Excel 97鏈接工作簿的噩夢(mèng),理論上看起來是個(gè)很有前途的想法,但實(shí)際上完全不一樣。
為什么不在一個(gè)巨大的工作簿中完成呢?不同的部門必須為不同的圖表提交數(shù)據(jù),所以多人同時(shí)在同一張Excel表上工作是一件很糟糕的事情。找出誰的改變被卡住了,整個(gè)比較的過程是不可持續(xù)的。所以我為不同的部門設(shè)置了Excel工作簿。我會(huì)自己收集和輸入一些數(shù)據(jù),而有些部門有更年輕的員工,他們有時(shí)間和資金來輸入和維護(hù)自己組織的數(shù)據(jù)。
甚至這個(gè)過程在很多地方都會(huì)出錯(cuò)。當(dāng)我試圖豎起護(hù)欄來保持鏈接所有工作簿的公式時(shí),從單元格保護(hù)到粗體到指示可編輯單元格的條件格式等。,沒有一個(gè)電子表格能在到達(dá)普通用戶之后存活下來。有人會(huì)在這里插入一行,在那里插入一列,或者誤刪一個(gè)公式。在一個(gè)月內(nèi),用戶可以更改工作表的名稱,或者添加以前從未在季度中出現(xiàn)過的匯總列。突然,到處的單元格上出現(xiàn)一堆#錯(cuò)誤,或者你運(yùn)氣不好,數(shù)字還在,但是錯(cuò)了,你沒有意識(shí)到。
所以每個(gè)月都要用一部分時(shí)間來檢查每一個(gè)電子表格,修復(fù)有問題的鏈接和指針,重新建立圖表中已經(jīng)丟失的表格鏈接,甚至更陰險(xiǎn)的隱患,比如表格鏈接正確但表格區(qū)域鏈接錯(cuò)誤的情況。
但即使做到了這一切,有時(shí)表格計(jì)算也會(huì)出現(xiàn)問題。命中注定。這是電子表格的原理,唯一的錯(cuò)誤只能是用戶錯(cuò)誤。我的主工作簿中的一個(gè)單元格指向另一個(gè)工作簿中的一個(gè)單元格。他們的價(jià)值觀應(yīng)該是一致的。然而,當(dāng)我打開兩個(gè)工作簿時(shí),一個(gè)顯示現(xiàn)實(shí)1345,另一個(gè)顯示1298。強(qiáng)制所有單元格重新計(jì)算的關(guān)鍵是F9。我反復(fù)按過。有時(shí)候重新計(jì)算有用。有時(shí)候不會(huì)。有時(shí)候我會(huì)嘗試ctrl-alt-shift-F9。有時(shí)候只能祈禱。
我唯一一次上班哭是有一天晚了,當(dāng)時(shí)我媽剛死于癌癥,左腿因?yàn)榍敖徊骓g帶/MCL疝氣手術(shù)做了石膏。當(dāng)我無法理解為什么我的練習(xí)冊(cè)參差不齊時(shí),我的意志力崩潰了,我決定投降。這不是循環(huán)引用,但我知道只要我繼續(xù)研究,還是可以解決的,至少如果是工作簿中的循環(huán)引用,最終是可以解決的。不是,Excel 97鏈接工作簿的固有漏洞是一個(gè)不相信的程序中的隨機(jī)缺陷,感覺自己好像是整個(gè)宇宙中最倒霉的一個(gè)。
我想離開辦公室,但是我太累了,不能拄著拐杖走遠(yuǎn)。當(dāng)時(shí)周圍沒人。我關(guān)掉電腦和燈,躺在桌子上,直到那一刻過去。然后重啟電腦,打開兩個(gè)工作簿,看著有問題的兩個(gè)單元格。他們還是不一致。我按了一次F9。這次匹配了。
很多時(shí)候,當(dāng)我在半夜抄完所有的Analytics Package,然后用小的,然后是中的,最后是大的活頁夾把材料夾在一起的時(shí)候,我會(huì)把大部分的復(fù)印件拿在手里,放在每個(gè)收件人的桌子上一份。從我的辦公桌到辦公室是一個(gè)受歡迎的休息時(shí)間。也許我可以停下來和一個(gè)還在熬夜的同事談?wù)?。感覺自己像個(gè)按固定路線送報(bào)紙的人,經(jīng)常同時(shí)起床。
雖然分析包給我留下了很多痛苦的記憶,但我仍然認(rèn)為它是對(duì)我的職業(yè)生涯產(chǎn)生巨大影響的經(jīng)歷之一。在做報(bào)告的過程中,我感覺我們企業(yè)的整個(gè)組織都在我面前,它的復(fù)雜程度和內(nèi)部工作一目了然。同樣,我想象一下程序員把數(shù)據(jù)表變成3D圖表的數(shù)據(jù)可視化過程。我可以跟蹤從客戶何時(shí)想買書到一美元如何在我們企業(yè)內(nèi)部流動(dòng)的整個(gè)過程。我知道每一個(gè)員工的工資,從經(jīng)銷商到我們的倉庫,從貨架到傳送帶,然后打包放在運(yùn)輸車上。我知道每個(gè)訂單的時(shí)間成本。我和職業(yè)賭徒一樣,可以預(yù)測(cè)每100單會(huì)有多少客戶向我們投訴,有什么樣的問題。
我知道如果我們每個(gè)月都能獲得一個(gè)客戶,他的家人和朋友中有多少人會(huì)在下個(gè)月通過口碑成為新客戶。我知道如果客戶在1998年1月100日完成第一筆訂單,2月、3月等會(huì)有多少人再次下單。,每個(gè)訂單的平均金額是多少。隨著我們的發(fā)展和影響力的提高,我可以看到與出版商和經(jīng)銷商談判更長的周轉(zhuǎn)天數(shù)對(duì)我們現(xiàn)金流的影響。我還可以看到,每次我協(xié)商更好的標(biāo)價(jià)折扣,我們的毛利都會(huì)逐漸增加。
生活在高頻交易和正態(tài)分布的領(lǐng)域,生活在大數(shù)定律主導(dǎo)的領(lǐng)域是多么愜意??!每月觀察人們的書籍(以及后來的CD和DVD)的一致性和可預(yù)測(cè)性,就像在顯微鏡下識(shí)別自然界中的一些晶體結(jié)構(gòu)一樣。我不羨慕Snapchat或者Twitter或者Pinterest這樣的公司,不羨慕已經(jīng)上市或者有一天可能上市的社交網(wǎng)絡(luò),也不羨慕從事社交網(wǎng)絡(luò)業(yè)務(wù)的公司。當(dāng)他們的網(wǎng)絡(luò)如此之大,但仍然如此不穩(wěn)定(甚至更多的收入流)時(shí),他們必須管理投資者的預(yù)期。社交網(wǎng)絡(luò)的指數(shù)級(jí)增長當(dāng)然有趣,但如果你是Twitter,如果你試圖向投資者解釋為什么你每個(gè)季度都沒有實(shí)現(xiàn)目標(biāo),那就沒意思了。當(dāng)你假裝知道一個(gè)季度后你的收入會(huì)是什么樣子,更別說兩三個(gè)季度后的情況了,事情就沒那么有意思了。
在亞馬遜,我可以卡出我們下個(gè)月及以后的未來收入,誤差只有幾個(gè)百分點(diǎn)。唯一需要做的決定是,我們要告訴華爾街我們的預(yù)測(cè)數(shù)字是多少。那時(shí),我們總是低估我們的收入(低估),因?yàn)槲覀冎澜Y(jié)果會(huì)超過預(yù)期(超額)。唯一的問題是我們應(yīng)該預(yù)測(cè)多少收入,在下一次財(cái)務(wù)報(bào)告會(huì)上仍然讓大家感到驚訝,而且這種驚訝是可靠的。
我們對(duì)自己業(yè)務(wù)的理解繼續(xù)超過我曾經(jīng)工作過的任何公司。這主要是因?yàn)樨愖羲箤?duì)細(xì)節(jié)的要求。沒有人能像最高領(lǐng)導(dǎo)人那樣設(shè)定責(zé)任的標(biāo)準(zhǔn)。大部分功勞歸于喬伊和我的經(jīng)理基思,他們將分析包作為戰(zhàn)略規(guī)劃部門的核心任務(wù)之一。Keith把我推到Tufte,改變了一切。更大的功勞歸于所有幫助收集業(yè)務(wù)各方面隱晦數(shù)據(jù)的人,以及那些負(fù)責(zé)部門相關(guān)職責(zé)的同事,他們很多人都為自己的領(lǐng)域建立了自己的模型,并定期維護(hù)更新,因?yàn)樗麄冎牢颐總€(gè)月都會(huì)上門給他們出問題。
我相信這一點(diǎn),因?yàn)閱桃亮私馕覀儤I(yè)務(wù)的每一部分,也了解幾乎每一個(gè)區(qū)塊運(yùn)營商,甚至更了解。她是為數(shù)不多的能夠捍衛(wèi)和主動(dòng)的首席財(cái)務(wù)官之一。我見過的幾乎每個(gè)CFO都是一樣的;始終嚴(yán)格控制開支,采取財(cái)務(wù)保守主義,對(duì)任何大膽的財(cái)務(wù)事項(xiàng)都投以懷疑的目光。這些Joy可以比下一個(gè)做的更好,但是她在辦公室的時(shí)候會(huì)督促我們多花錢,熱情不亞于貝佐斯。像很多夢(mèng)想中的CEO一樣,她知道有時(shí)候最好的防御就是攻擊,尤其是在贏家通吃、先發(fā)優(yōu)勢(shì)、網(wǎng)絡(luò)效應(yīng)主導(dǎo)的互聯(lián)網(wǎng)市場(chǎng)。
我仍然感到驚訝的是,有這么多公司不幫助員工理解他們自己企業(yè)的數(shù)字工作。新員工可能已經(jīng)接受了入職培訓(xùn),了解了一些公司文化、旅行政策、供應(yīng)柜在哪里,也許還討論了任務(wù)陳述。當(dāng)然,這些都是有價(jià)值的。但是入職教練最后一次展示公司的圖表是什么時(shí)候?我們是否不信任員工的計(jì)算能力?還是他們害怕這種激進(jìn)的透明會(huì)壓倒他們?后者可能是一種控制機(jī)制,一種“用你那一點(diǎn)點(diǎn)腦力都不在乎這些數(shù)字”專心解決自己問題的態(tài)度?
光知道數(shù)字是不夠的,但正如《金錢球》一書所清楚解釋的那樣,這樣做將揭示隱藏的真相和未知的價(jià)值向量(例如,在比利·比恩和奧克蘭A的例子中,它是基礎(chǔ)利率)。直到今天,人們還經(jīng)常說亞馬遜這么多年都賺不到錢,好像是龐氏騙局一樣。1997年的一個(gè)深夜,剛到公司沒幾天,我通讀了大概三四遍最新的Analytics Package,知道了我們隱藏的真相:所有關(guān)于亞馬遜無利可圖的商業(yè)模式的說法都是謊言。如果我們的利潤沒有用來再投資公司,我們從投資者那里得到的錢沒有用來投資那些投資,我們的行為無異于自殘。唯一限制我們潛力的是我們有多么雄心勃勃。
第二部分:經(jīng)驗(yàn)
這和圖表有什么關(guān)系?入職一兩個(gè)月后,我的經(jīng)理讓我去參加一個(gè)剛剛在西雅圖舉辦的講座。這是一整天的課程,內(nèi)容圍繞一本書的智慧展開,作者講課。這本書叫做《定量信息的視覺展示》,是Amazon.com最后一本超級(jí)暢銷書。在亞馬遜之前的時(shí)代,屬于長尾類型,可能還是幾本參考書。這本書的作者是愛德華·塔夫特。我很難一下子列出我讀過的最重要的書,但這本是其中之一。
我的經(jīng)理要求我參加講座,這樣我就可以將那本書的原則應(yīng)用到分析包的圖表中。我的書還在我家的書架上,是我最推薦給同事的書。
這篇文章太啰嗦了,沒有進(jìn)入正題。Tufte的書正好相反。它在開始時(shí)簡要總結(jié)了它的關(guān)鍵原則。
優(yōu)秀的統(tǒng)計(jì)圖表應(yīng)該能夠清晰、準(zhǔn)確、有效地表達(dá)復(fù)雜的思想。圖形演示應(yīng)該:
展示數(shù)據(jù)誘導(dǎo)觀看者思考實(shí)質(zhì)而不是方法論、圖形設(shè)計(jì)、圖形制作的技術(shù)或者其他避免扭曲數(shù)據(jù)必須說明的東西在很小的空間內(nèi)呈現(xiàn)很多數(shù)字大型數(shù)據(jù)集要保持一致鼓勵(lì)用可視化的手段去比較不同的數(shù)據(jù)片段從概況到詳細(xì)結(jié)構(gòu)(或者望遠(yuǎn)鏡+顯微鏡),以不同的詳細(xì)程度揭示數(shù)據(jù)要有相當(dāng)明確的用途:描述、探究、制表還是裝飾?要跟數(shù)據(jù)集的統(tǒng)計(jì)和口頭描述緊密結(jié)合圖形揭示數(shù)據(jù)。真的,圖形可以比一般的統(tǒng)計(jì)計(jì)算更準(zhǔn)確,更有啟發(fā)性。
就是這樣。這本書的其余部分是對(duì)這些首要原則的極好闡述。整個(gè)世界只是一頁。
在所有的圖表中,這個(gè)圖表是最好的。在所有的表格中,我在分析包中使用最多的一個(gè)圖標(biāo)是以時(shí)間為X軸,以要測(cè)量的維度為Y軸的圖表。數(shù)據(jù)隨時(shí)間變化的趨勢(shì)。
數(shù)據(jù)點(diǎn)就是數(shù)據(jù)點(diǎn)。兩個(gè)數(shù)據(jù)點(diǎn)隨時(shí)間變化的趨勢(shì)可以說明一個(gè)故事。(開玩笑,請(qǐng)不要只用兩個(gè)數(shù)據(jù)點(diǎn)講故事。圖表上的線條告訴我們我們?nèi)ミ^哪里,也指出了事情的發(fā)展方向。當(dāng)你在琢磨曲線上面的數(shù)據(jù)點(diǎn)為什么上升或者下降,或者為什么這么正常的時(shí)候,你就可以掌握你要研究的東西的基本機(jī)理了。
在經(jīng)理授權(quán)我寫附言之前,我做了幾個(gè)月的分析包圖表。這是重要的一天,但寫一份業(yè)務(wù)情況總結(jié)并不難??粗繌垐D表,研究為什么和上個(gè)月不一樣,為什么不一樣,我得到了寫東西需要的所有要點(diǎn)。制作圖表已經(jīng)成功了一半以上。
所以Tufte書中的很多原理都在Analytics Package中實(shí)現(xiàn)了。比如只要相關(guān),每一頁都會(huì)顯示一系列的小倍數(shù),X軸和Y軸的比例是一樣的。當(dāng)時(shí),折線圖在電子表格程序中并不流行。
Tufte的影響沒有比我們的圖表更深的了。圖表能有多好?畢竟,在所有的事情中,圖表真的很簡單。但這是優(yōu)勢(shì),不是劣勢(shì)。這里的建議很簡單,其實(shí)很簡單,你可能覺得都是套路。不是。當(dāng)我看到網(wǎng)上分享的圖表時(shí),即使是我最關(guān)心的最聰明的人也很難聽從我的建議。
可能Tufte名氣不夠大,需要學(xué)生使用Excel的商學(xué)院也沒有教授過他的想法。確實(shí)如此,但我更喜歡用一個(gè)更簡單的解釋:如果用戶太懶,默認(rèn)Excel圖形不好,Excel是世界上最流行的繪圖工具。
用一個(gè)例子來說明,我們拿一個(gè)數(shù)據(jù)集,在Excel中做一個(gè)圖,然后遍歷我每個(gè)月需要做什么來做Analytics Package。
網(wǎng)上分享的大部分圖表的原始數(shù)據(jù)我都找不到,也不想用什么專有數(shù)據(jù)。但是我的朋友王丹告訴我,我可以在谷歌公共數(shù)據(jù)瀏覽器上搜索,很多好像是從世界銀行數(shù)據(jù)目錄中檢索出來的,為了節(jié)省時(shí)間,我從中提取了一些裸露的數(shù)據(jù)。
我使用人均醫(yī)療保健支出(美元)。我選擇了8個(gè)國家,并選擇了涵蓋1995年至2014年所有年份的數(shù)據(jù)。我選擇了我曾經(jīng)生活或訪問過的所有國家,其他人也告訴了我他們的醫(yī)療保健系統(tǒng),但這里的要點(diǎn)是,為了使圖表易于閱讀,限制圖表中的數(shù)據(jù)系列很重要。有多少數(shù)據(jù)系列合適,要看你想研究什么,曲線點(diǎn)有多集中,數(shù)據(jù)差距有多大。有時(shí)候除非你先做圖表,否則很難預(yù)測(cè),但可以說,如果結(jié)果難以分辨,你做的圖表只會(huì)讓別人覺得很蠢。
下面是我在選擇數(shù)據(jù)的時(shí)候按了graph按鈕之后,最新版本的Excel在我的Mac上做的圖表(很奇怪,我發(fā)現(xiàn)推薦的圖表下拉按鈕和它推薦的三個(gè)圖表都是條形圖,肯定不是一個(gè)合適的選擇,Excel很多地方的默認(rèn)邏輯也很差)。我沒有修改這張圖,只是直接保存,大小和格式都是Excel選擇的。
不好。根據(jù)理查德·塞勒和卡斯·桑斯坦的微移哲學(xué),我們只需要改進(jìn)Excel和PowerPoint的默認(rèn)設(shè)置,全世界圖表的突出程度就會(huì)大大提高。如果有人在做Excel和PowerPoint的圖表功能,請(qǐng)聽我的聲音!提高普通人繪畫水平的力量就在你的手中。請(qǐng)閱讀Tufte的原理。
對(duì)了,聽完Tufte的講座,我走過去問他用什么軟件做他書里的圖表。他怎么回答的?Adobe Illustrator .為了得到他想要的結(jié)果,他,我猜是他的助手,手工排列每個(gè)像素。做Analytics Package對(duì)我沒什么幫助,因?yàn)槊總€(gè)月都要做,還有別的事要做,但是對(duì)Excel繪圖質(zhì)量的吐槽即使到今天依然有效。
現(xiàn)在讓我們稍微編輯一下上面的圖表,就像我以前制作分析包一樣。讓我們從一些明顯的問題開始:
圖例幾乎跟圖表一樣高很多線條相互之間靠得太近了左列的數(shù)字加千分號(hào)的好可讀性會(huì)更強(qiáng)圖表需要一個(gè)標(biāo)題我把工作表中的圖表放大了一點(diǎn),以便于查看。出于某種原因,它大約有四枚郵票那么大,解決了上述問題。以下為修訂版。
默認(rèn)情況下,Excel應(yīng)該在千位上添加逗號(hào)分隔符。上面的圖片稍微好一點(diǎn),但是標(biāo)簽還是小,即使你點(diǎn)擊上面的圖片放大到最大。然而,除了調(diào)整標(biāo)簽和標(biāo)題的大小,我們還能做些什么來改進(jìn)它們呢?
寫這篇文章的目的其實(shí)是想說,這是改善你的Excel圖形最簡單的方法:
在定量信息的視覺顯示中,塔夫特使用很少的顏色。在制作分析包時(shí),我只有黑白打印機(jī)和復(fù)印機(jī),所以即使它給你的圖表增加了一個(gè)維度,顏色也是徒勞的。
顏色雖然有優(yōu)勢(shì),但是更容易區(qū)分兩條非常接近的不同曲線,但是會(huì)引入各種不可預(yù)知的心理聯(lián)想,很容易造成干擾。比如,在制作美國總統(tǒng)大選的圖表時(shí),用藍(lán)色代表民主黨,用紅色代表共和黨,這是一個(gè)很好的主意,因?yàn)檫@種配色方案已經(jīng)被廣泛接受。但在區(qū)分貴公司不同部門或產(chǎn)品線時(shí),隨意選色會(huì)成為噪音,甚至更糟,引起糾紛。
不管你的最終版本是否能顯示顏色,一個(gè)更安全的選擇是使用不同的線條類型。是否顯示顏色取決于您需要映射的數(shù)據(jù)系列的數(shù)量。我會(huì)檢查數(shù)據(jù)系列曲線的格式選項(xiàng),在這個(gè)版本的Excel中標(biāo)記為Dash Type。我發(fā)現(xiàn)總共有8個(gè)選項(xiàng),剛好夠我舉例。分配選項(xiàng)以最大化可讀性需要一些工作;你要根據(jù)相鄰對(duì)比度最大的原則,選擇哪個(gè)國家用哪個(gè)線型。
隨機(jī)選擇線型后,圖形的單色版本變成這樣。
色盲用戶沒有問題,但是我們線型的使用超出了我的承受范圍。對(duì)我來說,用彩色曲線跟蹤不同國家的趨勢(shì)更容易,盡管這個(gè)單色版本還不錯(cuò)。盡管如此,這張圖在很多方面讓我想起了我之前做的亞馬遜分析包的單色版,雖然沒有數(shù)據(jù)標(biāo)簽(這里不適合),有水平網(wǎng)格線(我從來沒有做過)。
我們必須做出這些權(quán)衡,因?yàn)閿?shù)據(jù)系列的絕對(duì)數(shù)量。八個(gè)序列不僅不夠,而且太多了。丟棄一些數(shù)據(jù)序列后,以一系列折線圖的形式展示出來,會(huì)更容易、更清晰。這完全取決于目標(biāo)和你想交流的內(nèi)容。
在某個(gè)時(shí)候,沒有一套原則會(huì)普遍適用。作為一個(gè)溝通者,你必須做出一些主觀判斷。比如在亞馬遜,只要能顯示,我知道Joy想在圖表上看到數(shù)據(jù)值。她是那種很注重細(xì)節(jié)的人。一旦我把數(shù)據(jù)值放到上面,網(wǎng)格線就變得累贅,Y軸可以相應(yīng)減少數(shù)量。
Tufte建議減少非數(shù)據(jù)墨水(與數(shù)據(jù)無關(guān)的顯示),網(wǎng)格線通常就是這種情況。在某些情況下,如果數(shù)據(jù)值不能放在圖表中,我有時(shí)會(huì)在其中放網(wǎng)格線來計(jì)算一個(gè)值與另一個(gè)值的相對(duì)比率(只需計(jì)算值之間的網(wǎng)格線數(shù)量),但這是一種特殊情況。
對(duì)于突然的變化,比如一個(gè)圖的異常反轉(zhuǎn),我經(jīng)常直接在圖中插入備注,以此來預(yù)測(cè)和阻止任何查看者提問。比如上圖,如果數(shù)據(jù)序列減少了但希臘依然保持,你可能想通過在那個(gè)地方加一張紙條說明這是希臘金融危機(jī)爆發(fā)的時(shí)候(不知道這是不是實(shí)際原因,但不管原因和理論是什么,我都會(huì)列出來)來解釋為什么2008年以來醫(yī)療支出下降了。
如果我們?cè)诰唧w指標(biāo)上有公司目標(biāo),我會(huì)把目標(biāo)以標(biāo)注漸近線的形式附在相應(yīng)的圖表上。提醒大家,永遠(yuǎn)不要太在意自己的目標(biāo)。
例如,下面是該圖表的另一個(gè)版本,具有更少的數(shù)據(jù)序列、數(shù)據(jù)標(biāo)簽、沒有網(wǎng)格線和更少的Y軸標(biāo)簽。此外,由于曲線沒有堆疊在一起,我們不再需要不同的線型,從而避免了視覺噪聲的增加。
在那個(gè)數(shù)據(jù)尺度下,數(shù)據(jù)值是不容易識(shí)別的,但是如果我想為Joy或者Bezos做一個(gè)圖表,我一定會(huì)加標(biāo)簽,因?yàn)槲抑浪麄冃枰莻€(gè)層次的細(xì)節(jié)。在亞馬遜,我通常將我們的圖表限制在4或8個(gè)季度,所以現(xiàn)在我們的數(shù)據(jù)點(diǎn)從來沒有上面的圖表那么多。第三,在某些時(shí)候,你必須決定誰是你的聽眾,你的目標(biāo)是什么,然后相應(yīng)地修改你的圖表。
像電影一樣,畫畫是一個(gè)連續(xù)的過程。我可以為不同的目的生成以上圖表的更多迭代版本,但是你可以理解其中的含義。在某些時(shí)候,你必須把它打印出來。就像你在片尾要感謝的一樣,這里最后一步就是把數(shù)據(jù)源放在圖表的底部,讓大家可以自己找到裸露的數(shù)據(jù)。
在為這篇文章準(zhǔn)備這個(gè)例子之前,其實(shí)我對(duì)世界人均衛(wèi)生保健支出并不太了解,只知道美國的支出遙遙領(lǐng)先于世界。這張圖表揭示了這一點(diǎn),并說明了差距的大小。比如比較中國。中國支出低有什么解釋?我可能能猜到幾個(gè)原因,包括一些顯而易見的原因,比如龐大的人口基數(shù),但這需要更深入的調(diào)查,可能還需要更多的圖表。Analytics Package緩慢擴(kuò)張的原因之一是,一些圖表會(huì)導(dǎo)致更多的圖表。
2008年以來希臘人均醫(yī)療支出為何下降?是因?yàn)榻鹑谖C(jī)嗎?為什么日本從2012年開始扭轉(zhuǎn)上升趨勢(shì)?是否應(yīng)該放在其他國家進(jìn)行對(duì)比,如何選擇最能說明問題的數(shù)據(jù)集?
在亞馬遜的第一年,我花了幾個(gè)月的時(shí)間收集數(shù)據(jù)并確認(rèn)它們的準(zhǔn)確性,制作這些圖表,然后試圖拼湊這些曲線背后的故事。制作圖形的過程是理解的前奏。
為了加快這種理解,升級(jí)您的圖表,使其有效和真實(shí)。有一些普遍適用的原則來指導(dǎo)你。簡單總結(jié)一下:
不要圖例;相反直接在繪圖區(qū)標(biāo)記數(shù)據(jù)序列。通常標(biāo)簽放到最右側(cè)最近的數(shù)據(jù)點(diǎn)是最好的。一些人認(rèn)為圖例是ok的如果你的數(shù)據(jù)系列不止一個(gè)的話。我的理念是任何組織得當(dāng)?shù)那€圖都不需要。使用千位逗號(hào)分隔符讓大數(shù)更易讀與之相關(guān),數(shù)據(jù)標(biāo)簽的精度表示永遠(yuǎn)不要超過需要。比方說,Excel往往為貨幣格式選擇2個(gè)小數(shù)位,但大多數(shù)曲線圖并不需要這個(gè),而且往往還可以取整到千位或者百萬來減少數(shù)據(jù)標(biāo)簽大小。如果你的數(shù)字是10億或萬億的規(guī)模的話,你就不需要看到那些0了,實(shí)際上這反而更難讀。調(diào)整坐標(biāo)軸標(biāo)簽格式跟要衡量的數(shù)字的格式一致;比方說如果是美元的話,標(biāo)簽格式化為貨幣。注意一下坐標(biāo)軸標(biāo)簽的間隔,如果太擠的話調(diào)整一下。正如Tufte建議那樣,要盡可能減少非數(shù)據(jù)墨水但又不要影響信息傳達(dá)。Y軸要從0開始(假設(shè)你沒有負(fù)值)數(shù)據(jù)序列不要太多;通常限制在5到8個(gè)之內(nèi),這要取決于曲線之間的擁擠程度。在罕見的情況下,超過這個(gè)限制也是可以的;有時(shí)候數(shù)據(jù)序列量大的是點(diǎn),為了顯示一堆集中的曲線。這就是特殊情況。如果你的數(shù)據(jù)序列太多,如果情況允許的話考慮用折線圖,比方說如果y軸在比例上適合所有折線圖的話。尊重色盲用戶以及那些看不清楚你圖表顏色的人,比方說看黑白打印稿的,同時(shí)要有顏色以外區(qū)分?jǐn)?shù)據(jù)序列的選項(xiàng),比如線型。我在在Amazon處理那么多數(shù)字時(shí),總是會(huì)將負(fù)數(shù)格式化為紅色,并且用括號(hào)包含起來以防有人看不到顏色。對(duì)于異常事件要直接在圖表上插入解釋;你未必總能親自去解釋你的圖表,如果你的圖是送過去給別人的話。一定要在圖表下方備注數(shù)據(jù)來源。有時(shí)適用的其他建議:
如果大家會(huì)問那些數(shù)字是什么,并且能夠簡單套用的話,在圖表上顯示具體數(shù)據(jù)值。如果你已經(jīng)有數(shù)據(jù)標(biāo)簽,網(wǎng)格線也許就沒必要了。實(shí)際上,哪怕你沒有數(shù)據(jù)標(biāo)簽可能也不需要。把數(shù)字目標(biāo)值作為漸近線進(jìn)入,這樣可以幫助受眾了解你是否趨向于達(dá)成目標(biāo)。為什么量化信息的視覺展示對(duì)我的影響這么大?如果它只是一部關(guān)于可視化的開創(chuàng)性著作,它將不會(huì)是我最信任的參考書之一,它將永遠(yuǎn)在我的加納的《現(xiàn)代美國用法》旁邊觸手可及。我不會(huì)把這本書推薦給以前沒做過圖表的人。
這本書之所以對(duì)我產(chǎn)生如此深遠(yuǎn)的影響,是因?yàn)樗鋵?shí)是一本通過知識(shí)追求真理的書。表面上,這本書講的是如何讓圖表看起來更好看;但本質(zhì)上它告訴你如何讓你的思維清晰的原理??催@本書,熬夜做那些圖,和全公司的人交談,了解如何解釋那些圖,讓我找到解釋過去,預(yù)測(cè)未來的方法。當(dāng)你問任何人他們最喜歡的作品(電影、書籍或唱片等)是什么時(shí)候。)都是,答案不僅僅是作品本身。我看過《禪》和《摩托車維修的藝術(shù)》,我覺得它的讀者不僅僅是摩托車愛好者。
好的圖應(yīng)該是左右腦融合,文理結(jié)合。數(shù)字本身不足以解釋真相,但準(zhǔn)確的數(shù)字,如果如實(shí)表達(dá),是對(duì)我們道聽途說、認(rèn)知偏見和部落聯(lián)盟的考驗(yàn)。
令我驚訝的是,每次看到一個(gè)可以可視化編輯的圖形,我都會(huì)想到那本書的大部分內(nèi)容。大部分人都比較懶,大部分人都遵循默認(rèn),地球上最流行的制表應(yīng)用的默認(rèn)設(shè)置都很糟糕。
原地址:http://www.eugenewei.com/blog/2017/11/13/remove-the-legend
翻譯:boxi,36氪編譯器出品。編輯:郝鵬程。
翻譯地址:http://36kr.com/p/5131503.html
本文由@郝鵬程發(fā)表,大家都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
標(biāo)題圖來自Pixabay,基于CC0協(xié)議
1.《報(bào)表格式怎么做 數(shù)據(jù)報(bào)表:怎么讓你的圖表好看?這里有最重要的一條經(jīng)驗(yàn)》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請(qǐng)聯(lián)系頁腳下方聯(lián)系方式。
2.《報(bào)表格式怎么做 數(shù)據(jù)報(bào)表:怎么讓你的圖表好看?這里有最重要的一條經(jīng)驗(yàn)》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來源地址,http://f99ss.com/shehui/824007.html