2019年7月24日,美國聯邦貿易委員會對社交網絡巨頭臉書公司開出高達56億美元的罰單,并對劍橋分析公司(簡稱劍橋分析)提出了行政訴訟,指控其采用欺騙手段從臉書數千萬用戶那里收集個人信息并進行選民分析。至此,臉書公司因劍橋分析發生的大規模數據泄露丑聞暫告一個段落。該事件充分印證了我國《國家網絡空間安全戰略》關于“網絡滲透危害政治安全”的判斷:“政治穩定是國家發展、人民幸福的基本前提。利用網絡干涉他國內政、攻擊他國政治制度、煽動社會動亂、顛覆他國政權,以及大規模網絡監控、網絡竊密等活動嚴重危害國家政治安全和用戶信息安全!北疚囊詣蚍治龀舐劄榍腥朦c,在微觀層面分析劍橋分析為什么能夠獲取海量臉書用戶數據、如何影響選民的投票偏好、臉書公司為何無法有效阻止丑聞發生,并探討了該事件帶給我們的啟示。
一、劍橋分析為什么能夠獲取海量臉書用戶數據
美國聯邦貿易委員會起訴書中指出,劍橋分析造成6500萬用戶數據泄露,對于一個成立僅3年的小公司而言,所獲取的數據可以用海量來形容,導致海量數據泄露的原因有兩方面:
內因是臉書的盈利模式。臉書公司是美國五大科技巨頭之一,運行模式很獨特,它只是提供自由交流和分享的平臺,本身并不提供任何內容,臉書上所有內容都是由用戶自愿創造上傳的。2006年,為了促進公司發展,扎克伯格宣布全面開放臉書,所有人都可以在平臺上開發軟件并提供服務,包括游戲、娛樂、工作、資訊等。
毫無疑問,臉書開放式運行模式獲得了巨大成功,但是,自由上傳、信息分享也為用戶數據安全埋下了巨大隱患。因為臉書公司的核心財產其實是用戶數據,收割數據是臉書的基本盈利模式,正是通過分析海量數據分析用戶行為,臉書才能實現廣告的精準投放,成為與谷歌比肩的互聯網廣告增益巨頭。那么,臉書用戶是否可以選擇不接受這些廣告呢?按照扎克伯格的說法,答案是肯定的,但是他同時承認,因為用戶一般不會完整閱讀隱私保護條款,所以,如果用戶選擇了“同意”,其實并不意味著用戶已經清楚免費軟件及廣告商將會如何使用自己的數據及其后果。CNN曾一針見血地評論“收割用戶數據的盈利模式已寫進臉書的DNA”。因此,也不難理解在美國國會聽證會上,面對議員們的犀利提問,扎克伯格多次選擇回避問題或避重就輕。
外因是臉書應用程序中存在的數據獲取杠桿效應。如前所述,臉書是眾多網民集體智慧創造的成果,平臺上有種類繁多的免費測試軟件,這些軟件既是臉書強化用戶粘性的有效武器,也是導致臉書用戶數據大規模泄露的潛在威脅。因為免費的前提是可以獲取你和你的好友的公開信息,這樣就可以形成數據獲取的杠桿效應,一些免費測試的應用軟件可以輕而易舉獲得海量用戶數據。從美國聯邦貿易委員會起訴書看,劍橋分析CEO尼克斯和科根共同開發、經營和使用臉書平臺上的應用程序“這是你的數字化生活”(GSR App),收集了25—27萬直接使用該應用的用戶個人資料,但是,由于同意授權中包含其“好友”的個人信息,所以,最終該軟件成功獲取了這些用戶社交網絡中的5000—6500萬關系鏈中的“好友”個人資料。這意味著,如果以27萬人為基數、以6500萬為總量計算,每個人平均貢獻的“好友”數量高達240個,也就是擴大240倍,數據獲取的杠桿效應非常驚人。
二、劍橋分析如何影響選民投票偏好
劍橋分析丑聞曝光的導火索有兩個,一個是該公司前工程師克里斯托弗?韋利的主動揭發,多家報紙先后披露了丑聞;另一個是英國《第四頻道》記者的臥底調查,這位偽裝成斯里蘭卡用戶的記者,成功錄下了與首席執行官尼克斯和市場總監特恩布爾的對話,電視臺播出了暗訪視頻。從兩條線索曝光的信息看,劍橋分析公司及其母公司干預過世界各地200多場選舉,涉及美國大選和英國的脫歐公投,墨西哥、馬來西亞、巴西等國的選舉等多個國家。這里僅以2016年美國大選為例,分析該公司影響選民偏好的具體路徑。
第一,對臉書用戶進行分類。對用戶偏好進行分類,是精準投放廣告的前提,因此,臉書上充斥著各種各樣的免費測試軟件。其中關于政治偏好的測試,主要從人格測試軟件入手,一般會借助心理學的人格測試模型,對臉書用戶進行分類,該模型主要從外傾性、隨和性、責任心、情緒穩定性、經驗開放性5個維度構建個體的人格框架,其應用研究已十分成熟,詳見表1。
科根設計的軟件“這是你的數字化生活”,正是借助上述五維人格模型確定臉書用戶的類型,選擇的5個維度簡稱為開放度、盡責度、親和度、外向度和神經質,每一個維度都使用最簡潔的問題收集關鍵信息。例如,開放度——你歡迎新生事物嗎?盡責度——你追求完美到什么程度?外向度——你喜歡聚會嗎?親和度——你對他人抱有多大的同情心?神經質——你容易焦慮嗎?這五大因素結合在一起能呈現一個人的個性,如冒險型、保護他人型、領導型等。在此基礎上,劍橋分析還通過大數據分析用戶在臉書上的互動情況,把臉書用戶按照人格特征進行分類。這一算法十分精確,“你點10個贊,軟件就比你的同事更了解你;點150個贊,網絡就比你的父母更了解你的喜好;點300個贊,網絡甚至比你的配偶更懂你。”除了點贊,用戶還發帖、留言、上傳照片等,這些都成為網民的數碼足跡,為有心人了解他們提供了更多線索。在2017年接受公開采訪時,劍橋分析公司負責人尼克斯就曾經表示,該公司已成功預測出美國臉書用戶的人格模型,并在 2016年選舉期間,利用這一結果通過廣告為特朗普陣營服務。
第二,精準投放廣告。在劍橋分析的網頁上,赫然入目的廣告語是:劍橋分析已經重新定義了數據和競選活動之間的關系,通過更好地了解你的選民,你可以在降低總成本的同時,獲得更大的影響力。那么它是如何做的呢?答案是精準投放廣告。例如,特朗普在競選時提出的核心承諾是捍衛美國人的持槍權,劍橋分析公司針對不同用戶推送不同的廣告:對冒險型用戶,通過臉書平臺向他們推送以暴制暴型的廣告,告訴他們槍能消除外部威脅,捍衛自由;對保護者型性格用戶,他們收到的廣告是“槍是保護他人不可或缺的工具”;對理性思考、運籌帷幄型性格用戶,臉書推送的廣告傳遞的則是“槍能保護家人和美好未來的信息”。這種定向推送的廣告影響力不容小覷。
第三,定向發布新聞。臉書的用戶范圍十分廣泛,皮尤研究中心2016年的數據顯示,臉書僅在北美地區就擁有2.22 億用戶,其中有40%的用戶通過臉書獲取天氣、交通等信息;有63%的用戶通過臉書獲取新聞。那么這些網民將獲取怎樣的新聞呢?通常情況,臉書平臺會基于用戶的個人情況,借助計算機算法對新聞內容進行篩選排序,然后推送給每個用戶,即針對用戶偏好的精準投放。但是,這個過程可以人為干預,例如在大選期間,臉書可以修改算法,把候選人不希望網民看到的信息刪除,或者大量推送候選人希望選民看到的信息,劍橋分析正是這樣把社交工具變成了政治武器。據丑聞曝光者韋利透露,劍橋分析公司可以通過大數據判斷用戶易于接受的信息形式,包括表達的形式、話題、語氣、內容,以及他如何消化信息、一些信息是否令他感到害怕,甚至可以預測需要接觸用戶多少次才能改變他的想法等。劍橋分析建立了包括心理學、戰略策劃等各方面的專家團隊,負責制作有針對性的新聞信息,再以網站、博客、郵件等各種不同的方式發送給目標群體。他認為“個性化的數據可以讓你確切知道,以何種信息瞄準誰,”只要你能“在對的時候,把對的信息,放在對的人眼前”,數據就能發揮威力,潛移默化中,臉書用戶的想法開始改變,宣傳的目的就達到了。谷歌公司前員工哈里斯在TED公開演講中把這一過程稱為“思想和情感控制”,數以億計的網民其實進入了“控制室”而不自知。
第四,使用違法手段制造假新聞。從第四頻道記者偷拍的視頻看,劍橋分析的宣傳手段毫無底線并貫穿線上、線下,其中不乏用違法手段構陷對手。如記者詢問“如何深度挖掘對手秘密資料并確保真實”時,劍橋分析CEO尼克斯這樣回答:“深度挖掘當然很有趣,但是同樣有效的是直接和他們談。向他們提供有豐厚報酬的交易,同時確保暗中錄下交易過程,立刻就能獲得對方腐敗行為的證據。再把視頻傳到網上,這些策略非常有效!蹦峥怂惯說,“這些事情不一定是真相,只要人們相信就可以了。”雖然視頻播出后,尼克斯被立即停職并接受獨立調查,劍橋分析也很快發表聲明稱“尼克斯被第四頻道秘密拍下的個人言論不代表公司的價值觀或經營行為”,但是,劍橋分析顯然已回天乏力。美國、英國、巴西等國家紛紛表示,要對劍橋分析展開徹底調查,即使公司宣布停業并申請破產保護。
三、臉書公司未能有效阻止丑聞發生的原因
臉書是一家既有強大技術實力,又有雄厚財力支持的跨國公司,之所以未能有效預防這類事件發生,主要有以下兩個方面的原因。
內因是臉書公司并沒有把用戶數據安全問題放在最優先位置,而是像傳統商業公司那樣優先關注客戶增長和營收。但對于傳統商業公司而言,安全與發展之間的矛盾并不突出,科技公司則完全不同,沒有安全保障的快速增長就意味著風險。而安全與發展又常常無法兼得,因為要確保用戶數據安全,就必須全方位加強人力投入,而這勢必影響公司的發展速度。以人力投入為例,臉書公司一直設有專門的審核人員,主要職責是判斷何時該刪除或保留冒犯性內容。但在丑聞曝光前的2017 年5月,臉書在全球范圍內僅有4500名審核人員,占當時臉書員工總數23165人的19.4%?梢哉f,丑聞曝光前的臉書公司,安全人員的投入規模明顯不足,因此也就無力處理各種潛在風險。此外,臉書領導層對已經發現的安全問題也沒有做到及時處理。例如,臉書平臺團隊前運行經理桑迪?帕拉吉拉斯,早在2012年前后就發現公司存在安全問題,但高層對此表現冷漠。2018年3月,他甚至在《華盛頓郵報》公開撰文,呼吁“必須讓扎克伯格為臉書的疏忽負責!币虼,丑聞曝光前的臉書,并非沒有人發現公司運行模式中的巨大安全風險,但這些發現沒有引起公司高層的重視,因為高層優先關注的是公司的發展而不是安全問題。
外因主要是臉書的業務范圍十分廣泛,以至于該公司事實上也沒有能力杜絕此類事件的發生。臉書官網信息顯示,截至2019年6月底,臉書的月活躍用戶的數量高達24.1億;日活躍用戶為15.9億;平均每天有超過21億人臉書產品發送信息;每個月還有27億人至少使用一次臉書的家庭服務。如此量級的人群以如此高的頻度活躍在一個社交平臺,等于在網絡空間建立了一個地球村,監管的難度可想而知。
丑聞曝光后,在股市蒸發、信任危機、天價罰單甚至反壟斷調查的多重壓力下,臉書公司的高層被迫改變發展理念,把用戶數據安全放在第一位。例如大幅增加安全審查人員的數量,從臉書官網可以看到,截至2019年6月底,臉書的全球員工人數快速增長至39651人,漲幅超過70%,2萬名安全審查人員已經占員工總數的50.4%。此外,臉書還規范了安全管理過程,發布內容審核指南,“將不可接受的帖子和內容分為六類:暴力和犯罪行為、安全、爭議內容、信譽與真實性、尊重知識產權和內容相關請求!蓖瑫r“宣布將擴大其內容核查范圍,將與第三方視覺機構專家進行合作,把事實核查的部分擴展到圖片和視頻,并引入機器學習機制,通過AI來識別虛假信息”等。
那么,這些措施是否意味著臉書公司今后一定能有效防止危機事件再次發生呢?答案是否定的,雖然用戶數據安全優先戰略可以有效減少大規模安全事件的發生,但卻很難杜絕此類事件,因為臉書的受眾規模和業務范圍均過于龐大,遠遠超出了一個公司可能具備的應付能力。因此,不難解釋為什么丑聞曝光后的臉書,之后又連續爆出多起危機事件。
面對媒體的討伐、網民的批評和政府的懲治,備受壓力的臉書公司的管理理念開始出現改變。2019年3月30日,扎克伯格在《華盛頓郵報》上發表了《互聯網需要新的規制,可以從四個方面開始》一文,一改之前反對政府干預的堅定立場,轉而呼吁強化政府的網絡監管責任。扎克伯格提出,要在有害內容、選舉安全、隱私和數據遷移4個方面進行重點監管,上述4個方面正是臉書公司近年來發生危機事件的重災區。一個原本主張互聯網自治的跨國企業,轉而呼吁政府積極監管,不能把管理責任壓給一個企業,足以證明網絡安全的復雜性,以及建立多主體協同的網絡安全綜合治理體系的重要性。
四、結語
通過在微觀層面分析臉書用戶數據泄露丑聞不難看出,在大數據時代,網絡安全的確能夠對政治安全產生深刻影響。因此,需高度警惕網絡安全風險。
第一,要高度警惕陷入“信息繭房”。互聯網時代,每一個網民的生活軌跡、興趣、偏好都被網絡所記錄,小到你瀏覽或購買某種商品后,很快發現無論自己打開什么網頁都可以看到相似商品的推送廣告;大到你就某一話題發表評論后,發現網上到處都是與自己觀點相同的人。這個時候一定要非常清醒,不是你強大到了可以影響互聯網的風向,而是大數據讓你掉進了“信息繭房”。這個概念由美國學者桑斯坦在2006年出版的著作中提出,用于描述公眾對信息的需求并非完整全面,而是傾向于接觸符合個人興趣、使自我感到愉悅的信息。當人們的信息領域習慣性地受制于個人興趣,慢慢會導致信息選擇范圍日益狹窄,人們只會看到與其態度一致的內容,聽到與其信念一致的聲音,接觸與其立場一致的人,像蠶繭一樣禁錮在“信息繭房”中。從劍橋分析丑聞可以看出,很多互聯網公司在網絡上發布的信息都是經過精心篩選、基于網民偏好精準推送的,長此以往會導致網民看到的信息可能只是他想看到的,網民接受這樣的推送越多,離真實世界的距離就越遠,對問題的感知、事件的判斷可能會失真。要改變這種狀況就要遠離指向性非常明顯的推送信息,盡可能從多元渠道獲取信息資源。
第二,要清醒認識網絡對極端思想、負面信息的放大效應。瑪麗·米克爾在《2019年互聯網趨勢》報告中提出,網民們總是更喜歡負面新聞,研究者的“參與者的新聞選擇偏見”實驗也證明,無論參與者說什么,他們都表現岀對負面新聞內容的偏好,“互聯網上存在問題的內容,有可能會被過濾掉的較少,有可能被放大的較多。”以美國國會議員的政治立場變遷為例,1994年以來,也就是互聯網快速發展的25年,美國兩黨議員的政治價值正明顯走向極化。調查以穩健自由派、溫和中間派、穩健保守派劃分兩黨的政治價值觀,圖1中左側圖形為民主黨,右側圖形為共和黨,中間圖形是橫跨兩黨的持溫和觀點的人。
從圖1中可以明顯看出,1994年兩黨持溫和中間立場的人非常多,所以兩黨有較大的共識空間。到2004年兩黨持溫和中間立場的人均開始減少,但兩黨共識空間依然充裕,美國的政治生態依然健康。到了2017年,兩黨持溫和觀點的人則出現銳減,民主黨的穩健自由主義者和共和黨的穩健保守主義者均大幅增加,兩黨明顯正走向極化,兩黨共識區的頂端幾近塌落,因此,在大數據時代,互聯網傳播對政治觀點極化的影響不可小覷。
第三,要牢記天下沒有免費午餐;ヂ摼W公司絕不是提供各種免費服務的慈善機構,我們在網上注冊的全部個人數據,其實就是我們的付費,這是互聯網時代新的付費形式。所以,如果你不知道自己的信息被誰賣了,那就該問問自己,是否下載了太多免費應用軟件,這些軟件都會獲取你的在線信息;以及是否在一次次點贊、幫助投票、幫助砍價的過程中,允許第三方使用你的公開信息。要記住,所有互聯網公司都是網民數據的收割機,這已經寫進互聯網公司的DNA,因為我們的數據就是他們實現商業模式的基礎。
第四,要慎用大數據預測,這是一把雙刃劍。大數據預測能給人類帶來很多顯見的好處,例如通過大數據預測可以發現世界性流感的傳播方向,也可以預測一個人未來某時刻的地點位置,但是與此同時,也意味著人類進入了失去隱私的時代,就像生活在魚缸里的金魚。英國劍橋大學的研究顯示,他們通過網絡數據可以預測一個人的性取向,判斷一個人的父母是否曾經離婚。美國東北大學跟蹤研究了10萬名歐洲手機用戶,分析了1600萬條通話記錄和位置信息,他們得出的結論是,預測一個人在未來某時刻的地點位置,準確率可以達到93.6%。為此《大數據時代》的作者維克托·邁爾一舍恩伯格說,“我的擔憂不是因為,我們進入了一個被監視的社會,而是我們進入了一個人類行為被如此精確預測的社會,并且我們將要因此而懲罰人類,我們降低了人類自由的意志,以及人類的個人特征,而這些遠比被監視更加危險!
總之,網絡安全和信息化對一個國家很多領域都是牽一發而動全身的。沒有網絡安全就沒有國家安全,就沒有經濟社會穩定運行,廣大人民群眾利益也難以得到保障。在大數據時代,一定要高度重視網絡安全,積極采取有效措施防止網絡滲透,進而確保政治安全和社會穩定。
(原載于《保密科學技術》雜志2020年4月刊)