本書是一本關于如何清洗、整理和理解數據的手冊,還介紹了圍繞構建更可靠的數據系統的最佳實踐、技術和流程,并在此過程中培養團隊和利益相關方對數據的信任。本書首先引入“數據宕機”的概念,然后介紹如何跨多個關鍵數據管道技術構建更具彈性的數據系統。還介紹了數據可靠性工作流中的主動異常檢測與監測,并設置SLA、SLI和SLO,以及構建由新鮮度、容量、分布、模式和沿襲這5個關鍵支柱組成的優化數據質量的數據平臺。之后深入探討在生產環境中實際應對和解決數據質量問題所需的步驟,包括數據事件管理、根因分析、事后分析等。接著討論數據團隊在大規模宣傳和普及數據質量時必須跨越的一些文化和組織障礙,并分享了幾個真實案例研究和與數據工程領域領軍人物的對話。