机读格式显示(MARC)
- 000 02568nam0 2200349 450
- 010 __ |a 978-7-111-75411-4 |d CNY109.00
- 100 __ |a 20240611d2024 em y0chiy50 ea
- 200 1_ |a 数据质量管理 |A shu ju zhi liang guan li |e 数据可靠性与数据质量问题解决之道 |f 巴尔·摩西, 利奥·加维什, 莫莉·沃尔维克著 |g 李晗玥, 陈天皓, 步凡译
- 210 __ |a 北京 |c 机械工业出版社 |d 2024.05
- 215 __ |a 256页 |c 图 |d 24cm
- 306 __ |a 由O'Reilly Media, Inc.授权出版
- 314 __ |a Barr Moses, 是蒙特卡罗公司的首席执行官兼联合创始人, 该公司是数据可观测性类别的创建者。在长达十年的数据职业生涯中, 她曾担任以色列空军数据情报部队指挥官、贝恩公司顾问和Gainsight公司运营副总裁。她主持了O'Reilly的第一门数据质量课程。Lior Gavish, 是蒙特卡罗公司的首席技术官兼联合创始人, 曾联合创办网络安全初创公司Sookasa, 该公司于2016年被Barracuda公司收购。在Barracuda, 他曾担任高级工程副总裁, 推出了屡获殊荣的ML防欺诈产品。Lior拥有斯坦福大学工商管理硕士学位和特拉维夫大学计算机科学硕士学位。Molly Vorwerck, 是蒙特卡罗公司的内容主管, 还担任过Uber工程博客的主编和Uber技术品牌团队的首席项目经理。她还负责Uber首席技术官的内部沟通, 以及Uber人工智能实验室研究审查项目的战略。
- 330 __ |a 本书是一本关于如何清洗、整理和理解数据的手册, 还介绍了围绕构建更可靠的数据系统的最佳实践、技术和流程, 并在此过程中培养团队和利益相关方对数据的信任。本书首先引入“数据宕机”的概念, 然后介绍如何跨多个关键数据管道技术构建更具弹性的数据系统。还介绍了数据可靠性工作流中的主动异常检测与监测, 并设置SLA、SLI和SLO, 以及构建由新鲜度、容量、分布、模式和沿袭这5个关键支柱组成的优化数据质量的数据平台。之后深入探讨在生产环境中实际应对和解决数据质量问题所需的步骤, 包括数据事件管理、根因分析、事后分析等。接着讨论数据团队在大规模宣传和普及数据质量时必须跨越的一些文化和组织障碍, 并分享了几个真实案例研究和与数据工程领域领军人物的对话。
- 510 1_ |a Data quality fundamentals : a practitioner's guide to building trustworthy data pipelines |z eng
- 517 1_ |a 数据可靠性与数据质量问题解决之道 |A shu ju ke kao xing yu shu ju zhi liang wen ti jie jue zhi dao
- 606 0_ |a 数据管理 |A shu ju guan li |x 质量管理 |x 研究
- 701 _1 |a 摩西 |A mo xi |g (Moses, Barr) |4 著
- 701 _1 |a 加维什 |A jia wei shi |g (Gavish, Lior) |4 著
- 701 _1 |a 沃尔维克 |A wo er wei ke |g (Vorwerck, Molly) |4 著
- 702 _0 |a 李晗玥 |A li han yue |4 译
- 702 _0 |a 陈天皓 |A chen tian hao |4 译
- 702 _0 |a 步凡 |A bu fan |4 译
- 801 _0 |a CN |b 安徽时代 |c 20250724
- 905 __ |a AHLSL |d TP274/185