机读格式显示(MARC)

000 01501nam 2200325 450

001 0000212422

005 20250805104800.0

010 __ |a 978-7-302-68743-6 |d CNY59.80

100 __ |a 20250609d2025 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a a 000yy

106 __ |a r

200 1_ |a 大数据技术与应用 |A da shu ju ji shu yu ying yong |e Hadoop和PySpark实现 |f 周显春, 肖衡主编

210 __ |a 北京 |c 清华大学出版社 |d 2025.05

215 __ |a 287页 |c 图 |d 26cm

225 2_ |a 大数据与人工智能技术丛书 |A da shu ju yu ren gong zhi neng ji shu cong shu

300 __ |a 水木书荟

314 __ |a 周显春, 三亚学院副教授, 大数据高级分析师, CCF会员, 现任全国高等学校计算机基础教育研究会 (全国一级学会) 数据科学专委会副秘书长、三亚学院智能工程系副主任。肖衡, 三亚学院讲师, 先后讲授了操作系统、数据采集与预处理、大数据技术原理与应用、数据科学与应用等课程, 并取得了良好的教学效果。

320 __ |a 有书目

330 __ |a 本书以Python为基础, 讲解HDFS分布式文件系统和PySpark3编程。全书共9章, 内容包括Docker环境下Hadoop与Spark的配置、HDFS操作技巧、RDD编程方法、Spark SQL应用、Spark架构及运行机制、Pandas on Spark使用及Spark ML编程实践。

410 _0 |1 2001 |a 大数据与人工智能技术丛书

517 1_ |a Hadoop和PySpark实现 |A Hadoop he PySpark shi xian

606 0_ |a 数据处理 |A shu ju chu li |x 高等学校 |j 教材

610 0_ |a Hadoop |A Hadoop |a PySpark

690 __ |a TP274 |v 5

701 _0 |a 周显春 |A zhou xian chun |4 主编

701 _0 |a 肖衡 |A xiao heng |4 主编

801 _0 |a CN |b 安徽时代 |c 20250722

905 __ |a AHLSL |d TP274/169