机读格式显示(MARC)
- 010 __ |a 978-7-302-68743-6 |d CNY59.80
- 100 __ |a 20250609d2025 em y0chiy50 ea
- 200 1_ |a 大数据技术与应用 |A da shu ju ji shu yu ying yong |e Hadoop和PySpark实现 |f 周显春, 肖衡主编
- 210 __ |a 北京 |c 清华大学出版社 |d 2025.05
- 215 __ |a 287页 |c 图 |d 26cm
- 225 2_ |a 大数据与人工智能技术丛书 |A da shu ju yu ren gong zhi neng ji shu cong shu
- 314 __ |a 周显春, 三亚学院副教授, 大数据高级分析师, CCF会员, 现任全国高等学校计算机基础教育研究会 (全国一级学会) 数据科学专委会副秘书长、三亚学院智能工程系副主任。肖衡, 三亚学院讲师, 先后讲授了操作系统、数据采集与预处理、大数据技术原理与应用、数据科学与应用等课程, 并取得了良好的教学效果。
- 330 __ |a 本书以Python为基础, 讲解HDFS分布式文件系统和PySpark3编程。全书共9章, 内容包括Docker环境下Hadoop与Spark的配置、HDFS操作技巧、RDD编程方法、Spark SQL应用、Spark架构及运行机制、Pandas on Spark使用及Spark ML编程实践。
- 410 _0 |1 2001 |a 大数据与人工智能技术丛书
- 517 1_ |a Hadoop和PySpark实现 |A Hadoop he PySpark shi xian
- 606 0_ |a 数据处理 |A shu ju chu li |x 高等学校 |j 教材
- 610 0_ |a Hadoop |A Hadoop |a PySpark
- 701 _0 |a 周显春 |A zhou xian chun |4 主编
- 701 _0 |a 肖衡 |A xiao heng |4 主编
- 801 _0 |a CN |b 安徽时代 |c 20250722
- 905 __ |a AHLSL |d TP274/169