2020年6月8日SparkSQL
SparkSQL RDD 弹性分布式数据集 版本:spark1.0 特点: 存储的数据不带结构信息 . . . Read more
If you have any question you can ask below or enter what you are looking for!
SparkSQL RDD 弹性分布式数据集 版本:spark1.0 特点: 存储的数据不带结构信息 . . . Read more
Spark 安装 修改配置文件 spark-env.sh spark-default.conf sl . . . Read more
kafka 是什么? 分布式的消息队列 queue fifo 分布式的流平台 核心概念 topic . . . Read more
Hbase命令行操作 进入Hbase命令 hbase shell 查看当前库的表 list 创建表并 . . . Read more
Hbase Hbase集群搭建 上传安装包 解压 改名 修改配置文件 hbase-env.sh ex . . . Read more
Hive自定义函数 需求:03/Nov/2019 -> 2019-11-03 Hive现有的函 . . . Read more
Hive DDL 1. 库的操作 创建 create database db_name; 使用 us . . . Read more
上周回顾 MapReduce 概述:分布式计算框架 原理: Mapper map(k,v,conte . . . Read more
1.自定义InputFormat 一个继承InputFormat接口,用来规范MR的输入 常用实现类 . . . Read more
第三章 第四节Shuffle 排序(难点) 二次排序(多次排序) 概述:因为MR框架在Map输出时会 . . . Read more