2020年6月22日Spark练习
1.每天每小时访问IP数量 2.每个IP的上传和下载流量 3.客户端的操作系统类型占比 4.统计IP . . . Read more
If you have any question you can ask below or enter what you are looking for!
1.每天每小时访问IP数量 2.每个IP的上传和下载流量 3.客户端的操作系统类型占比 4.统计IP . . . Read more
Spark的运行模式 standalone spark最经典的集群搭建模式 spark自己启动Mas . . . Read more
Flume 是什么? 分布式、高可用数据采集工具 agent flume启动的一个实例 source . . . Read more
kafka 概念 kafka是一个分布式消息队列 是一个分布式的流平台 名词解释 broker Ka . . . Read more
Hbase 命令行操作 进入命令行 hbase shell 查看表 list 创建表 create . . . Read more
Zookeeper分布式安装 上传解压 修改配置文件 zoo.cfg 配置参数解读 #zookeep . . . Read more
数仓的分层结构 ODS 原始数据层 原始数据什么这一层就什么样 39.105.49.192 – – . . . Read more
hive设置显示表头、库名 hive-site.xml <property> <n . . . Read more
hive Hive是一个数据仓库产品 DataWarehouse 优点缺点 Hive安装 上传解压 . . . Read more
// 切片大小的计算 protected long computeSplitSize( long b . . . Read more