大数据
Apache Druid
· ☕ 7 
介绍 背景 2011年,美国广告技术公司MetaMarkets于创建了Druid项目(MetaMarkets的核心数据处理平台,99%的数据查询

HDP与CDH对比
· ☕ 1 
功能对比 对比项 HDP CDH 厂商 Hortonworks Cloudera 开源 开源 开源 统一管理技术 Apache Ambari Cloudera Manager 中文支持 不支持中文 支持中文(多语言支持) 安全权限模块 包含Ranger组件,即使在没

数据仓库
· ☕ 5 
数据仓库与数据库对比 特性 数据仓库 数据库 适合的工作负载 分析、报告、大数据 事务处理 数据源 从多个来源收集和标准化的数据 从单个来源(例如事务系统)捕

Apache Mahout
· ☕ 7 
介绍 简介 Mahout,象夫,驱使大象的人。 Apache开源框架,主要用于创建可伸缩的机器学习算法,实现了流行的机器学习技术。 实现了如下几个流

Apache Hive
· ☕ 17 
介绍 基本介绍 项 说明 适用场景 Hive 简介 - 重在分析 - 延迟高 - 使用SQL来读、写、管理主流在分布式存储系统大型数据集 - 可以使用命令行和连接到hive -

用户画像
· ☕ 15 
介绍 概念 用户画像(UserProfile),也叫用户信息标签化、客户标签。 从电商的角度看,根据用户在电商网站上所填的信息和用户的行为,可以用

Apache Hadoop安装
· ☕ 3 
CentOS安装 准备环境 独立安装环境 主机名 IP 操作系统 角色 node1 192.168.0.11 CentOS7 本地模式运行hadoop,用于测试和开发环境 伪分布式安装环境 主机名 IP 操作系统 角

Flink
· ☕ 1 
介绍 技术 特性 适用场景 说明 Flink基础 - 事件驱动型应用 反欺诈 异常检测 基于规则的报警 业务流程监控 (社交网络)Web应用 - 数据分析应用 - 数据管道

Ambari
· ☕ 4 
介绍 官网 Doc Ambari-2.7.1.0-Doc 安装 部署环境 | 主机名 | IP | 操作系统 | 角色 | | —- |:—-:|:—-:| | node1.wanglibing.com | 10.10.1.31 | CentOS7 | 本地库 Ambari Server | | node2.wanglibing.com | 10.10.1.32 | CentOS7 | Ambari Client | | node3.wanglibing.com | 10.10.1.33 | CentOS7 | Ambari Client | | node4.wanglibing.com | 10.10.1.21 | CentOS7 |

Apache HBase
· ☕ 1 
安装HBase 数据导入HBase HBase管理工具 HBase的备份和恢复 HBase的监控和诊断 HBase的运维与安全管理 问题诊断 性能调优 参考

使用Ambari部署Hadoop集群
· ☕ 2 
部署环境 | 主机名 | IP | 操作系统 | 角色 | | —- |:—-:|:—-:| | node1.wanglibing.com | 192.168.0.11 | CentOS7 | yum server ambari-client | | node2.wanglibing.com | 192.168.0.12 | CentOS7 | ambari-server ambari-client | 部署步骤 先决条件 配置项 说明 关闭防火墙 全部 关闭Selin