加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 襄阳站长网 (https://www.0710zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

CBoard可视化工具以及大数据分析平台的设计与实现

发布时间:2022-12-09 10:51:30 所属栏目:大数据 来源:
导读:  运行环境:JDK1.8、(源码编译)、+/(系统元数据存储)、 2.1+(用于看板导出和邮件发送)、

  #环境准备

  #安装-2.1.3

  下载地址:

  tar -xjvf -2.1.1-linux-.tar.bz2

  vim
  运行环境:JDK1.8、(源码编译)、+/(系统元数据存储)、 2.1+(用于看板导出和邮件发送)、
 
  #环境准备
 
  #安装-2.1.3
 
  下载地址:
 
  tar -xjvf -2.1.1-linux-.tar.bz2
 
  vim /etc/
 
  =/home//apps/-2.1.1
 
  PATH=$PATH:${}/bin
 
  /etc/
 
  执行运行正常即安装成功
 
  #安装配置
 
  的地址:
 
  #修改配置文件
 
  ##系统配置
 
  /src/main//.
 
  =jdbc:mysql://192.168.137.100:3306/
 
  =hive
 
  =
 
  =/home//apps/-2.1.1/bin/
 
  ##中英文显示配置
 
  /src/main//org//.js
 
  var = {
 
  : "cn" // en/cn: to
 
  };
 
  #maven打包前需要提前安装maven以及在root用户/etc/配置maven环境变量
 
  #maven打包:
 
  ##的jdbc驱动包添加到maven库
 
  mvn :-file -Dfile=lib/-4.0.jar -=com.. -= -=4.0 -=jar
 
  ##打包
 
  mvn clean
 
  #在mysql中创建数据库
 
  ;
 
  #从源码包的/sql/mysql目录下找到mysql.sql文件
 
  #在mysql命令行中执行sql脚本文件
 
  mysql> ///sql/mysql/mysql.sql
 
  #解压
 
  #拷贝编译好的.war包到的目录下
 
  cp ////.war /home//apps/-7/
 
  #修改-7/conf目录下.xml服务相关配置项
 
  #绑定端口号8080
 
  #绑定IP
 
  #启动
 
  bin/.sh
 
  #关闭
 
  bin/.sh
 
  #在浏览器中访问
 
  :8080/
 
  #初始登录用户名密码
 
  admin
 
  首先到192.168.137.102,192.168.137.103c 大数据绘图,192.168.137.104上启动kafka
 
  *******************kafka*************
 
  #创建主题
 
  bin/kafka-.sh -- -- 192.168.137.100:2181 --- 1 -- 3 --topic
 
  #查看kafka中已经创建的主题列表
 
  bin/kafka-.sh --list -- 192.168.137.100:2181
 
  //#删除主题
 
  //bin/kafka-.sh -- -- //192.168.137.100:2181 --topic
 
  #在192.168.137.102使用kafka自带的消费者客户端脚本
 
  bin/kafka--.sh -- 192.168.137.100:2181 --from- --topic
 
  ●●提前在/home//apps目录下创建目录
 
  ********************模拟日志生成*************
 
  ********************flume日志收集*************
 
  #hdfs创建/data/目录
 
  fs -mkdir /data/
 
  #在192.168.137.100启动用户日志收集客户端
 
  bin/flume-ng agent --conf conf --conf-file conf/.conf --name -.root.=INFO,
 
  #后台运行
 
  bin/flume-ng agent --conf conf --conf-file conf/.conf --name >/dev/null 2>&1 &
 
  #在和分别启动日志收集,在192.168.137.101启动
 
  ##bin/flume-ng agent --conf conf --conf-file ##conf/.conf --name -##.root.=INFO,
 
  bin/flume-ng agent --conf conf --conf-file conf/.conf --name -.root.=INFO,
 
  bin/flume-ng agent --conf conf --conf-file conf/.conf --name >/dev/null 2>&1 &
 
  ********************hive数据仓库*************
 
  #一、创建原始日志临时存储ods库
 
  ods;
 
  ##1.创建用户日志外部分区表
 
  #用户id,使用的客户端版本号,地域id,用户行为,时间戳
 
  table ods.(
 
  ,
 
  ,
 
  ,
 
  int,
 
  time
 
  )
 
  by(dt )
 
  row
 
  by ','
 
  lines by '\n'
 
  as
 
  '/data/';
 
  #二、创建历史明细数据长期存储pdw库
 
  pdw;
 
  ##1.创建用户日志明细表
 
  //用户id,使用的客户端版本号,客户端类型c 大数据绘图,地域id,地域名称,时间戳,曝光,点击
 
  table pdw.(
 
  ,
 
  ,
 
  ,
 
  ,
 
  ,
 
  time ,
 
  int,
 
  int
 
  )
 
  by(dt )
 
  row
 
  by '\t'
 
  lines by '\n'
 
  as ;
 
  ##2.创建新增用户明细表(用于计算新增用户数,累计用户)
 
  //新增用户id,时间戳
 
  table pdw.(
 
  ,
 
  time
 
  )
 
  by(dt )
 
  row
 
  by '\t'
 
  lines by '\n'
 
  as ;
 
  ●●首先在/home//apps目录下创建/data目录,然后将课上老师给2个文件.txt和data.txt利用rz命令导入
 
  #三、创建存储维度关系表的rel库
 
  rel;
 
  ##1.创建地域表
 
  //字段信息:地域编码、地域名称
 
  table rel.(
 
  id ,
 
  name
 
  )
 
  row
 
  by '\t'
 
  lines by '\n'
 
  as ;
 
  //导入数据:
 
  load data local '/home//apps//data/.txt' into table ;
 
  ##2.创建客户端版本与客户端类型的映射关系表
 
  table rel.info(
 
  ,
 
  type
 
  )
 
  row
 
  by '\t'
 
  lines by '\n'
 
  as ;
 
  //导入数据:
 
  load data local '/home//apps//data/data.txt' into table info;
 
  #离线报表
 
  ●●首先需要在/home//apps/路径下创建task目录,然后将课程老师发的四个sh脚本.sh、.sh、daily.sh、.sh利用rz命令导入
 
  #时间戳最小时的用户ID,即新增用户
 
  #限制该用户没有在pdw.中出现过,才为新增用户
 
  脚本路径:/home//apps//task
 
  ##hive task,原始数据ETL -> 明细数据
 
  //用户明细
 
  .sh
 
  //新增用户
 
  daily.sh
 
  ##报表任务
 
  //新增用户数、活跃用户数、累计用户数
 
  .sh
 
  //日期、客户端类型、曝光量、点击量
 
  .sh
 
  #实时报表
 
  ##创建mysql数据库bi
 
  bi;
 
  ##创建实时关键指标表
 
  TABLE `` (
 
  `` int(11) NOT NULL,
 
  `` int(11) NOT NULL,
 
  `` (512) NULL
 
  ) = =;
 
  执行cs.scala程序
 

(编辑:PHP编程网 - 襄阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!