栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

数据采集完善脚本

数据采集完善脚本

 

#!/bin/bash

#记录日志文件的目录
log_dir=/root/log
#定义一下此需求的关键单词
log_prefix=order_status_log

function write_log(){
  #定义一下日志的输出格式
  log_format="`date '+%Y-%m-%d %H:%M:%S'` ${1} >>"
  #需要将日志信息放到日志文件目录中
  echo "${log_format} $2" >> ${log_dir}/${log_prefix}.`date '+%Y-%m-%d'`.log
  #如果接受的第一个参数是ERROR,就直接退出
  [ $1 == "ERROR" ] && exit 1
}
date=`cat /root/sh/date`
afterday_timestamp=$[`date -d "${date}" +%s`+86400]
afterday=`date -d @${afterday_timestamp} +%Y%m%d`
sed -i "s/order_status_log${date}/order_status_log${afterday}/g" /root/datax/job/log.json
sed -i "s/${date}/${afterday}/g" /root/sh/date
write_log INFO "log.json文件的日期由${date}成功替换成${afterday}!!!"
python /root/datax/bin/datax.py /root/datax/job/log.json

if [ $? -eq 0 ];then
  result_num=`hive -e "use test;select count(id) from  order_status_log${afterday};"`
  write_log INFO "数据从mysql采集到hive成功!!!采集成功的数据有${result_num}条!!!"
else
  write_log ERROR "数据从mysql采集到hive失败!!!请立即检查!!!"
fi

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/652629.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号