dp_tools

这是我在某教育公司数据平台组研制的小工具

estype_conflict_check

elastic search 数据库作为数据产出的目的地,在做后续数据统计分析是,如果代表相同含义的指标数据类型不一致(例如字符串和整数),聚合将会出错.本项目在于监控es数据库中每个表名字相同但数据类型不一致的冲突.
使用: 访问 http:127.0.0.1:9900/conflict

git clone https://github.com/tracyliang18/dp_tools.git

cd dp_tools python2 server.py (默认端口为9900)

elastic search数据库同名字段不同类型在聚合时会出现问题,必须确保同名字段同类型.检查的依据是elastic search server 中的http://es_ip:es_port/_mappings

以天为单位，描述了flow每天execution的汇总情况。列为时间天，行为flow中job节点的详细情况。flow中的每个节点可能包含succeed，failed，down，recent的信息。

一个flow单天可以执行多次executions，所以涉及到executions的合并。executions的合并逻辑在 models/utils/merge_node

按月份总结flow的执行情况。包括如下信息

字段	含义
运行日数	flow在该月运行的天数,刻画该资源的运行频率
成功时长	运行flow的成功时间累加,刻画机器资源做有用功的时间
失败时长	运行flow的失败时间累加,刻画机器资源做无用功的时间
DOWN时长	运行flow因失败down掉的时间累加,刻画flow失败后到修复的时间
成功时间比例	成功时长 / (成功时长 + 失败时长),刻画机器资源做有用功比例
DOWN时长比例	DOWN时长(s) / (运行日数2460*60),刻画运行期间Down掉时间比例
可用性	1 - DOWN时长比例
DOWN时长比例	DOWN时长(s) / (运行日数2460*60),刻画运行期间Down掉时间比例
DOWN总次数	DOWN掉次数
DOWN已修复	DOWN后被修复的次数
DOWN未修复	DOWN后没有被修复的次数

按指定时间粒度统计flow中各节点的运行情况.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
handlers		handlers
models		models
static		static
templates		templates
Screenshot.png		Screenshot.png
__init__.py		__init__.py
flow_details.png		flow_details.png
flowsummary.png		flowsummary.png
jobs.py		jobs.py
nodesummary.png		nodesummary.png
readme.md		readme.md
requirements.txt		requirements.txt
server.py		server.py
urls.py		urls.py