[go: up one dir, main page]

CN107506286A - Cpu和内存块的自动上下线方法和系统 - Google Patents

Cpu和内存块的自动上下线方法和系统 Download PDF

Info

Publication number
CN107506286A
CN107506286A CN201710882762.2A CN201710882762A CN107506286A CN 107506286 A CN107506286 A CN 107506286A CN 201710882762 A CN201710882762 A CN 201710882762A CN 107506286 A CN107506286 A CN 107506286A
Authority
CN
China
Prior art keywords
cpu
offline
memory block
memory
online
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710882762.2A
Other languages
English (en)
Inventor
任也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710882762.2A priority Critical patent/CN107506286A/zh
Publication of CN107506286A publication Critical patent/CN107506286A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了CPU和内存块的自动上下线方法和系统,所述方法根据选用的上下线策略,通过守护进程实时监控系统的CPU平均负载和内存使用率;当符合上线或下线的条件时,查询系统的CPU和内存块的在线状态位图,选出能够上、下线的CPU或内存块,进行上、下线操作;进行上、下线操作后,把对应CPU或内存块的在线状态更新至在线状态位图。本发明在导入预先制定的策略之后,对于实时变化的业务请求,服务器可以自动决策是否需要进行CPU和内存块的上下线,自动进行CPU和内存块的上、下线操作,反应速度快,决策更佳,提高了高端服务器使用的灵活性,也节省了人力管理成本,在适当条件下降低了整机能耗,降低了整机散热。

Description

CPU和内存块的自动上下线方法和系统
技术领域
本发明涉及高端服务器的操作系统设计技术领域,具体涉及CPU和内存块的自动上下线方法和系统。
背景技术
随着芯片互联技术的发展,一台高端服务器内部装配的处理器和内存越来越多,相应的,高端服务器的运算处理能力也越来越强大,整机能耗越来越多。在服务器内部,对于处理器的管理粒度为核或者称为CPU,而内存的管理粒度为统一大小的内存块。在高端服务器的使用过程中,根据不同的业务和不同的时间段,有时并不需要所有的CPU和内存块同时运作就可以满足业务需求。出于节能的考虑,在适当的时侯对高端服务器中包含的某些CPU和内存块进行下线操作,然后再在需要的时候把下线的CPU和内存块进行上线操作,这样能够更加灵活高效地使用一台高端服务器,也更加节能环保。
现有技术支持管理员在高端服务器的系统管理网页里进行手动的CPU、内存块上下线操作。手动进行CPU、内存块的上下线操作,人力成本高,反应速度慢,而且管理员往往无法做出最优的操作,比如下线几个cpu,几个内存块。
在运行某些业务的非高峰时段,管理员手动进行服务器的CPU和内存块的下线处理可以节省能耗,但是管理员往往无法判断下线多少CPU和内存块才在不影响业务运行的前提下达到最佳的节能效果。同时,如果骤然出现业务请求量增加的情况,而管理员不在岗位,那么已被下线的CPU和内存块不能及时上线,导致服务器的性能无法全部发挥,业务运行和用户体验会受到影响。
发明内容
本发明要解决的技术问题是:针对上述问题,本发明提供一种CPU和内存块的自动上下线方法和系统。
本发明所采用的技术方案为:
CPU和内存块的自动上下线方法,所述方法内容包括:
根据选用的上下线策略,通过守护进程实时监控系统的CPU平均负载和内存使用率;
当符合上线或下线的条件时,查询系统的CPU和内存块的在线状态位图,选出能够上、下线的CPU或内存块,进行上、下线操作;
进行上、下线操作后,把对应CPU或内存块的在线状态更新至在线状态位图。
所述方法内容还包括:
将所进行的上、下线操作记录于系统日志,便于出现系统故障时分析使用。
所述上下线策略的内容包括:
设X为CPU的平均负载的阈值,Y为内存使用率的阈值;
当系统的CPU平均负载大于X时,进行CPU上线操作;
当系统的CPU平均负载小于X时,进行CPU的下线操作;
当系统的CPU平均负载等于X时,不进行CPU的上下线操作;
当系统的内存使用率大于Y时,进行内存上线操作;
当系统的内存使用率小于Y时,进行内存下线操作;
当系统的内存使用率等于Y时,不进行内存的上下线操作。
所述上下线策略中,通过设置CPU上下线决策时间间隔T1和内存块上下线决策时间间隔T2,避免过于频繁的上下线操作会影响服务器的整机性能。
所述CPU的平均负载的阈值X和内存使用率的阈值Y设定一个波动范围,如(X±10%,Y±20%),代替策略(X,Y),进一步避免过于频繁的上下线操作会影响服务器的整机性能。
这样,上下线策略可拓展成( X ± m%,T1,Y ± n%,T2),其中m,n为1~99的自然数。
当CPU和内存块都符合下线条件时,优先下线CPU,可适当推迟下线内存,因为在整机能耗方面,一般来说CPU的能耗占比大于内存的能耗占比,着眼于节省能耗,本发明的自动上下线策略优先下线CPU。
CPU和内存块的自动上下线系统,所述系统包括:
上下线策略导入模块、CPU平均负载和内存使用率监控模块、上下线操作决策模块、上下线操作决策模块,其中:
上下线策略导入模块负责将选用的上下线策略导入;
CPU平均负载和内存使用率监控模块负责实时监控系统的CPU平均负载和内存使用率;
当符合上线或下线的条件时,上下线操作决策模块通过查询系统的CPU和内存块的在线状态位图,选出能够上、下线的CPU或内存块,通知上下线操作决策模块进行CPU或内存块的上、下线操作;
上下线操作决策模块进行上、下线操作后,上下线操作决策模块把对应CPU或内存块的在线状态更新至在线状态位图。
所述上下线操作决策模块将所进行的上、下线操作记录于系统日志,便于出现系统故障时分析使用。
本发明的有益效果为:
本发明在导入预先制定的策略之后,对于实时变化的业务请求,服务器可以自动决策是否需要进行CPU和内存块的上下线,自动进行CPU和内存块的上、下线操作,反应速度快,决策更佳,提高了高端服务器使用的灵活性,也节省了人力管理成本,在适当条件下降低了整机能耗,降低了整机散热。同时,把每次上下线操作记入了系统日志,也方便后续一旦发生机器故障时进行问题定位。
附图说明
图1为本发明方法自动上下线策略的执行流程图;
图2为自动上下线方法的实现系统示意图。
具体实施方式
根据说明书附图,结合具体实施方式对本发明进一步说明:
实施例1:
如图1所示,CPU和内存块的自动上下线方法,所述方法内容包括:
根据选用的上下线策略,通过守护进程实时监控系统的CPU平均负载和内存使用率;
当符合上线或下线的条件时,查询系统的CPU和内存块的在线状态位图,选出能够上、下线的CPU或内存块,进行上、下线操作;
进行上、下线操作后,把对应CPU或内存块的在线状态更新至在线状态位图。
所述方法内容还包括:
将所进行的上、下线操作记录于系统日志,便于出现系统故障时分析使用。
所述上下线策略的内容包括:
设X为CPU的平均负载的阈值,Y为内存使用率的阈值;
当系统的CPU平均负载大于X时,进行CPU上线操作;
当系统的CPU平均负载小于X时,进行CPU的下线操作;
当系统的CPU平均负载等于X时,不进行CPU的上下线操作;
当系统的内存使用率大于Y时,进行内存上线操作;
当系统的内存使用率小于Y时,进行内存下线操作;
当系统的内存使用率等于Y时,不进行内存的上下线操作。
实施例2
在实施例1的基础上,本实施例所述上下线策略中,通过设置CPU上下线决策时间间隔T1和内存块上下线决策时间间隔T2,避免过于频繁的上下线操作会影响服务器的整机性能。
所述CPU的平均负载的阈值X和内存使用率的阈值Y设定一个波动范围,如(X±10%,Y±20%),代替策略(X,Y),进一步避免过于频繁的上下线操作会影响服务器的整机性能。
这样,上下线策略可拓展成( X ± m%,T1,Y ± n%,T2),其中m,n为1~99的自然数。
实施例3
当CPU和内存块都符合下线条件时,优先下线CPU,可适当推迟下线内存,因为在整机能耗方面,一般来说CPU的能耗占比大于内存的能耗占比,着眼于节省能耗,本发明的自动上下线策略优先下线CPU。
实施例4
如图2所示,CPU和内存块的自动上下线系统,所述系统包括:
上下线策略导入模块、CPU平均负载和内存使用率监控模块、上下线操作决策模块、上下线操作决策模块,其中:
上下线策略导入模块负责将选用的上下线策略导入;
CPU平均负载和内存使用率监控模块负责实时监控系统的CPU平均负载和内存使用率;
当符合上线或下线的条件时,上下线操作决策模块通过查询系统的CPU和内存块的在线状态位图,选出能够上、下线的CPU或内存块,通知上下线操作决策模块进行CPU或内存块的上、下线操作;
上下线操作决策模块进行上、下线操作后,上下线操作决策模块把对应CPU或内存块的在线状态更新至在线状态位图。
实施例5
在实施例4的基础上,本实施例所述上下线操作决策模块将所进行的上、下线操作记录于系统日志,便于出现系统故障时分析使用。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (8)

1.CPU和内存块的自动上下线方法,其特征在于,所述方法内容包括:
根据选用的上下线策略,通过守护进程实时监控系统的CPU平均负载和内存使用率;
当符合上线或下线的条件时,查询系统的CPU和内存块的在线状态位图,选出能够上、下线的CPU或内存块,进行上、下线操作;
进行上、下线操作后,把对应CPU或内存块的在线状态更新至在线状态位图。
2.根据权利要求1所述的CPU和内存块的自动上下线方法,其特征在于,所述方法内容还包括:
将所进行的上、下线操作记录于系统日志。
3.根据权利要求2所述的CPU和内存块的自动上下线方法,其特征在于,所述上下线策略的内容包括:
设X为CPU的平均负载的阈值,Y为内存使用率的阈值;
当系统的CPU平均负载大于X时,进行CPU上线操作;
当系统的CPU平均负载小于X时,进行CPU的下线操作;
当系统的CPU平均负载等于X时,不进行CPU的上下线操作;
当系统的内存使用率大于Y时,进行内存上线操作;
当系统的内存使用率小于Y时,进行内存下线操作;
当系统的内存使用率等于Y时,不进行内存的上下线操作。
4.根据权利要求3所述的CPU和内存块的自动上下线方法,其特征在于,所述上下线策略中,通过设置CPU上下线决策时间间隔T1和内存块上下线决策时间间隔T2。
5.根据权利要求4所述的CPU和内存块的自动上下线方法,其特征在于,所述方法的内容还包括:
将CPU的平均负载的阈值X和内存使用率的阈值Y设定一个波动范围。
6.根据上述任一权利要求所述的CPU和内存块的自动上下线方法,其特征在于,当CPU和内存块都符合下线条件时,优先下线CPU。
7.CPU和内存块的自动上下线系统,其特征在于,所述系统包括:
上下线策略导入模块、CPU平均负载和内存使用率监控模块、上下线操作决策模块、上下线操作决策模块,其中:
上下线策略导入模块负责将选用的上下线策略导入;
CPU平均负载和内存使用率监控模块负责实时监控系统的CPU平均负载和内存使用率;
当符合上线或下线的条件时,上下线操作决策模块通过查询系统的CPU和内存块的在线状态位图,选出能够上、下线的CPU或内存块,通知上下线操作决策模块进行CPU或内存块的上、下线操作;
上下线操作决策模块进行上、下线操作后,上下线操作决策模块把对应CPU或内存块的在线状态更新至在线状态位图。
8.根据权利要求7所述的CPU和内存块的自动上下线系统,其特征在于,所述上下线操作决策模块将所进行的上、下线操作记录于系统日志。
CN201710882762.2A 2017-09-26 2017-09-26 Cpu和内存块的自动上下线方法和系统 Pending CN107506286A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710882762.2A CN107506286A (zh) 2017-09-26 2017-09-26 Cpu和内存块的自动上下线方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710882762.2A CN107506286A (zh) 2017-09-26 2017-09-26 Cpu和内存块的自动上下线方法和系统

Publications (1)

Publication Number Publication Date
CN107506286A true CN107506286A (zh) 2017-12-22

Family

ID=60699402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710882762.2A Pending CN107506286A (zh) 2017-09-26 2017-09-26 Cpu和内存块的自动上下线方法和系统

Country Status (1)

Country Link
CN (1) CN107506286A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408242A (zh) * 2018-11-13 2019-03-01 郑州云海信息技术有限公司 一种服务器资源上下线方法与装置
CN109471724A (zh) * 2018-10-23 2019-03-15 郑州云海信息技术有限公司 一种切换工作内存数量的方法及系统
CN110851330A (zh) * 2019-11-13 2020-02-28 重庆秦嵩科技有限公司 一种cpu在线监控方法
WO2021101584A1 (en) * 2019-11-18 2021-05-27 Sandisk Technologies Llc Core controller architecture

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673223A (zh) * 2009-10-22 2010-03-17 同济大学 基于片上多处理器的线程调度实现方法
CN102222014A (zh) * 2011-06-16 2011-10-19 华中科技大学 基于内存热插拔的虚拟机动态内存管理系统
CN102520782A (zh) * 2011-12-15 2012-06-27 江苏中科梦兰电子科技有限公司 基于处理器核数自动调节的电源管理方法
CN102567107A (zh) * 2011-10-31 2012-07-11 广东电网公司电力科学研究院 高并行的实时内存资源管理调度方法
CN104503838A (zh) * 2014-11-23 2015-04-08 华中科技大学 一种虚拟cpu调度方法
CN105955809A (zh) * 2016-04-25 2016-09-21 深圳市万普拉斯科技有限公司 线程调度方法和系统
JP2017107486A (ja) * 2015-12-11 2017-06-15 富士通株式会社 処理リソース制御プログラム、処理リソース制御装置、および処理リソース制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673223A (zh) * 2009-10-22 2010-03-17 同济大学 基于片上多处理器的线程调度实现方法
CN102222014A (zh) * 2011-06-16 2011-10-19 华中科技大学 基于内存热插拔的虚拟机动态内存管理系统
CN102567107A (zh) * 2011-10-31 2012-07-11 广东电网公司电力科学研究院 高并行的实时内存资源管理调度方法
CN102520782A (zh) * 2011-12-15 2012-06-27 江苏中科梦兰电子科技有限公司 基于处理器核数自动调节的电源管理方法
CN104503838A (zh) * 2014-11-23 2015-04-08 华中科技大学 一种虚拟cpu调度方法
JP2017107486A (ja) * 2015-12-11 2017-06-15 富士通株式会社 処理リソース制御プログラム、処理リソース制御装置、および処理リソース制御方法
CN105955809A (zh) * 2016-04-25 2016-09-21 深圳市万普拉斯科技有限公司 线程调度方法和系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471724A (zh) * 2018-10-23 2019-03-15 郑州云海信息技术有限公司 一种切换工作内存数量的方法及系统
CN109408242A (zh) * 2018-11-13 2019-03-01 郑州云海信息技术有限公司 一种服务器资源上下线方法与装置
CN109408242B (zh) * 2018-11-13 2020-08-04 郑州云海信息技术有限公司 一种服务器资源上下线方法与装置
CN110851330A (zh) * 2019-11-13 2020-02-28 重庆秦嵩科技有限公司 一种cpu在线监控方法
CN110851330B (zh) * 2019-11-13 2023-04-21 重庆秦嵩科技有限公司 一种cpu在线监控方法
WO2021101584A1 (en) * 2019-11-18 2021-05-27 Sandisk Technologies Llc Core controller architecture

Similar Documents

Publication Publication Date Title
CA2741088C (en) Methods of achieving cognizant power management
Zhou et al. Virtual machine placement algorithm for both energy‐awareness and SLA violation reduction in cloud data centers
CN107506286A (zh) Cpu和内存块的自动上下线方法和系统
CN104423529B (zh) 中央处理单元状态调整方法和装置
CN103684916A (zh) 一种云计算下智能监控分析方法及系统
CN103645795A (zh) 一种基于人工神经网络的云计算数据中心节能方法
CN106059835B (zh) 一种低能耗计算机集群节点的高可靠性控制方法
CN103077082A (zh) 一种数据中心负载分配及虚拟机迁移节能方法及系统
CN110677305A (zh) 一种云计算环境下的自动伸缩方法和系统
CN102882909A (zh) 云计算服务监控系统及方法
CN114442794B (zh) 服务器功耗控制方法、系统、终端及存储介质
CN104468752A (zh) 一种提高云计算资源利用率的方法及系统
CN107329811A (zh) 一种数据中心功耗调节方法及装置
CN103299279A (zh) 一种资源调度方法及设备
CN105577796A (zh) 集群的功耗控制方法及装置
CN103970256B (zh) 一种基于内存压缩和cpu动态调频的节能方法及系统
CN101794169B (zh) 基于改变控制模式进行机群系统能耗管控的方法
CN106897133A (zh) 一种基于pbs作业调度管理集群负载的实现方法
CN104360724B (zh) 一种基于作业调度的刀片服务器的散热方法
CN108287749A (zh) 一种数据中心综合管理系统云资源调度方法
CN100407104C (zh) 操作系统协作下的嵌入式设备电源管理方法及系统
CN103617090A (zh) 一种基于分布式管理的节能方法
CN105005504A (zh) 一种安卓平台的单任务模式实现方法及系统
Xu et al. A virtual machine scheduling method for trade-offs between energy and performance in cloud environment
US20130091313A1 (en) Method and apparatus for device dynamic addition processing, and method and apparatus for device dynamic removal processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171222

RJ01 Rejection of invention patent application after publication