CN114489235B - 一种用于异常温度处理的芯片频率动态调节方法及系统 - Google Patents
一种用于异常温度处理的芯片频率动态调节方法及系统 Download PDFInfo
- Publication number
- CN114489235B CN114489235B CN202210052416.2A CN202210052416A CN114489235B CN 114489235 B CN114489235 B CN 114489235B CN 202210052416 A CN202210052416 A CN 202210052416A CN 114489235 B CN114489235 B CN 114489235B
- Authority
- CN
- China
- Prior art keywords
- temperature
- frequency
- alert
- prochot
- chip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/04—Generating or distributing clock signals or signals derived directly therefrom
- G06F1/08—Clock generators with changeable or programmable clock frequency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02H—EMERGENCY PROTECTIVE CIRCUIT ARRANGEMENTS
- H02H7/00—Emergency protective circuit arrangements specially adapted for specific types of electric machines or apparatus or for sectionalised protection of cable or line systems, and effecting automatic switching in the event of an undesired change from normal working conditions
- H02H7/20—Emergency protective circuit arrangements specially adapted for specific types of electric machines or apparatus or for sectionalised protection of cable or line systems, and effecting automatic switching in the event of an undesired change from normal working conditions for electronic equipment
- H02H7/205—Emergency protective circuit arrangements specially adapted for specific types of electric machines or apparatus or for sectionalised protection of cable or line systems, and effecting automatic switching in the event of an undesired change from normal working conditions for electronic equipment for controlled semi-conductors which are not included in a specific circuit arrangement
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Power Engineering (AREA)
- Control Of Temperature (AREA)
Abstract
本发明公开一种用于异常温度处理的芯片频率动态调节方法及系统,提出一种异常温度处理的硬件方案,硬件系统主要包括若干温度传感器、温度传感控制器、Alert温度比较器、Prochot温度比较器和带有状态机的PLL控制器。发生温度异常时无需上层软件干预,也无需底层固件干预,不等中断、不停任务即可进行快速响应,降温迅速;通过预设两级权重,在保证有效降温的前提下,控制灵活,尽量减少对芯片性能的影响;通过两级降频可以有效防止芯片电压的正向过冲,两级升频也可以有效防止电压的负向过冲。
Description
技术领域
本发明属于芯片温度异常控制领域,具体涉及一种用于异常温度处理的芯片频率动态调节方法及系统。
背景技术
PCIe板卡的温度控制大体上分为主动散热和被动散热两种,主动散热为板卡自带风扇,风扇由芯片产生的PWM脉宽调制波来控制转速,脉宽调制波的占空比和温度相关,以起到降温作用。被动散热是PCIe板卡本身不带风扇,风扇位于服务器系统里,由主控CPU进行风扇的统一控制,服务器内通常有多块板卡,比如8块,主控CPU会通过带外BMC系统读取芯片温度,然后统一调整服务器的风扇系统保证芯片工作在正常工作温度内。
以上都为正常的温度控制,频率和负载都在正常范围内。一旦由于超频或者负载超重导致温度超越正常范围,进入异常状态,用于主动散热或者被动散热的风冷或者水冷无法处理这种情形。通常的异常处理,一种方式是交给上层软件,当收到温度异常中断,然后停发任务,从而达到减轻负载的作用,但是负载的减轻需要时间,虽然软件可以控制不再发放任务,但是已发放任务的仍然在运行,负载并未立即减轻,仍然会导致温度异常或者异常温度继续上升。另一种方式是交给系统控制单元固件,当收到温度异常中断,或者通过周期性的检测温度,发现温度超过Alert阈值(Talert)或者Prochot阈值(Tprochot)后采取对应处理策略,可控制频率,从而降低温度,但是此为软件方案,从收到中断或是周期性的检测到发命令干预处理,需要一段时间,此段时间温度继续上升,存在过温隐患,有可能导致Thermaltrip,直接断电,丢失现场。
发明内容
本发明针对现有技术中的不足,提出一种用于异常温度处理的芯片频率动态调节方法及系统,实现了硬件的方案,提供温度异常时的快速保护机制,在保证芯片温度安全的前提下,同时平衡温度异常时的芯片频率性能。
为实现上述目的,本发明采用以下技术方案:
一种用于异常温度处理的芯片频率动态调节方法,包括以下步骤:
步骤1:将多组温度传感器设置在芯片的多个热点区域,对各热点区域的温度信息进行定时采样,并将温度信息通过ADC转化得到的温度数字表征传送给温度传感控制器;
步骤2::温度传感控制器通过硬件统计获取同一时刻接收到的各温度数字表征中的最大值Tmax,并将最大值分别传送给Alert温度比较器、Prochot温度比较器和PLL控制器;
步骤3:Prochot温度比较器将Tmax与设定的Prochot阈值Tprochot进行比较,并将比较结果传送给PLL控制器,同时,Alert温度比较器将Tmax与设定的Alert阈值Talert进行比较,并将比较结果传送给PLL控制器;
步骤4:PLL控制器根据Alert温度比较器和Prochot温度比较器的比较结果,计算芯片应处于的工作频率,并据此输出相应的分频系数,分频系数将控制PLL控制器的外围电路进行无毛刺的时钟切换以调整芯片的工作频率。
进一步地,所述步骤4中,
若Tmax≤Tprochot且Tmax≤Talert,则保持当前频率不变,不进行频率调节;
若Tmax≤Tprochot且Tmax>Talert,则进入Alert温度异常处理调节状态机,根据预先设置的Alert权值Walert调整频率并保持,Fout=Walert*Fori,Fout为芯片应处于的工作频率,Fori为调整前的芯片工作频率;然后继续获取下一时刻的Tmax,若下一时刻的Tmax≥Talert–Ta_s_margin,仍然保持Fout=Walert*Fori,Ta_s_margin为Alert温度容限,否则恢复频率并保持Fout=Fori;
若Tmax>Tprochot,则进入Prochot温度异常处理调节状态机,根据预先设置的Prochot权值Wprochot调整频率并保持,Fout=Wprochot*Fori;然后继续获取下一时刻的Tmax,若下一时刻的Tmax≥Tprochot–Tp_s_margin,仍然保持Fout=Wprochot*Fori,Tp_s_margin为Prochot温度容限,否则先恢复到Alert温度异常处理调节状态机的输出频率Fout=Walert*Fori,然后进入Alert温度异常处理调节状态机。
基于所述芯片频率动态调节方法的频率调节系统,包括若干温度传感器、温度传感控制器、Alert温度比较器、Prochot温度比较器和带有状态机的PLL控制器;所述若干温度传感器设置在芯片的多个热点区域,用于定时采集各热点区域的温度信息并上传到温度传感控制器;所述温度传感控制器用于设置温度信息的采样时间间隔,并通过硬件统计获取同一时刻的温度最大值,然后将温度最大值同时上传给Alert温度比较器、Prochot温度比较器和PLL控制器;所述PLL控制器用于计算芯片应处于的工作频率并输出相应的时钟信号以调整芯片的工作频率。
相比于现有技术,本发明具有以下技术效果:提出一种异常温度处理的硬件方案,发生Alert时无需上层软件干预,也无需底层固件干预,不等中断、不停任务即可进行快速响应,降温迅速;预设两级权重,在保证有效降温的前提下,控制灵活,尽量减少对芯片性能的影响;两级降频可以有效防止芯片电压的正向过冲,两级升频也可以有效防止电压的负向过冲。
附图说明
图1为本发明异常温度处理的硬件系统示意图;
图2为本发明芯片频率动态调节方法的流程示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
如图1所示,一种用于异常温度处理的动态频率调节硬件系统,包括多组温度传感器(T-sensor),温度传感控制器(T-sensor controller)、Alert温度比较器(Talertcomparator)、Prochot温度比较器(Tprochot comparator)和带有状态机的PLL控制器(PLLcontroller)。
多组温度传感器分散布局在芯片的多个热点区域,来定期实时的采样热点温度信息,并通过ADC转换得到数字表征,这些数字表征将送给温度传感控制器。温度传感控制器用于对定期收集的温度传感信息进行转换,同时通过硬件统计得到最大值Tmax,最大值将输入给Alert和Prochot两个温度比较器以及PLL控制器。
Alert温度比较器用于比较来自温度传感控制器的Tmax和设定的Alert阈值温度(Talert),比较状态将给到后级PLL控制器;Prochot温度比较器用于比较来自温度传感控制器的Tmax和设定的Prochot阈值温度(Tprochot),比较状态也将同时给到后级PLL控制器。
PLL控制器根据前序Alert温度比较器和Prochot温度比较器的输出状态,通过控制状态机来决定设置PLL的分频系数,分频系数将直接控制PLL外围电路进行无毛刺的时钟切换,进而调整芯片的工作频率。PLL控制器输出的分频系数完全根据Alert温度比较器和Prochot温度比较器硬件锁定,可以实时的实现对于温度变化的频率反馈。PLL控制器输出的分频系数可以根据预设权重Walert和Wprochot对输出频率做精细控制,在保证温度安全的前提下,也尽可能不损伤芯片性能。
如图2所示,温度传感控制器定期收集分散布局的温度传感器信息得到最大温度值,然后和预先设置的Prochot温度阈值做比对,如果小于Tprochot,就进入下一步和预设置的Alert温度阈值做比对,如果仍然小于Talert,则保持当前频率,不进行频率调节;如果大于Talert,根据预先设置的Alert的权值调整频率并保持频率,即Fout=Walert*Fori,Fout为芯片应处于的工作频率,Fori为调整前的芯片工作频率;然后温度传感器控制器继续获取温度,如果不小于Talert–Ta_s_margin,仍然保持Fout=Walert*Fori,Ta_s_margin为Alert温度容限,否则恢复频率并保持Fout=Fori。
在两个温度比较阶段,如果温度大于Tprochot,则进入Prochot温度异常处理调节状态机,使用预先设置的Prochot的权值调整频率并保持,即Fout=Wprochot*Fori,然后温度传感器控制器继续获取温度,如果不小于Tprochot–Tp_s_margin,仍然保持Fout=Wprochot*Fori,Tp_s_margin为Prochot温度容限;如果温度下降到Tprochot–Tp_s_margin以下,则先恢复到Alert的频率,Fout=Walert*Fori,然后走Alert温度异常调节的状态机。
本发明在温度异常进行硬件降频时,先降频到Alert对应的频率,再降频到Prochot对应的频率,而不是一步降频到Prochot对应的频率,逐级快速降频防止芯片电流切换过快导致的正向过冲。在异常恢复后进行反向硬件升频时,也是两级相应,先升频到Alert对应的频率,再升频到原始的正常频率,升频的安全温度margin可预置,而不是一步升频到对应的频率,逐级快速升频防止芯片电流切换过快导致的负向过冲。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (1)
1.一种用于异常温度处理的芯片频率动态调节方法,其特征在于,该芯片频率动态调节方法基于芯片频率动态调节方法的频率调节系统以实现,所述芯片频率动态调节方法的频率调节系统包括若干温度传感器、温度传感控制器、Alert温度比较器、Prochot温度比较器和带有状态机的PLL控制器;
所述若干温度传感器设置在芯片的多个热点区域,用于定时采集各热点区域的温度信息并上传到温度传感控制器;所述温度传感控制器用于设置温度信息的采样时间间隔,并通过硬件统计获取同一时刻的温度最大值,然后将温度最大值同时上传给Alert温度比较器、Prochot温度比较器和PLL控制器;所述PLL控制器用于计算芯片应处于的工作频率并输出相应的时钟信号以调整芯片的工作频率;
基于所述芯片频率动态调节方法的频率调节系统,以实现用于异常温度处理的芯片频率动态调节方法:在温度异常进行硬件降频时,先降频到Alert对应的频率,再降频到Prochot对应的频率;
在异常恢复后进行反向硬件升频时,先升频到Alert对应的频率,再升频到原始的正常频率,升频的安全温度margin可预置;
所述芯片频率动态调节方法具体包括以下步骤:
步骤1:将多组温度传感器设置在芯片的多个热点区域,对各热点区域的温度信息进行定时采样,并将温度信息通过ADC转化得到的温度数字表征传送给温度传感控制器;
步骤2:温度传感控制器通过硬件统计获取同一时刻接收到的各温度数字表征中的最大值Tmax,并将最大值分别传送给Alert温度比较器和Prochot温度比较器;
步骤3:Prochot温度比较器将Tmax与设定的Prochot阈值Tprochot进行比较,并将比较结果传送给PLL控制器,同时,Alert温度比较器将Tmax与设定的Alert阈值Talert进行比较,并将比较结果传送给PLL控制器;
步骤4:PLL控制器根据Alert温度比较器和Prochot温度比较器的比较结果,计算芯片应处于的工作频率,并据此输出相应的分频系数,分频系数将控制PLL控制器的外围电路进行无毛刺的时钟切换以调整芯片的工作频率;
若Tmax ≤ Tprochot且Tmax ≤ Talert,则保持当前频率不变,不进行频率调节;
若Tmax ≤ Tprochot且Tmax > Talert,则进入Alert温度异常处理调节状态机,根据预先设置的Alert权值Walert调整频率并保持,Fout = Walert * Fori,Fout为芯片应处于的工作频率,Fori为调整前的芯片工作频率;然后继续获取下一时刻的Tmax,若下一时刻的Tmax ≥ Talert –Ta_s_margin,仍然保持Fout = Walert * Fori,Ta_s_margin为Alert温度容限,否则恢复频率并保持Fout = Fori;
若Tmax > Tprochot,则进入Prochot温度异常处理调节状态机,根据预先设置的Prochot权值Wprochot调整频率并保持,Fout = Wprochot * Fori;然后继续获取下一时刻的Tmax,若下一时刻的Tmax ≥ Tprochot – Tp_s_margin,仍然保持Fout = Wprochot * Fori,Tp_s_margin为Prochot温度容限,否则先恢复到Alert温度异常处理调节状态机的输出频率Fout = Walert * Fori,然后进入Alert温度异常处理调节状态机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210052416.2A CN114489235B (zh) | 2022-01-18 | 2022-01-18 | 一种用于异常温度处理的芯片频率动态调节方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210052416.2A CN114489235B (zh) | 2022-01-18 | 2022-01-18 | 一种用于异常温度处理的芯片频率动态调节方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114489235A CN114489235A (zh) | 2022-05-13 |
CN114489235B true CN114489235B (zh) | 2024-09-27 |
Family
ID=81511613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210052416.2A Active CN114489235B (zh) | 2022-01-18 | 2022-01-18 | 一种用于异常温度处理的芯片频率动态调节方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114489235B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117215394B (zh) * | 2023-11-07 | 2024-01-23 | 北京数渡信息科技有限公司 | 一种面向多核处理器的片上温度和能耗控制装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102055166A (zh) * | 2009-10-27 | 2011-05-11 | 深圳长城开发科技股份有限公司 | 电力设备及其高温自我保护方法 |
CN103514011A (zh) * | 2012-06-21 | 2014-01-15 | 苹果公司 | 热控制装置和方法 |
CN112650128A (zh) * | 2020-12-29 | 2021-04-13 | 无锡众星微系统技术有限公司 | 芯片过热自动保护方法和装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103376859B (zh) * | 2012-04-26 | 2016-12-14 | 华为技术有限公司 | 芯片性能的控制方法及装置 |
US9461626B2 (en) * | 2014-07-14 | 2016-10-04 | Qualcomm Incorporated | Dynamic voltage adjustment of an I/O interface signal |
US10061331B2 (en) * | 2015-01-22 | 2018-08-28 | Qualcomm Incorporated | Systems and methods for detecting thermal runaway |
US10248173B2 (en) * | 2016-03-31 | 2019-04-02 | Intel Corporation | Determining thermal margins in a multi-die processor |
US10705581B2 (en) * | 2017-03-24 | 2020-07-07 | Motorola Mobility Llc | Controlling device performance based on temperature differential |
CN108983922A (zh) * | 2018-06-27 | 2018-12-11 | 紫光华山信息技术有限公司 | 工作频率调节方法、装置及服务器 |
DE102020101282A1 (de) * | 2019-04-12 | 2020-10-15 | Samsung Electronics Co., Ltd. | Verfahren und Vorrichtung für ein Wärmemanagement in einer drahtlosen Kommunikation |
CN110703898A (zh) * | 2019-09-06 | 2020-01-17 | 无锡江南计算技术研究所 | 基于周期性查询和中断的处理器功耗动态管理系统及方法 |
CN112741686A (zh) * | 2019-10-29 | 2021-05-04 | 广州星际悦动股份有限公司 | 温度平衡控制方法及装置 |
CN110928387B (zh) * | 2019-12-09 | 2021-08-31 | Oppo广东移动通信有限公司 | 温度控制方法、装置、存储介质及电子设备 |
CN111536022B (zh) * | 2020-04-25 | 2022-07-22 | 壹格建筑科技(上海)有限公司 | 压缩机防冻保护的控制方法、装置和计算机可读存储介质 |
-
2022
- 2022-01-18 CN CN202210052416.2A patent/CN114489235B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102055166A (zh) * | 2009-10-27 | 2011-05-11 | 深圳长城开发科技股份有限公司 | 电力设备及其高温自我保护方法 |
CN103514011A (zh) * | 2012-06-21 | 2014-01-15 | 苹果公司 | 热控制装置和方法 |
CN112650128A (zh) * | 2020-12-29 | 2021-04-13 | 无锡众星微系统技术有限公司 | 芯片过热自动保护方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114489235A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8539269B2 (en) | Apparatus and method for high current protection | |
CN114489235B (zh) | 一种用于异常温度处理的芯片频率动态调节方法及系统 | |
CN111550426B (zh) | 一种温度调节方法、装置、终端设备及存储介质 | |
CN106837838A (zh) | 服务器风扇转速的控制系统及方法 | |
CN110881262B (zh) | 一种数据机房液冷系统冷源输出容量的控制方法 | |
RU2581612C1 (ru) | Ограничение перегрузки при работе с пиковой мощностью | |
CN119543447A (zh) | 一种基于智慧配电云平台控制的低压抽出式开关柜 | |
EP3916516A2 (en) | Thermal management method for multiple heat sources and wireless communication apparatus having multiple heat sources | |
CN118539827A (zh) | 电机控制方法、系统及电子设备 | |
CN118763947A (zh) | 一种舱门系统电机恒功率控制系统 | |
CN116470697A (zh) | 一种自调节液冷电机装置及其调节方法 | |
CN111156187A (zh) | 一种服务器风扇转速控制方法及装置 | |
CN111817555A (zh) | 驱动电阻可调的空调室外机组转换器电路及控制方法 | |
CN117355102A (zh) | 一种基于模型预测的电力电子设备散热调节方法及装置、设备 | |
CN115525072B (zh) | 一种可控硅均热控制方法、装置和计算机可读存储介质 | |
US12213292B2 (en) | Cooling of semiconductors for optimised service life | |
CN1485543A (zh) | Ups风扇控制方法 | |
US11340691B2 (en) | Heat dissipation apparatus with energy-saving effect and method of controlling the same | |
CN222813113U (zh) | 一种服务器关键部件智能控温调速装置及服务器 | |
CN212717325U (zh) | 一种基于全范围温度检测集中控制的直流风机调速电路 | |
TWM618846U (zh) | 電力調節系統 | |
CN112051883A (zh) | 一种实现电流快速响应的芯片控制方法 | |
CN117369612B (zh) | 一种服务器硬件管理系统及方法 | |
CN119891884B (zh) | 一种基于多参数联动的电机冷却系统控制装置 | |
CN111412163A (zh) | 计算机电源风扇的温控方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: Room 101, Building 3, No. 2168 Chenhang Road, Minhang District, Shanghai Patentee after: Shanghai Tiantian Zhixin Semiconductor Co.,Ltd. Country or region after: China Address before: Room 101-5, Building 3, No. 2388 Chenhang Road, Minhang District, Shanghai Patentee before: Shanghai Tiantian smart core semiconductor Co.,Ltd. Country or region before: China |
|
CP03 | Change of name, title or address |