[go: up one dir, main page]

CN113344018A - 域适应分类器产生 - Google Patents

域适应分类器产生 Download PDF

Info

Publication number
CN113344018A
CN113344018A CN202010528755.4A CN202010528755A CN113344018A CN 113344018 A CN113344018 A CN 113344018A CN 202010528755 A CN202010528755 A CN 202010528755A CN 113344018 A CN113344018 A CN 113344018A
Authority
CN
China
Prior art keywords
time series
data
classifier
target
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010528755.4A
Other languages
English (en)
Inventor
A·阿戴尔
S·巴锡
E·M·博纳卜
J·布朗
A·尚多尔卡尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspire Cognition Co ltd
Original Assignee
Inspire Cognition Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspire Cognition Co ltd filed Critical Inspire Cognition Co ltd
Publication of CN113344018A publication Critical patent/CN113344018A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请案涉及域适应分类器产生。一种方法包含:接收与源资产相关联且包含分类标签集合的时间序列源数据。所述方法还包含:接收与目标资产相关联且缺乏分类标签的时间序列目标数据。所述方法进一步包含:依据所述时间序列源数据及所述时间序列目标数据而确定时间序列表示。所述方法还包含:基于包含于所述时间序列源数据中的所述分类标签集合且至少基于原始时间序列数据或所述时间序列表示,产生可操作以对与所述目标资产相关联的未加标签数据进行分类的分类器。所述原始时间序列数据包含所述时间序列源数据及所述时间序列目标数据。

Description

域适应分类器产生
技术领域
本发明一般来说涉及域适应分类器产生。
背景技术
资产时间序列数据分类器是用于评估与资产相关联的时间序列数据并将标签(例如,类别)指派给时间序列数据的数据模型。举例来说,资产可包含工业资产,时间序列数据可包含由一或多个传感器(例如,温度传感器)产生的数据,且标签可指示时间序列数据是对应于资产的正常状态还是警报条件。通常,基于与资产相关联的经加标签时间序列数据集合而训练用于资产的分类器。用于训练的所述时间序列数据集合通常由人类专家加标签。针对一种资产所训练的分类器通常不能够为与另一资产相关联的时间序列数据正确地加标签。为用于训练用于每一资产的分类器的时间序列数据加标签可为昂贵且耗费时间的。
发明内容
在特定方面中,一种方法包含:接收与源资产相关联且包含分类标签集合的时间序列源数据。所述方法还包含:接收与目标资产相关联且缺乏分类标签的时间序列目标数据。所述方法进一步包含:依据所述时间序列源数据及所述时间序列目标数据而确定时间序列表示。所述方法还包含:基于包含于所述时间序列源数据中的所述分类标签集合且进一步至少基于原始时间序列数据或所述时间序列表示,产生可操作以对与所述目标资产相关联的未加标签数据进行分类的分类器。所述原始时间序列数据包含所述时间序列源数据及所述时间序列目标数据。
在另一特定方面中,一种计算装置包含处理器,所述处理器经配置以接收与源资产相关联且包含分类标签集合的时间序列源数据。所述处理器还经配置以接收与目标资产相关联且缺乏分类标签的时间序列目标数据。所述处理器进一步经配置以依据所述时间序列源数据及所述时间序列目标数据而确定时间序列表示。所述处理器还经配置以基于包含于所述时间序列源数据中的所述分类标签集合且进一步至少基于原始时间序列数据或所述时间序列表示,产生可操作以对与所述目标资产相关联的未加标签数据进行分类的分类器。所述原始时间序列数据包含所述时间序列源数据及所述时间序列目标数据。
在另一特定方面中,一种计算机可读存储装置存储指令,所述指令在由处理器执行时致使所述处理器:接收与源资产相关联且包含分类标签集合的时间序列源数据。所述指令在由所述处理器执行时还致使所述处理器:接收与目标资产相关联且缺乏分类标签的时间序列目标数据。所述指令在由所述处理器执行时进一步致使所述处理器:依据所述时间序列源数据及所述时间序列目标数据而确定时间序列表示。所述指令在由所述处理器执行时还致使所述处理器:基于包含于所述时间序列源数据中的所述分类标签集合且进一步至少基于原始时间序列数据或所述时间序列表示,产生可操作以对与所述目标资产相关联的未加标签数据进行分类的分类器。所述原始时间序列数据包含所述时间序列源数据及所述时间序列目标数据。
本文中所描述的特征、功能及优点可在各种实施方案中独立地实现或可在其它实施方案中进行组合,可参考所附描述及图式而找到所述其它实施方案的进一步细节。
附图说明
图1是图解说明经配置以产生域适应分类器的系统的实例的框图;
图2是图解说明可由图1的系统产生的时间序列表示的实例的图式;
图3是图解说明可由图1的系统处理的经加标签源数据及未加标签目标数据的实例的图式;
图4是图解说明可由图1的系统执行的数据群集的实例的图式;
图5是图解说明可由图1的系统执行的数据汇集的实例的图式;
图6是图解说明可由图1的系统执行的分类器产生的实例的图式;
图7是图解说明可由图1的系统执行的分类器产生的实例的图式;
图8是图解说明可由图1的系统执行的优化的实例的图式;
图9是图解说明可由图1的系统执行的交叉验证的实例的图式;
图10是图解说明可由图1的系统所产生的分类器执行的数据分类的实例的图式;且
图11是域适应分类器产生的方法的实例的流程图。
具体实施方式
下文参考图式而描述本发明的特定方面。在描述中,贯穿图式,共同特征由共同参考编号指定。如本文中所使用,各种术语仅出于描述特定实施方案的目的而使用且并非打算为限制性的。举例来说,除非上下文另外明确指示,否则单数形式“一(a、an)”及“所述”也打算包含复数形式。可进一步理解,术语“包括(comprise、comprises及comprising)”可与“包含(include、includes或including)”互换地使用。另外,将理解,术语“其中(wherein)”可与“其中(where)”互换地使用。如本文中所使用,“示范性”可指示实例、实施方案及/或方面,且不应解释为限制性的或者指示偏好或优选实施方案。如本文中所使用,用于修饰例如结构、组件、操作等元素的序数术语(例如,“第一”、“第二”、“第三”等)并非本身指示所述元素相对于另一元素的任何优先级或次序,而是仅将所述元素与具有相同名称(除了序数术语的使用之外)的另一元素区分开。如本文中所使用,术语“集合(set)”是指一或多个元素的群组,且术语“多个(plurality)”是指多个元件。
在本发明中,例如“确定”、“计算”、“估计”、“移位”、“调整”等术语可用于描述如何执行一或多个操作。应注意,此类术语不应解释为限制性的且可利用其它技术来执行类似操作。另外,如本文中所提及,“产生”、“计算”、“估计”、“使用”、“选择”、“存取”及“确定”可互换地使用。举例来说,“产生”、“计算”、“估计”或“确定”参数(或信号)可指主动产生、估计、计算或确定参数(或信号)或者可指使用、选择或存取已(例如)由另一组件或装置产生的参数(或信号)。
如本文中所使用,“耦合”可包含“通信耦合”、“电耦合”或“物理耦合”,且还可(或替代地)包含其任何组合。两个装置(或组件)可直接或者经由一或多个其它装置、组件、导线、总线、网络(例如,有线网络、无线网络或其组合)等间接耦合(例如,通信耦合、电耦合或物理耦合)。电耦合或通信耦合的两个装置(或组件)可包含于同一装置或不同装置中且可经由电子器件、一或多个连接器或者电感耦合(作为说明性非限制性实例)而连接。在一些实施方案中,通信耦合(例如电通信)的两个装置(或组件)可直接或间接(例如经由一或多个导线、总线、有线或无线网络等)发送及接收电信号或其它信号(例如,数字信号或模拟信号)。如本文中所使用,“直接耦合”可包含两个装置在无需介入组件的情况下耦合(例如,通信耦合、电耦合或物理耦合)。
参考图1,展示可操作以产生域适应分类器的系统且一般指定为100。系统100包括耦合到分类器开发者110的源资产102及目标资产106。在特定方面中,源资产102包含或耦合到一或多个源传感器104。在特定方面中,源传感器104中的一或多者接近于源资产102。在特定方面中,目标资产106包含或耦合到一或多个目标传感器108。在特定方面中,目标传感器108中的一或多者接近于目标资产106。在特定实例中,资产包含耦合到或接近于一或多个传感器(例如温度传感器、湿度传感器、压力传感器、流量传感器、图像传感器、麦克风、运动传感器或其组合)的工业资产(例如工厂组件)。在特定实例中,源资产102是可使用经加标签时间序列数据的资产,且目标资产106是可使用未加标签数据并将针对其而产生用以对未加标签数据进行分类的分类器的资产。在特定方面中,分类器开发者110的一或多个组件包含于一或多个处理器中。在特定方面中,系统100的一或多个组件集成到计算装置中。
分类器开发者110包含时间序列表示产生器114、数据筛选器116、批产生器118、分类器产生器120、分类器选择器124或其组合。时间序列表示产生器114经配置以产生从源传感器104接收的时间序列数据、从目标传感器108接收的时间序列数据或其组合的一或多个时间序列表示,如参考图2进一步所描述。数据筛选器116经配置以筛选出无效或不可使用数据(如果存在),如参考图4进一步所描述。在一些实施方案中,分类器开发者110不包含数据筛选器116。举例来说,批产生器118可从源传感器104、目标传感器108、时间序列表示产生器114或其组合接收未经筛选数据。批产生器118经配置以将从源传感器104、目标传感器108、时间序列表示产生器114、数据筛选器116或其组合接收的数据汇集成若干批,如参考图5进一步所描述。
分类器产生器120经配置以基于数据批而产生分类器,如参考图6进一步所描述。分类器选择器124包含优化器122、交叉验证器112或此两者。优化器122经配置以调整分类器的神经网络的超参数,如参考图8进一步所描述。交叉验证器112经配置以通过将与源资产数据一起接收的标签与由源分类器产生的标签进行比较而交叉验证用于目标资产106的目标分类器,所述源分类器至少部分地基于由目标分类器产生的目标标签而产生,如参考图9进一步所描述。
在操作期间,时间序列表示产生器114接收时间序列源数据128及时间序列目标数据130。时间序列源数据128由源传感器104产生,且时间序列目标数据130由目标传感器108产生。在特定方面中,时间序列源数据128表示在源资产102的操作期间的各种时间周期内由源传感器104收集的传感器数据(例如,测量、图像等),且时间序列目标数据130表示在目标资产106的操作期间的各种时间周期内由目标传感器108收集的传感器数据。在特定方面中,时间序列源数据128表示在比时间序列目标数据130长的时间周期内收集的传感器数据。如本文中所使用,“原始时间序列数据”是指时间序列源数据128、时间序列目标数据130或其组合。
时间序列源数据128包含分类标签集合126或与所述分类标签集合相关联。举例来说,分类标签集合126指示特定分类标签被指派给时间序列源数据128的特定部分。为图解说明,专家(例如,工程师或主题专家)审查时间序列源数据128且确定在特定时间周期期间产生的时间序列源数据128的特定部分对应于特定操作模式(例如,“常规操作条件”、“中等警报条件”或“高警报条件”,作为非限制性实例)。专家将指示特定操作模式的特定分类标签指派给时间序列源数据128的特定部分。时间序列目标数据130对应于未加标签数据。举例来说,时间序列目标数据130不包含任何分类标签且不与任何分类标签相关联。
时间序列表示产生器114产生时间序列源数据128、时间序列目标数据130或其组合的时间序列表示134,如参考图2进一步所描述。举例来说,时间序列表示134可包含但不限于标准偏差值、平均值、频域值(例如快速傅里叶(Fourier)变换(FFT)功率分量或第三倍频程分量)、时域值、符号近似值、图像时间序列(time series as images)或其组合。在特定方面中,时间序列源数据128、时间序列目标数据130及时间序列表示134对应于数据库,所述数据库可用于产生用于对目标传感器108的未加标签数据进行分类的各种候选分类器。时间序列表示产生器114将时间序列表示134提供到数据筛选器116、批产生器118或此两者。
在一些实施方案中,数据筛选器116处理时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合(如参考图4进一步所描述),且将时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合的经处理(例如,经预处理或经筛选)版本提供到批产生器118。在特定实施方案中,数据筛选器116筛选出所接收数据的子集。举例来说,数据筛选器116基于时间序列源数据128、时间序列表示134的基于时间序列源数据128的子集或其组合而产生源数据群集136。作为另一实例,数据筛选器116基于时间序列目标数据130、时间序列表示134中的基于时间序列目标数据130的子集或其组合而产生目标数据群集138。数据筛选器116使用数据分析技术来识别源数据群集136的子集、目标数据群集138的子集或其组合。
在特定实施方案中,所识别子集包含似乎不可使用的群集(例如,离群值)。在特定实施方案中,数据筛选器116移除(例如,筛选出)对应于所识别子集的数据以产生时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合的经处理版本。在特定方面中,数据筛选器116产生指示所识别子集的输出且基于用户输入而选择性地移除对应于所识别子集的数据。举例来说,输出指示源数据群集136中的第一群集对应于不可使用数据。将所述输出提供到显示器、与用户相关联的装置或此两者。响应于接收到指示将忽略第一群集的第一用户输入,数据筛选器116至少移除对应于第一群集的数据以产生时间序列源数据128的经处理版本、时间序列表示134的经处理版本或其组合。替代地,响应于接收到指示将考虑第一群集的第二用户输入,数据筛选器116抑制移除与第一群集相关联的数据以产生时间序列源数据128的经处理版本、时间序列表示134的经处理版本或其组合。
批产生器118接收分类标签集合126、时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合的经处理或未经处理版本,且将所接收数据汇集成一或多个批140,如参考图5进一步所描述。举例来说,时间序列源数据128的第一批包含与第一时间周期相关联的数据且时间序列源数据128的第二批包含与第二时间周期相关联的数据。批产生器118将批140提供到分类器产生器120。分类器产生器120基于批140而产生一或多个候选分类器142,如参考图6及图7进一步所描述。举例来说,分类器产生器120基于时间序列源数据128的第一批及时间序列目标数据130的第一批而产生第一分类器,且基于时间序列源数据128的第二批及时间序列目标数据130的第二批而产生第二分类器。分类器产生器120将候选分类器142提供到分类器选择器124。
优化器122、交叉验证器112或此两者处理候选分类器142。在特定实例中,优化器122优化候选分类器142中的分类器148,如参考图8进一步所描述。在特定实例中,交叉验证器112交叉验证分类器148,如参考图9进一步所描述。举例来说,交叉验证器112通过分析分类器148而产生交叉验证结果146,如参考图9进一步所描述。交叉验证器112响应于确定交叉验证结果146满足(例如,大于)交叉验证准则(例如,交叉验证阈值)而确定分类器148已被成功地交叉验证。
在特定实施方案中,分类器选择器124在分类器148并未由优化器122优化的情况下输出由交叉验证器112成功地交叉验证的分类器148。在另一特定实施方案中,优化器122优化分类器148,交叉验证器112交叉验证分类器148的经优化版本,且分类器选择器124在成功交叉验证之后输出分类器148的经优化版本。在另一特定实施方案中,交叉验证器112交叉验证分类器148,优化器122在成功交叉验证之后优化分类器148,且分类器选择器124输出分类器148的经优化版本。在特定方面中,分类器选择器124响应于确定分类器148未通过交叉验证(例如,交叉验证结果146未能满足交叉验证准则)而丢弃(例如,抑制优化或输出)分类器148。在特定实施方案中,分类器选择器124在交叉验证器112未交叉验证分类器148的情况下输出由优化器122优化的分类器148。
分类器148可操作以产生用于与目标资产106对应的未加标签数据的标签。举例来说,分类器148产生用于从目标传感器108接收的时间序列目标数据132的一或多个分类标签144。在特定方面中,时间序列目标数据132与时间序列目标数据130相同或不同。在特定方面中,当从目标传感器108接收到时间序列目标数据132时,分类器148实时地产生分类标签144。使分类器148产生用于未加标签数据的标签节约资源且增加准确性。举例来说,与使人类专家分析未加标签数据相比,训练分类器148并产生用于未加标签数据的标签可为较快且较廉价的。另外,分资产类器148可经训练以将更多权重赋予人类专家未意识到重要的特定相关因素,且因此产生更准确标签。使用域适应来产生分类器148减少(例如,移除)对于使目标资产106的较大经加标签数据集合用于训练分类器148的相依性。举例来说,可在不具有目标资产的经加标签数据的情况下使用时间序列源数据128来训练与各种目标资产相关联的分类器。因此,与使人类专家分析目标资产中的每一者的未加标签数据以训练用于目标资产的分类器相比,可针对多个目标资产更高效地产生及开发分类器。
因此,系统100实现了产生不依赖于目标资产106的经加标签数据来进行训练的域适应分类器,例如适于目标资产106的分类器148。举例来说,分类器开发者110可基于分类标签集合126、时间序列源数据128及与对应目标资产相关联的未加标签数据而自动产生与多个目标资产相关联的分类器,其中每一分类器适于特定目标资产。
参考图2,展示时间序列源数据128、时间序列目标数据130及时间序列表示134的实例且一般指定为实例200。在特定方面中,源传感器104包含源温度传感器202及源流量传感器204,且目标传感器108包含目标温度传感器206及目标流量传感器208。在特定方面中,目标温度传感器206是与源温度传感器202类似类型的传感器,目标流量传感器208是与源流量传感器204类似类型的传感器,或此两者。举例来说,源温度传感器202与目标温度传感器206具有相同制造商、相同传感器类型(例如,温度传感器)、相同模型或其组合。
时间序列源数据128包含分别由源温度传感器202及源流量传感器204产生的基于源温度的数据210及基于源流量的数据218。时间序列目标数据130包含分别由目标温度传感器206及目标流量传感器208产生的基于目标温度的数据226及基于目标流量的数据234。
时间序列表示134包含与基于源温度的数据210的各种时间序列表示对应的基于源温度的数据212、基于源温度的数据214及基于源温度的数据216。举例来说,时间序列表示134可包含但不限于标准偏差值、平均值、频域值(例如FFT功率分量或第三倍频程分量)、时域值、符号近似值、图像时间序列或其组合。类似地,时间序列表示134可包含与基于源流量的数据218的各种时间序列表示对应的基于源流量的数据(例如,基于源流量的数据220、基于源流量的数据222或基于源流量的数据224)。另外,时间序列表示134可包含与基于目标温度的数据226的各种时间序列表示对应的基于目标温度的数据(例如,基于目标温度的数据228、基于目标温度的数据230或基于目标温度的数据232)。在特定方面中,时间序列表示134可包含与基于目标流量的数据234的各种时间序列表示对应的基于目标流量的数据(例如,基于目标流量的数据236、基于目标流量的数据238或基于目标流量的数据240)。应理解,作为说明性实例而展示每一类型的传感器数据的三个时间序列表示。时间序列表示134使得能够基于各种级别的数据抽象而产生分类器148。
参考图3,展示经加标签源数据及未加标签目标数据的实例且一般指定为实例300。在特定方面中,实例300包含描绘基于源流量的数据302、基于源温度的数据304、基于目标流量的数据306及基于目标温度的数据308的图形。举例来说,基于源温度的数据304包含传感器数据(例如,基于源温度的数据210)、基于所述传感器数据而产生的时间序列表示134(例如,基于源温度的数据212、基于源温度的数据214或基于源温度的数据216)或其组合。作为另一实例,基于目标温度的数据308包含传感器数据(例如,基于目标温度的数据226)、基于所述传感器数据而产生的时间序列表示134(例如,基于目标温度的数据228、基于目标温度的数据230或基于目标温度的数据232)或其组合。
分类器开发者110处理传感器数据(例如,时间序列源数据128、时间序列目标数据130或此两者)、基于所述传感器数据的时间序列表示134或其组合。在特定方面中,分类标签集合126指示分类标签310被指派给在第一时间周期期间产生的时间序列源数据128的第一部分。举例来说,分类标签310(例如,“常规操作”)指示基于时间序列源数据128的第一部分而将源资产102指定为在第一时间周期期间以第一模式(例如,常规操作模式)进行操作。时间序列表示产生器114使分类标签310(例如,“常规操作”)与对应于时间序列源数据128的第一部分(例如,第一时间周期)的基于源流量的数据302的第一部分320及基于源温度的数据304的第一部分314相关联。举例来说,数据结构(例如,表中的行)指示分类标签310已由专家指派给时间序列源数据128的第一部分,且时间序列表示产生器114将基于源流量的数据302的第一部分320的指示及基于源温度的数据304的第一部分314的指示添加到数据结构。
在特定实例中,分类标签集合126指示分类标签312被指派给在第二时间周期期间产生的时间序列源数据128的第二部分。举例来说,响应于确定在同一时间周期(例如,第二时间周期)期间,基于源温度的数据304的第二部分316指示升高的温度而基于源流量的数据302的第二部分322指示恒定或降低的流量,专家(例如,工程师)将分类标签312(例如,特定操作模式)指派给时间序列源数据128的第二部分。时间序列表示产生器114使分类标签312与对应于时间序列源数据128的第二部分(例如,第二时间周期)的基于源流量的数据302的第二部分322及基于源温度的数据304的第二部分316相关联。
在特定方面中,可将相同分类指派给时间序列源数据128的多个部分。举例来说,除了时间序列源数据128的第一部分之外,分类标签集合126还指示分类标签310被指派给在第三时间周期期间产生的时间序列源数据128的第三部分。为图解说明,响应于确定在同一时间周期(例如,第三时间周期)期间,基于源温度的数据304的第三部分318指示升高的温度而基于源流量的数据302的第三部分324指示升高的流量,专家(例如,工程师)将分类标签310指派给时间序列源数据128的第三部分。时间序列表示产生器114使分类标签310与对应于时间序列源数据128的第三部分(例如,第三时间周期)的基于源流量的数据302的第三部分324及基于源温度的数据304的第三部分318相关联。
参考图4,展示数据群集的实例且一般指定为实例400。举例来说,图1的数据筛选器116基于时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合而执行各种数据群集技术以产生源数据群集136及目标数据群集138。
在特定方面中,数据筛选器116基于流量传感器数据与温度传感器数据之间的关系而产生一或多个群集。举例来说,数据筛选器116在特定时间周期期间产生数据群集(“DC”)402,所述数据群集与由基于源流量的数据302的特定部分指示的稳定流量及由基于源温度的数据304的特定部分指示的稳定温度对应。在特定实例中,数据筛选器116在第二时间周期期间产生数据群集404,所述数据群集与由基于源流量的数据302的特定部分指示的增加的流量及由基于源温度的数据304的特定部分指示的稳定温度对应。
在特定实例中,数据筛选器116在第三时间周期期间产生数据群集406,所述数据群集与由基于源流量的数据302的特定部分指示的增加的流量及由基于源温度的数据304的特定部分指示的增加的温度对应。在特定实例中,数据筛选器116在第四时间周期期间产生数据群集408,所述数据群集与由基于源流量的数据302的特定部分指示的稳定流量及由基于源温度的数据304的特定部分指示的增加的温度对应。在特定实例中,数据筛选器116在第五时间周期期间产生数据群集410,所述数据群集与由基于源流量的数据302的特定部分指示的稳定流量及由基于源温度的数据304的特定部分指示的降低的温度对应。在特定实例中,数据筛选器116在第六时间周期期间产生数据群集412,所述数据群集与由基于源流量的数据302的特定部分指示的增加的流量及由基于源温度的数据304的特定部分指示的增加的温度对应。
在特定方面中,数据筛选器116基于基于目标流量的数据306及基于目标温度的数据308而产生一或多个数据群集。举例来说,数据筛选器116在第一时间周期期间产生数据群集414,所述数据群集与由基于目标流量的数据306的特定部分指示的稳定流量及由基于目标温度的数据308的特定部分指示的稳定温度对应。在特定实例中,数据筛选器116在第二时间周期期间产生数据群集416,所述数据群集与由基于目标流量的数据306的特定部分指示的增加的流量及由基于目标温度的数据308的特定部分指示的增加的温度对应。
在特定实例中,数据筛选器116在第三时间周期期间产生数据群集418,所述数据群集与由基于目标流量的数据306的特定部分指示的稳定流量及由基于目标温度的数据308的特定部分指示的稳定温度对应。在特定实例中,数据筛选器116在第四时间周期期间产生数据群集420,所述数据群集与由基于目标流量的数据306的特定部分指示的稳定流量及由基于目标温度的数据308的特定部分指示的降低的温度对应。在特定实例中,数据筛选器116在第五时间周期期间产生数据群集422,所述数据群集与由基于目标流量的数据306的特定部分指示的增加的流量及由基于目标温度的数据308的特定部分指示的增加的温度对应。
在特定实例中,数据筛选器116在第六时间周期期间产生数据群集424,所述数据群集与由基于目标流量的数据306的特定部分指示的稳定流量及由基于目标温度的数据308的特定部分指示的增加的温度对应。在特定实例中,数据筛选器116在第七时间周期期间产生数据群集426,所述数据群集与由基于目标流量的数据306的特定部分指示的稳定流量及由基于目标温度的数据308的特定部分指示的稳定温度对应。
在特定方面中,数据筛选器116将源数据群集136、目标数据群集138或其组合的子集识别为对应于不可使用数据(例如,离群值)。举例来说,如果数据群集指示是统计离群值的关系,那么所述数据群集对应于不可使用数据。为图解说明,数据筛选器116将数据群集404及数据群集412识别为对应于不可使用数据。
数据筛选器116通过从时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合移除对应于所识别子集(例如,不可使用)的数据而产生经筛选数据,且将经筛选数据提供到批产生器118。举例来说,数据筛选器116通过从基于源流量的数据302及基于源温度的数据304移除对应于数据群集404及数据群集412的数据而产生基于源流量的数据302及基于源温度的数据304的经筛选版本,且将基于源流量的数据302及基于源温度的数据304的经筛选版本提供到批产生器118。
在特定方面中,数据筛选器116产生指示被识别为不可使用的数据群集的子集的输出,而非自动移除数据群集的所识别子集。举例来说,所述输出指示被识别为对应于不可使用数据的一或多个数据群集(例如,数据群集404及数据群集412)。数据筛选器116将所述输出提供到显示器、与用户相关联的装置或此两者。数据筛选器116基于响应于所述输出的用户输入而选择性地筛选时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合。举例来说,响应于接收到指示将移除数据群集404的第一用户输入,数据筛选器116通过移除对应于数据群集404的数据而产生基于源流量的数据302及基于源温度的数据304的经筛选版本。替代地,响应于接收到指示将不移除数据群集404的第二用户输入,数据筛选器116在被提供到批产生器118的基于源流量的数据302及基于源温度的数据304的版本中保持对应于数据群集404的数据。
因此,数据群集使得数据筛选器116能够识别不可使用数据。在一些实施方案中,将不可使用数据丢弃以从将用于产生分类器的数据中移除离群值。
参考图5,展示数据汇集的实例且一般指定为实例500。图1的批产生器118通过基于时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合产生一或多个批140而执行数据汇集。在特定方面中,批产生器118基于从数据筛选器116接收的时间序列源数据128、时间序列目标数据130、时间序列表示134或其组合的版本(例如,经筛选或未经筛选版本)而产生批140。
作为实例,批产生器118选择基于源流量的数据302的各种部分以及基于源温度的数据304的对应部分来产生批140的源批。为图解说明,批产生器118选择基于源流量的数据302的一或多个部分以及基于源温度的数据304的对应部分来产生源批502。类似地,批产生器118选择基于目标流量的数据306的各种部分以及基于目标温度的数据308的对应部分来产生批140的目标批。举例来说,批产生器118选择基于目标流量的数据306的一或多个部分以及基于目标温度的数据308的对应部分来产生目标批504。批产生器118将批140提供到分类器产生器120。
参考图6,展示分类器产生的实例且一般指定为实例600。分类器产生器120产生对应于源批与目标批的各种组合的候选分类器142。举例来说,分类器产生器120至少基于源批502及目标批504而执行第一分类器产生技术以产生分类器148(例如,人工神经网络)。为图解说明,分类器产生器120使用至少包含源批502的第一源批集合及至少包含目标批504的第一目标批集合来训练分类器148。作为另一实例,分类器产生器120基于源批602及目标批608而执行第二分类器产生技术以产生分类器610。为图解说明,分类器产生器120使用至少包含源批602的第二源批集合及至少包含目标批608的第二目标批集合来训练分类器610。在特定实例中,分类器产生器120基于源批604及目标批606而执行第三分类器产生技术以产生分类器612。为图解说明,分类器产生器120使用至少包含源批604的第三源批集合及至少包含目标批606的第三目标批集合来训练分类器612。
在特定实施方案中,可使用不同源批集合及目标批集合来训练多个候选分类器142中的每一者。举例来说,批产生器118基于时间序列源数据128的对应于第一时间周期的第一部分而产生第一源批集合且基于时间序列源数据128的对应于不同于第一时间周期的第二时间周期的第二部分而产生第二源批集合。举例来说,时间序列源数据128的第一部分包含在第一时间周期期间产生的传感器数据,且时间序列源数据128的第二部分包含在第二时间周期期间产生的传感器数据。在特定方面中,第一时间周期与第二时间周期重叠。在特定方面中,第一时间周期与第二时间周期不重叠。在替代实施方案中,可使用相同源批集合及目标批集合、针对多个候选分类器142中的每一者利用不同超参数来训练多个候选分类器142中的每一者。在特定实施方案中,可使用不同源批集合、不同目标批集合、不同超参数或其组合来训练多个候选分类器142中的每一者。
候选分类器142包含分类器148、分类器610、分类器612、一或多个额外分类器或者其组合。如本文中所使用,分类器148、分类器610及分类器612被称为“候选”分类器以指示分类器148、分类器610及分类器612是供用于对时间序列目标数据132进行分类的候选者。可基于交叉验证结果、优化结果等执行从候选分类器142当中的最终选择,如参考分类器选择器124所描述。
在特定方面中,用于产生分类器610的第二分类器产生技术与用于产生分类器148的第一分类器产生技术相同或不同。在特定实施方案中,分类器产生器120使用第一分类器产生技术来产生候选分类器142的第一集合中的每一者且使用第二分类器产生技术来产生候选分类器142的第二集合中的每一者。在特定方面中,图1的优化器122优化候选分类器142的第一集合中的每一者及候选分类器142的第二集合中的每一者,图1的交叉验证器112交叉验证候选分类器142的第一集合中的每一者及候选分类器142的第二集合中的每一者,或此两者。在特定实施方案中,分类器选择器124选择候选分类器142的第一集合中的第一候选分类器(例如,经优化、经交叉验证或此两者)且选择候选分类器142的第二集合中的第二候选分类器(例如,经优化、经交叉验证或此两者)。在此实施方案中,分类器选择器124基于第一候选分类器与第二候选分类器的比较而选择第一候选分类器或第二候选分类器中的一者。第一候选分类器或第二候选分类器中的所选择一者包含分类器148。
在特定实例中,第一分类器产生技术、第二分类器产生技术或此两者包含但不限于基于域分离网络(DSN)的技术、基于域混淆软标签(DCSL)的技术、基于利用深度自动编码器的迁移学习(TLDA)的技术、基于神经网络的域对抗训练(DANN)的技术、基于针对域适应共享权重(sharing weights for domain adaptation)(SWS)的技术、基于不断变化环境的增量对抗域适应(IADA)的技术、基于变分公平自动编码器(VFAE)的技术或其组合。虽然图解说明三个候选分类器,但在其它实施方案中,可产生少于三个或多于三个候选分类器。举例来说,在一些实施方案中,单个候选分类器可产生并由分类器选择器124优化,且经选择以用于对时间序列目标数据132进行分类。
参考图7,展示分类器产生的实例且一般指定为实例700。在实例700中,图解说明分类器产生器120的特定实施方案,其基于基于DSN的技术(出于解释的目的)来产生分类器148;然而,应理解,在其它实施方案中,分类器产生器120可替代基于DSN的技术或除此之外使用一或多个其它技术,例如但不限于基于DCSL、TLDA、DANN、SWS、IADA或VFAE的技术(作为非限制性实例)。举例来说,分类器产生器120将目标批504提供到目标特定编码器702并提供到共享编码器704。分类器产生器120将源批502提供到共享编码器704并提供到源特定编码器706。
如下文进一步所描述,使用训练过程来训练共享编码器704(例如,共享权重编码器)以捕获在若干域(例如,对应于源资产102的域及对应于目标资产106的域)当中类似的编码来产生共享编码向量716及共享编码向量718。在特定实例中,源批502包含基于源流量的数据302、基于源温度的数据304及基于源权重的数据,且目标批504包含基于目标流量的数据306及基于目标温度的数据308。
训练过程基于目标批504而训练目标特定编码器702以产生专用目标编码向量714。举例来说,目标特定编码器702基于基于目标流量的数据306及基于目标温度的数据308而产生专用目标编码向量714。基于源批502而训练源特定编码器706以产生专用源编码向量720。举例来说,源特定编码器706基于基于源流量的数据302、基于源温度的数据304及基于源权重的数据而产生专用源编码向量720。
训练过程可基于各种度量(例如目标重建损失730、源重建损失732、目标的差损失736、源的差损失738、相似性损失740及分类损失742)的优化(例如,最小化或减小)。举例来说,分类器产生器120基于专用目标编码向量714与共享编码向量716的比较(例如,正交性测量)而确定目标的差损失736。分类器产生器120基于共享编码向量718与专用源编码向量720的比较(例如,正交性测量)而确定源的差损失738。分类器产生器120基于共享编码向量716与共享编码向量718的比较(例如,正交性测量)而确定相似性损失740。
组合器708基于专用目标编码向量714及共享编码向量716而产生目标向量722。举例来说,目标向量722对应于专用目标编码向量714与共享编码向量716的组合。组合器710基于共享编码向量718及专用源编码向量720而产生源向量724。
共享解码器712基于目标向量722而产生经重建目标批726且基于目标批504与经重建目标批726的比较而确定目标重建损失730。举例来说,目标重建损失730指示目标批504与经重建目标批726之间的差。共享解码器712基于源向量724而产生经重建源批728,且基于源批502与经重建源批728的比较而确定源重建损失732。举例来说,源重建损失732指示源批502与经重建源批728之间的差。
分类器148通过对共享编码向量718进行分类而产生分类标签734。分类器产生器120基于分类标签734与分类标签集合126的比较而确定分类损失742。在所图解说明实例中,分类器产生器120使用基于DSN的技术来训练分类器148。举例来说,分类器产生器120训练目标特定编码器702、共享编码器704及源特定编码器706以产生编码向量,使得将目标的差损失736、源的差损失738、相似性损失740、目标重建损失730及源重建损失732最小化(或减小)。分类器产生器120还基于共享编码向量718而训练分类器148,使得在多个源批及目标批的处理内将分类损失742最小化(或减小)。在特定方面中,分类器产生器120训练目标特定编码器702、共享编码器704、源特定编码器706及分类器148,使得将基于目标的差损失736、源的差损失738、相似性损失740、目标重建损失730、源重建损失732、分类损失742或其组合的经加权总和的总损失最小化(或减小)。在特定方面中,分类器产生器120响应于确定总损失满足收敛准则而输出分类器148作为候选分类器。分类器产生器120因此在不存在用于与目标资产106相关联的数据的标签的情况下产生适于目标资产106的域适应分类器(例如,分类器148)。
参考图8,展示优化的实例且一般指定为实例800。在特定方面中,优化器122基于各种神经网络优化技术而更新分类器148以满足优化准则。举例来说,优化器122通过调整一或多个模型超参数(例如但不限于损失权重)而更新分类器148。为图解说明,参考图7所描述的总损失包含基于将损失权重应用于目标的差损失736、源的差损失738、相似性损失740、目标重建损失730、源重建损失732、分类损失742或其组合的经加权总和。应理解,在一些实例中,由优化器122执行的调整产生分类器148的经调整版本,所述经调整版本可或可不包含分类器148的最优版本。
优化器122实现分类器148、候选分类器142或其组合的优化。可在交叉验证之前、之后或在不存在任何交叉验证的情况下执行所述优化。在特定方面中,优化器122独立于任何交叉验证而更新候选分类器142中的每一者。在替代方面中,优化器122基于图1的交叉验证结果146而选择性地更新分类器148。举例来说,优化器122基于确定交叉验证结果146指示分类器148满足交叉验证准则而选择性地更新分类器148。作为另一实例,优化器122响应于确定交叉验证结果146指示分类器148相比于候选分类器142中的其它候选分类器更好地满足交叉验证验证准则(例如,针对分类器148的第一交叉验证结果高于(或低于)针对其它分类器的交叉验证结果)而从候选分类器142选择分类器148。优化器122基于确定第一交叉验证结果满足交叉验证准则而选择性地调整分类器148。因此,优化器122基于优化技术而实现分类器148、候选分类器142或其组合的优化。
参考图9,展示交叉验证的实例且一般指定为实例900。交叉验证器112执行交叉验证以检验分类器开发者110的性能(例如,由所述分类器开发者产生的分类器的准确性)。交叉验证可涉及使用多个源-目标对来产生分类器且将由针对资产的所产生分类器中的一者输出的经加标签数据与所检验经加标签数据(例如,由专家产生)进行比较以确定指示分类器产生过程的有效性(例如,准确性)的交叉验证结果。
交叉验证器112包含待交叉验证的分类器(例如,候选分类器142中的一或多者)以及分类器开发者110的一或多个组件。举例来说,交叉验证器112包含或可以存取时间序列表示产生器114、数据筛选器116、批产生器118、分类器产生器120、分类器选择器124、优化器122或其组合。在特定实例中,多个候选分类器142中的每一者对应于时间序列源数据128的不同部分、时间序列目标数据130的不同部分或此两者,如参考图6所描述。
交叉验证器112交叉验证候选分类器142中的一或多者。举例来说,交叉验证器112执行分类器148的交叉验证。为图解说明,交叉验证器112使用分类器148来产生用于时间序列目标数据130的一或多个分类标签906。分类器开发者110将时间序列目标数据130连同分类标签906一起用作对应于第一域(例如,目标资产106)的经加标签数据且将时间序列源数据128用作对应于第二域(例如,源资产102)的未加标签数据,以产生用于对对应于第二域的未加标签数据进行分类的分类器902。举例来说,交叉验证器112将对应于第一域的经加标签数据及对应于第二域的未加标签数据提供到分类器开发者110的组件(例如,时间序列表示产生器114)。在此实例中,交叉验证器112从分类器开发者110的组件(例如,分类器产生器120、分类器选择器124或优化器122)接收分类器902,所述分类器是基于对应于第一域的经加标签数据及对应于第二域的未加标签数据而产生的。
分类器902产生用于时间序列源数据128的分类标签集合904。交叉验证器112将针对第二域(例如,源资产102)的由分类器902产生的分类标签集合904与针对第二域的所检验分类标签(例如,分类标签集合126)进行比较以确定由分类器开发者110产生的分类器902的准确性。交叉验证器112基于分类标签集合904与分类标签集合126的比较而产生交叉验证结果146。举例来说,交叉验证结果146指示分类标签集合126与分类标签集合904之间的差。在特定方面中,交叉验证结果146指示所述差低于阈值将指示:分类器开发者110正按照预期执行(即,由分类器开发者110产生的分类器为相对准确的)。应理解,在其它实例中,交叉验证器112可基于链结多个分类器而执行交叉验证。举例来说,使用由分类器开发者110基于第一域的经加标签数据而产生的第一分类器来为第二域的数据加标签,第二域的经加标签数据由分类器开发者110使用以产生第二分类器来为第三域的数据加标签,且第三域的经加标签数据由分类器开发者110使用以产生第三分类器来为第一域的数据加标签。将针对第一域的数据所产生的标签与第一域的所检验标签(例如,由专家产生)进行比较以确定针对分类器148的第一交叉验证结果。在特定实例中,交叉验证器112通过执行类似操作以交叉验证分类器610而产生针对分类器610的第二交叉验证结果。交叉验证结果146指示针对候选分类器142中的一或多者的交叉验证结果。举例来说,交叉验证结果146指示针对分类器148的第一交叉验证结果、针对分类器610的第二交叉验证结果、针对一或多个额外分类器的一或多个额外交叉验证结果或者其组合。
在特定方面中,交叉验证器112对候选分类器142中的一或多者的经优化版本执行交叉验证。举例来说,交叉验证器112对由优化器122产生的分类器148的经优化版本执行交叉验证。在特定方面中,交叉验证器112对候选分类器142中的每一者执行交叉验证以产生针对候选分类器142的交叉验证结果146,且基于确定交叉验证结果146指示分类器148的第一交叉验证结果指示与分类标签集合126的最低差(与对应于候选分类器142的其余分类器的交叉验证结果相比)而选择分类器148。在特定方面中,交叉验证器112输出分类器148(例如,所选择分类器)作为用于目标资产106的分类器。在特定方面中,交叉验证器112将分类器148(例如,所选择分类器)提供到优化器122。在特定方面中,交叉验证器112将对应于候选分类器142的交叉验证结果146提供到优化器122。因此,交叉验证器112使得能够测量分类器开发者110的性能且估计所产生分类器的准确性。
在图10中,展示使用域适应分类器(例如,分类器148)来对未加标签数据进行分类的说明性实例且一般指定为实例1000。分类器148用于对目标传感器108的未加标签数据(例如,图1的时间序列目标数据132)进行分类以产生一或多个分类标签144。
作为实例,时间序列目标数据132包含基于目标流量的数据1002及基于目标温度的数据1004。分类器148将分类标签310(例如,常规操作)指派给与第一时间周期相关联的基于目标流量的数据1002的第一部分及基于目标温度的数据1004的第一部分中的每一者。类似地,分类器148将分类标签312指派给与第二时间周期相关联的基于目标流量的数据1002的第二部分及基于目标温度的数据1004的第二部分中的每一者。在特定方面中,将分类标签312指派给时间序列目标数据130的部分,所述部分对应于如下时间周期:在所述时间周期期间,基于目标温度的数据1004指示升高的温度且基于目标流量的数据1002指示恒定或降低的流量。因此,分类器148可操作以对与目标资产106相关联的未加标签数据进行分类,而无需根据与目标资产106相关联的任何经加标签数据被训练。
参考图11,展示产生域适应分类器的方法1100。在特定方面中,方法1100由关于图1到10所描述的一或多个组件执行。
方法1100包含在1102处,接收与源资产相关联且包含分类标签集合的时间序列源数据。举例来说,分类器开发者110接收与源资产102相关联且包含分类标签集合126(或与所述分类标签集合相关联)的时间序列源数据128,如参考图1所描述。
方法1100还包含在1104处,接收与目标资产相关联且缺乏分类标签的时间序列目标数据。举例来说,图1的分类器开发者110接收与目标资产106相关联且缺乏分类标签的时间序列目标数据130,如参考图1所描述。
方法1100进一步包含在1106处,依据时间序列源数据及时间序列目标数据而确定时间序列表示。举例来说,图1的时间序列表示产生器114依据时间序列源数据128及时间序列目标数据130而确定时间序列表示134,如参考图1所描述。
方法1100还包含在1108处,基于包含于时间序列源数据中的分类标签集合且至少基于原始时间序列数据或时间序列表示,产生可操作以对与目标资产相关联的未加标签数据进行分类的分类器。举例来说,分类器产生器120基于分类标签集合126及至少原始时间序列数据或时间序列表示134而产生可操作以对与目标资产106相关联的未加标签数据进行分类的分类器148,如参考图1所描述。原始时间序列数据包含时间序列源数据128及时间序列目标数据130。
因此,方法1100实现域适应分类器的产生,所述域适应分类器可操作以对所述域的未加标签数据进行分类。举例来说,分类器148可操作以对与目标资产106相关联的未加标签数据进行分类。可独立于与所述域相关联的任何经加标签数据而产生域适应分类器。
本文中所图解说明的系统及方法可就功能块组件、任选选择及各种处理步骤来描述。应了解,此类功能块可由经配置以执行所指定功能的任何数目个硬件及/或软件组件实现。举例来说,系统可采用各种集成电路组件(例如,存储器元件、处理元件、逻辑元件、查找表等等),所述各种集成电路组件可在一或多个微处理器或其它控制装置的控制下执行多种功能。类似地,系统的软件元件可利用任何编程或脚本语言来实施,例如但不限于C、C++、C#、Java、JavaScript、VBScript、宏媒体冷融合(Macromedia Cold Fusion)、COBOL、微软动态服务器页面(Microsoft Active Server Pages)、汇编、PERL、PHP、AWK、Python、视觉化Basic(Visual Basic)、SQL存储程序、PL/SQL、任何UNIX shell脚本及可扩展标记语言(XML),其中各种算法利用数据结构、对象、过程、例程或其它编程元素的任何组合来实施。此外,应注意,系统可采用用于数据传输、信令、数据处理、网络控制等等的任何数目种技术。
本发明的系统及方法可采用计算机可读存储媒体或装置上的计算机程序产品的形式或者包含所述计算机程序产品,所述计算机可读存储媒体或装置具有体现或存储于存储媒体或装置中的计算机可读程序代码(例如,指令)。可利用任何适合计算机可读存储媒体或装置,包含硬盘、CD-ROM、光学存储装置、磁性存储装置及/或其它存储媒体。如本文中所使用,“计算机可读存储媒体”或“计算机可读存储装置”并非信号。
可在本文中参考根据各种方面的方法、设备(例如,系统)及计算机媒体的框图及流程图图解说明而描述系统及方法。将理解,框图及流程图图解说明中的每一功能块以及框图及流程图图解说明中的功能块组合可分别由计算机程序指令实施。
可将计算机程序指令加载到计算机或其它可编程数据处理设备上以产生机器,使得在所述计算机或其它可编程数据处理设备上执行的指令形成用于实施一或若干流程图框中所指定的功能的构件。这些计算机程序指令还可存储于计算机可读存储器或装置中,所述计算机可读存储器或装置可指导计算机或其它可编程数据处理设备以特定方式起作用,使得存储于计算机可读存储器中的指令产生制造物品,所述制造物品包含实施一或若干流程图框中所指定的功能的指令构件。还可将计算机程序指令加载到计算机或其它可编程数据处理设备上以致使在计算机或其它可编程设备上执行一系列操作步骤来产生计算机实施的过程,使得在计算机或其它可编程设备上执行的指令提供用于实施一或若干流程图框中所指定的功能的步骤。
因此,框图及流程图图解说明的功能块支持用于执行所指定功能的构件的组合、用于执行所指定功能的步骤的组合以及用于执行所指定功能的程序指令。还将理解,框图及流程图图解说明的每一功能块以及框图及流程图图解说明中的功能块组合可由基于专用硬件的计算机系统(其执行所指定功能或步骤)或专用硬件与计算机指令的适合组合实施。
虽然本发明可包含方法,但预期所述方法可体现为有形计算机可读媒体(例如磁性或光学存储器或者磁盘/碟或光盘/碟)上的计算机程序指令。为所属领域的技术人员已知的上文所描述示范性实施例的元件的所有结构、化学及功能等效物以引用的方式明确并入本文中且打算由本发明权利要求书囊括。此外,不必使装置或方法解决试图由本发明解决的每一及每个问题,因为所述装置或方法将由本发明权利要求书囊括。此外,本发明中的任何元件、组件或方法步骤均不打算致力于公众,而不管权利要求书中是否明确陈述所述元件、组件或方法步骤。如本文中所使用,术语“包括(comprises)”、“包括(comprising)”或其任何其它变化形式打算涵盖非排他性包含,使得包括元素列表的过程、方法、物品或设备不仅包含那些元素,且还可包含未明确列示或者此过程、方法、物品或设备所固有的其它元素。
可在不背离本发明的范围的情况下对所揭示实施例做出改变及修改。这些及其它改变或修改打算包含于如在所附权利要求书中所表达的本发明的范围内。

Claims (20)

1.一种方法,其包括:
接收与源资产相关联且包含分类标签集合的时间序列源数据;
接收与目标资产相关联且缺乏分类标签的时间序列目标数据;
依据所述时间序列源数据及所述时间序列目标数据而确定时间序列表示;及
基于包含于所述时间序列源数据中的所述分类标签集合且至少基于原始时间序列数据或所述时间序列表示,产生可操作以对与所述目标资产相关联的未加标签数据进行分类的分类器,其中所述原始时间序列数据包含所述时间序列源数据及所述时间序列目标数据。
2.根据权利要求1所述的方法,其进一步包括基于所述时间序列源数据及所述时间序列目标数据而产生多个候选分类器。
3.根据权利要求2所述的方法,其中所述多个候选分类器基于所述时间序列表示。
4.根据权利要求2所述的方法,其中所述多个候选分类器中的第一分类器基于所述时间序列源数据的第一部分及所述时间序列目标数据的第一部分,且其中所述多个候选分类器中的第二分类器基于所述时间序列源数据的第二部分及所述时间序列目标数据的第二部分。
5.根据权利要求2所述的方法,其中所述多个候选分类器中的第一分类器基于第一超参数集合且其中所述多个候选分类器中的第二分类器基于第二超参数集合。
6.根据权利要求2所述的方法,其进一步包括:
通过交叉验证所述多个候选分类器中的第一分类器而产生第一交叉验证结果;
通过交叉验证所述多个候选分类器中的第二分类器而产生第二交叉验证结果;及
基于所述多个候选分类器的交叉验证结果的比较而选择所述分类器。
7.根据权利要求1所述的方法,其进一步包括通过以下操作而交叉验证所述分类器:
使用所述分类器来产生用于所述时间序列目标数据的第一分类标签集合;
产生一或多个额外分类器,其中基于与第一资产相关联的第一时间序列数据、与所述第一时间序列数据相关联的多个分类标签及与第二资产相关联的第二时间序列数据而产生特定分类器,且其中所述特定分类器可操作以对与所述第二资产相关联的未加标签数据进行分类;
使用所述一或多个额外分类器中的第二分类器来产生用于所述时间序列目标数据的第二分类标签集合;及
基于所述第一分类标签集合与所述第二分类标签集合的比较而产生交叉验证结果。
8.根据权利要求7所述的方法,其进一步包括,至少部分地基于确定所述交叉验证结果满足交叉验证准则,产生指示所述分类器的输出。
9.根据权利要求1所述的方法,其进一步包括通过调整一或多个模型超参数而优化所述分类器。
10.根据权利要求1所述的方法,其进一步包括在交叉验证所述分类器之前优化所述分类器。
11.根据权利要求1所述的方法,其进一步包括:
通过交叉验证所述分类器而产生交叉验证结果;及
基于所述交叉验证结果满足交叉验证准则而选择性地优化所述分类器。
12.根据权利要求1所述的方法,其中基于以下各项中的至少一者而产生所述分类器:基于域分离网络DSN的技术、基于域混淆软标签DCSL的技术、基于利用深度自动编码器的迁移学习TLDA的技术、基于神经网络的域对抗训练DANN的技术、基于针对域适应共享权重SWS的技术、基于不断变化环境的增量对抗域适应IADA的技术或基于变分公平自动编码器VFAE的技术。
13.一种计算装置,其包括:
处理器,其经配置以:
接收与源资产相关联且包含分类标签集合的时间序列源数据;
接收与目标资产相关联且缺乏分类标签的时间序列目标数据;
依据所述时间序列源数据及所述时间序列目标数据而确定时间序列表示;及
基于包含于所述时间序列源数据中的所述分类标签集合且至少基于原始时间序列数据或所述时间序列表示,产生可操作以对与所述目标资产相关联的未加标签数据进行分类的分类器,其中所述原始时间序列数据包含所述时间序列源数据及所述时间序列目标数据。
14.根据权利要求13所述的计算装置,其中所述处理器进一步经配置以基于所述时间序列源数据及所述时间序列目标数据而产生多个候选分类器。
15.根据权利要求14所述的计算装置,其中所述多个候选分类器中的第一分类器基于所述时间序列源数据的第一部分及所述时间序列目标数据的第一部分,且其中所述多个候选分类器中的第二分类器基于所述时间序列源数据的第二部分及所述时间序列目标数据的第二部分。
16.根据权利要求13所述的计算装置,其中所述处理器进一步经配置以通过以下操作而交叉验证所述分类器:
使用所述分类器来产生用于所述时间序列目标数据的第一分类标签集合;
产生一或多个额外分类器,其中基于与第一资产相关联的第一时间序列数据、与所述第一时间序列数据相关联的多个分类标签及与第二资产相关联的第二时间序列数据而产生特定分类器,且其中所述特定分类器可操作以对与所述第二资产相关联的未加标签数据进行分类;
使用所述一或多个额外分类器中的第二分类器来产生用于所述时间序列目标数据的第二分类标签集合;及
基于所述第一分类标签集合与所述第二分类标签集合的比较而产生交叉验证结果。
17.根据权利要求16所述的计算装置,其中所述处理器进一步经配置以至少部分地基于确定所述交叉验证结果满足交叉验证准则,产生指示所述分类器的输出。
18.根据权利要求13所述的计算装置,其中基于以下各项中的至少一者而产生所述分类器:基于域分离网络DSN的技术、基于域混淆软标签DCSL的技术、基于利用深度自动编码器的迁移学习TLDA的技术、基于神经网络的域对抗训练DANN的技术、基于针对域适应共享权重SWS的技术、基于不断变化环境的增量对抗域适应IADA的技术或基于变分公平自动编码器VFAE的技术。
19.一种存储指令的计算机可读存储装置,所述指令在由处理器执行时致使所述处理器:
接收与源资产相关联且包含分类标签集合的时间序列源数据;
接收与目标资产相关联且缺乏分类标签的时间序列目标数据;
依据所述时间序列源数据及所述时间序列目标数据而确定时间序列表示;及
基于包含于所述时间序列源数据中的所述分类标签集合且至少基于原始时间序列数据或所述时间序列表示,产生可操作以对与所述目标资产相关联的未加标签数据进行分类的分类器,其中所述原始时间序列数据包含所述时间序列源数据及所述时间序列目标数据。
20.根据权利要求19所述的计算机可读存储装置,其中所述指令在由所述处理器执行时进一步致使所述处理器基于所述时间序列表示而产生多个候选分类器。
CN202010528755.4A 2020-02-18 2020-06-11 域适应分类器产生 Pending CN113344018A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/793,832 US20210256369A1 (en) 2020-02-18 2020-02-18 Domain-adapted classifier generation
US16/793,832 2020-02-18

Publications (1)

Publication Number Publication Date
CN113344018A true CN113344018A (zh) 2021-09-03

Family

ID=77272729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010528755.4A Pending CN113344018A (zh) 2020-02-18 2020-06-11 域适应分类器产生

Country Status (2)

Country Link
US (1) US20210256369A1 (zh)
CN (1) CN113344018A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024055647A1 (en) * 2022-09-15 2024-03-21 International Business Machines Corporation Machine-derived insights from time series data

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220024990A (ko) * 2019-08-02 2022-03-03 구글 엘엘씨 L2TL(Learning to Transfer Learn)을 위한 프레임워크
US12229706B2 (en) * 2021-06-10 2025-02-18 Samsung Display Co., Ltd. Systems and methods for concept intervals clustering for defect visibility regression
US20230036352A1 (en) * 2021-07-22 2023-02-02 Qatar Foundation For Education, Science And Community Development Cross-domain label-adaptive stance detection

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020187825A1 (en) * 2001-05-25 2002-12-12 Tracy Joseph J. Methods and systems for metered raffle-style gaming
CN107251011A (zh) * 2015-02-17 2017-10-13 微软技术许可有限责任公司 用于序列标签器的训练系统和方法
US20180053071A1 (en) * 2016-04-21 2018-02-22 Sas Institute Inc. Distributed event prediction and machine learning object recognition system
CN108664999A (zh) * 2018-05-03 2018-10-16 北京图森未来科技有限公司 一种分类模型的训练方法及其装置、计算机服务器
US10339468B1 (en) * 2014-10-28 2019-07-02 Groupon, Inc. Curating training data for incremental re-training of a predictive model

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10706351B2 (en) * 2016-08-30 2020-07-07 American Software Safety Reliability Company Recurrent encoder and decoder
US11227102B2 (en) * 2019-03-12 2022-01-18 Wipro Limited System and method for annotation of tokens for natural language processing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020187825A1 (en) * 2001-05-25 2002-12-12 Tracy Joseph J. Methods and systems for metered raffle-style gaming
US10339468B1 (en) * 2014-10-28 2019-07-02 Groupon, Inc. Curating training data for incremental re-training of a predictive model
CN107251011A (zh) * 2015-02-17 2017-10-13 微软技术许可有限责任公司 用于序列标签器的训练系统和方法
US20180053071A1 (en) * 2016-04-21 2018-02-22 Sas Institute Inc. Distributed event prediction and machine learning object recognition system
CN108664999A (zh) * 2018-05-03 2018-10-16 北京图森未来科技有限公司 一种分类模型的训练方法及其装置、计算机服务器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024055647A1 (en) * 2022-09-15 2024-03-21 International Business Machines Corporation Machine-derived insights from time series data

Also Published As

Publication number Publication date
US20210256369A1 (en) 2021-08-19

Similar Documents

Publication Publication Date Title
CN113344018A (zh) 域适应分类器产生
JP2021502650A (ja) 時不変分類
US20220245405A1 (en) Deterioration suppression program, deterioration suppression method, and non-transitory computer-readable storage medium
WO2016122591A1 (en) Performance testing based on variable length segmentation and clustering of time series data
JP6828807B2 (ja) データ解析装置、データ解析方法およびデータ解析プログラム
CN112729835A (zh) 一种轴向柱塞泵轴承的多域半监督故障诊断方法及装置
US20230161653A1 (en) Method of managing system health
US20210201201A1 (en) Method and apparatus for determining storage load of application
CN118245733A (zh) 基于运行误差监测模型的数据预处理方法及智能电表
CN116596556A (zh) 肉牛追溯管理系统及方法
KR102166441B1 (ko) 병변 검출 장치 및 제어 방법
CN116340845A (zh) 标签生成方法、装置、存储介质及电子设备
CN116232699A (zh) 细粒度网络入侵检测模型的训练方法和网络入侵检测方法
CN118626918B (zh) 一种基于人工智能的数据分类分级方法
RU2708965C1 (ru) Способ исследования функционального поведения технической системы и блок обработки
US20210319269A1 (en) Apparatus for determining a classifier for identifying objects in an image, an apparatus for identifying objects in an image and corresponding methods
CN116150186B (zh) 一种基于大数据的通信物联管理方法及系统
CN109857859A (zh) 新闻信息的处理方法、装置、设备以及存储介质
CN118690179B (zh) 特征提取优化方法、故障预测方法、处理器及存储介质
CN113191477A (zh) 碱式电解槽的温度传感器故障诊断方法与装置
CN118520365B (zh) 一种用于羊养殖生长监测的数据可视化分析系统
CN114399788B (zh) 对象检测方法和系统
CN117009776A (zh) 特征提取方法、模型训练方法、装置及电子设备
WO2023181319A1 (ja) 情報処理装置
WO2023053216A1 (ja) 機械学習プログラム、機械学習方法および機械学習装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40051234

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination