CN102799591B - 一种提供推荐词的方法及装置 - Google Patents
一种提供推荐词的方法及装置 Download PDFInfo
- Publication number
- CN102799591B CN102799591B CN201110138955.XA CN201110138955A CN102799591B CN 102799591 B CN102799591 B CN 102799591B CN 201110138955 A CN201110138955 A CN 201110138955A CN 102799591 B CN102799591 B CN 102799591B
- Authority
- CN
- China
- Prior art keywords
- category
- click
- mrow
- recommended query
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000007476 Maximum Likelihood Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 235000011430 Malus pumila Nutrition 0.000 description 34
- 235000015103 Malus silvestris Nutrition 0.000 description 34
- 241000220225 Malus Species 0.000 description 33
- 241000282326 Felis catus Species 0.000 description 17
- 235000013399 edible fruits Nutrition 0.000 description 16
- 239000000047 product Substances 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 244000141359 Malus pumila Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种提供推荐词的方法,该方法为:接收用户输入的初始query,并基于该初始query获得相应的推荐query,以及确定推荐query对应的至少两种类目,和用于查询推荐query的至少两种点击区域,再分别确定获得的每一种类目针对推荐query在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重,并计算获得每一种类目针对推荐query的置信度,接着,分别根据每一种类目针对推荐query的置信度,确定该推荐query的目标类目,这样,可以令用户根据各推荐query对应的目标类目,迅速确定自身的搜索意图,从而有效地提高了信息搜索速度。
Description
技术领域
本申请涉及搜索技术,特别涉及一种提供推荐词的方法及装置。
背景技术
随着互联网的迅速发展,电子商务已经广泛的融入到人们的日常生活中。
在这些电子商务的应用中,输入搜索关键字进行查询是用户查找和定位其感兴趣商品的主要方法和途径,也是用户使用的最为频繁的一个基本功能。为了能够快速查找和定位所需要的商品,用户需要选择恰当的搜索关键字来描述自身的搜索需求。
通常情况下,用户的搜索习惯是由抽象到特殊,即首先输入较宽泛的搜索关键字,然后再通过特殊化搜索关键字,逐步缩小搜索范围,最终定位到具体商品。
实际应用中,许多特殊商品的拼写比较复杂生僻,用户有可能只记忆住搜索关键字的开头部分,而遗忘后续的内容,从而导致用户需要通过多次查询才能定位到其所需要的商品,而重复或多次输入搜索关键字是一个繁琐的过程,降低了搜索效率,并且容易发生输入错误。
为了有效提高用户的搜索效率,参阅图1所示,现有技术下,电子商务网站通常会对用户输入的搜索关键字进行自动补齐,即提供一系列的推荐词。一个高效的提供推荐词的方法,可以节省用户的输入成本,缓解用户构造完整搜索关键字的需求负担,同时,高质量的推荐词可以帮助用户更好的查找和定位其感兴趣的商品。
随着电子商务网站中各类商品的数目日益增多,用户从输入搜索关键词到搜索到所需商品的过程也越来越长,因此,需要重新设计一种提供推荐词的方法,在现有技术的基础上进一步提高电子商务网站的搜索效率,提升系统的服务性能。
发明内容
本申请实施例提供一种提供推荐词的方法及装置,用以解决现有技术中存在的推荐词概念模糊,从而降低搜索装置的搜索效率的问题。
本申请实施例提供的具体技术方案如下:
一种提供推荐词的方法,包括:
接收用户输入的初始查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
确定获得的推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;
分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
一种提供推荐词的装置,包括:
获取单元,用于接收用户输入的初始查询关键字查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
第一确定单元,用于确定所述推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
第二确定单元,用于分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
计算单元,用于分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;
呈现单元,用于分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
本申请实施例中,使用用户查询日志建立推荐词典,并根据用户点击日志建立类目推荐方式,这样,系统根据用户输入的初始query(查询关键字)得到相应的推荐query时,可以根据用户已有的点击行为确定各推荐query对应的目标类目,并在呈现各推荐query的同时也呈现相应的目标类目,这样,通过目标类目向用户提示各推荐query的引导意图,令用户可以根据各推荐query对应的目标类目,迅速确定自身的搜索意图,避免无关的推荐query所造成的干扰,从而有效地提高了信息搜索速度;同时,系统利用用户选取的推荐query进行搜索时只在相应目标类目下进行搜索,而不是在所有的类目下搜索,从而大量减少了搜索信息的数量,进一步提高信息搜索速度,降低了服务器的处理压力。本申请可用于计算机、无线通讯设备等电子产品。
附图说明
图1为现有技术下提供推荐词示意图;
图2为本申请实施例中提供推荐词装置原理示意图;
图3为本申请实施例中第一种权重设置示意图;
图4为本申请实施例中第二种权重设置示意图;
图5为本申请实施例中提供推荐词流程图;
图6为本申请实施例中搜索装置功能结构示意图。
具体实施方式
下面结合附图对本申请优选的实施方式进行详细说明。
字典在查询输入补齐中起着重要的作用,所有的推荐词都是基于字典产生的。例如,用户输入“pho”,通过字典查询可以得到“phone”、“photo”、“photo frame”、“photo album”等具有“pho”前缀的推荐词。
建立字典的详细流程如下:
1、输入用户的查询日志;
2、对用户的查询日志进行预处理操作,包括消除乱码、规范标点符号书写、拼写纠错(用户可能由于手误输入错误的搜索关键字)、复数转换成单数表示等,这些经过预处理之后的搜索关键字成为候选词集合;
3、从步骤2生成的候选词集合中选取一个候选词;
4、从候选词中提取并移除最左边的字母元素,例如,候选词“phone”,提取字母元素“p”,移除首字母后候选词为“hone”;
5、将候选词“phone”加入首字母“p”对应的推荐词集合中;
6、重复步骤0,直到候选词中所有的字母元素被提取;
7、将候选词“phone”加入“phone”对应的推荐词集合;
8、重复步骤0,直到候选词集合为空;
9、完成推荐词字典的建立
电子商务网站上,用于展示推荐词的空间都存在限制,仅仅能展示有限的推荐词,但是与用户输入的搜索关键字匹配的推荐词的数量通常情况下远远大于这个限制,因此,需要从推荐词中选取“质量”最好的若干个推荐词进行呈现。
本申请实施例中,采用优先级来衡量推荐词的质量,优先级越高,质量越好,具体为:首先使用推荐词与搜索关键字之间的匹配度进行排序,如果推荐词与搜索关键字的匹配属于推荐词的第一个单词,则其匹配位置为“0”,如果属于第二个单词,则匹配位置为“1”,以此类推;匹配位置越靠前,则优先级越高,例如输入“phone”,推荐词“phone case”比“mobile phone”要好,因为第一个匹配位置为0,第二个匹配位置为1;
在电子商务领域中,每个电子商品都会被归入某个类目(或同时归于多个类目),所谓类目即是指在电子商务领域中,一个商品对应的产品类别,例如,手机对应的类目为通讯器材,而相机对应的类目为数码产品等等。用户的查询行为通常是和某一个类目相关联,因此,本申请实施例中,将推荐词和类目关联在一起推荐给用户,令用户可以通过类目筛选过滤掉部分干扰因素,所谓的干扰因素即是与用户搜索目的无关的推荐词,从而提高系统的搜索效率。具体为:
通常情况下,用户在电子商务网站上输入搜索关键字后,会点击和浏览网页中非导航区内的某些商品,或者点击网页中导航区内的类目,因此,可以从用户的查询日志中学习搜索关键字(即推荐词)与类目之间的关联性。本申请实施例中,使用Offer点击行为(即网页中非导航区展示的商品信息的点击行为)、电子商务导航区点击行为作为特征,使用线性模型进行融合,它们分别对应:Offer点击模型、导航区点击模型,其融合框架如图2所示:
首先,定义两个函数:分别为:
click1(offer,query)=cat′,其中,query表示用户输入的某个搜索关键字,Offer表示用户点击了某个产品的网页,cat′表示上述Offer的类目;click1(offer,query)=cat′的含义即表示当用户输入query后,在offer网页中是否点击了类目cat′,取值为1表示点击,取值为0表示未点击。
click2(query)=cat″,其中,query表示用户输入的某个搜索关键字,表示用户点击了导航区的某个类目,click2(query)=cat″的含义即表示当用户输入query后,在导航区是否点击了类目cat″,取值为1表示点击,取值为0表示未点击。
基于上述定义的函数,Offer网页的点击特征模型可以采用公式一表示为:
公式一
公式“f”表示一个针对Offer抽取特征的特征函数,针对一个offer,给定query(查询词,函数中用x表示)和cat′(类目)的条件下,这个函数取值有两个:1或者0(这就是一个特征的取值),其中,特征函数中y定义为click1函数;给定一个query,并且这个query的click1(offer,query)=cat′的时候,取值为1;否则,数取值为0。通过这个函数,可以把一个Offer转换成一个特征空间,该特征空间表示用户输入query(可以是多个)后,在offer网页中分别点击了哪些类目下的商品信息。
基于上述定义的函数,导航区点击特征模型可以采用公式二表示为:
公式二
公式“f”表示一个针对导航区抽取特征的特征函数,给定一个query(查询词,函数中用x表示)和类目的条件下,这个函数取值有两个:1或者0(这就是一个特征值的取值范围);其中,特征函数中的y定义为click2函数。给定一个query,可以计算导航区类的类目的特征值,如果click2(query)=cat″,取值为1;否则,取值为0。通过这个函数,可以基于query和导航区的类目生成一个特征空间,该特征空间表示用户输入query(可以是多个)后,在导航区中分别点击了哪些类目。。
以Offer点击数据和导航区点击数据为训练数据进行训练,分别得出Offer点击特征和导航区点击特征下每一种类目的类目权重,也可以称为Offer点击区域和导航区点击区域下每一种类目的类目权重,可以理解为针对某个特定的query,用户在Offer点击区域内点击每一个类目的概率,以及用户在导航区点击区域内点击每一个类目的概率;权重的具体定义方式为:
1)Offer点击区域下的类目权重如公式三所示:
公式三
其中,Offer_cnt表示在offer点击数据中,特定query下,其关联的类目是cat′的所有Offer的点击数累加;catj表示某一个预设的类目,实际应用中,电子商务网站有很多产品被归类于某一类,如,水果,“j”用来标识不同的类目。
例如,假设给定query“苹果”,在“水果”类目下用户点击了75个offer,“电子”类目下用户点击了25个offer,则g1(“苹果”,”水果”)=0.75,g1(“苹果”,”电子”)=0.25;
2)导航区点击区域下的权重如公式四所示:
公式四
其中,sn_cnt表示在导航区点击数据中,特定query下,类目cat″的点击数累加,“j”用来标识不同的类目。假设有类目1,类目2,类目3,......,类目n,使j=1,2,...,n,可以统计所有类目下某一个query的点击数累计
例如,假设给定query“苹果”,并且导航区展示了2个类目,分别是“类目1:水果”和“类目2:电子”,在“苹果”这一query下,导航区类目1的点击数累加是75,类目2的点击数累加是25,则g2(“苹果”,“水果”)=0.75,g2(“苹果”,“电子”)=0.25。
较佳的,参阅图3所示,本实施例中,对于单个点击特征fi,需要进一步乘以其对应的权重gi,这样,可以使各个单个点击特征之间有较好的区分度,因为gi是一种最大使然比,反映了结果在训练数据中的经验分布,即是指,fi表示提取的一个点击特征,通过这个点击特征fi与其对应的gi的乘积,可以看出在这个点击特征fi下query偏向于哪一个类目,例如,仍采用上述实施例,其中,g1和g2都偏向于“水果”类目(都是0.75),那么,此时,这个点击特征fi倾向于类目1“水果”。
基于上述实施例,最后的判别操作综合了所有点击区域对应的点击特征,即各个点击区域对应的各点击特征之间也需要点击特征权重w来进行区分;因此,引入选通流程来评估特征的重要程度,即计算w,具体如图4所示,各种点击特征对应的w由管理人员根据试验结果进行预先设置。
从上述函数设置方式可以看出,g表示某一点击特征相对于输出类目的重要程度;w表示各点击特征之间的相对重要程度。
实际应用中,在训练数据进行了标注的情况下,w可以使用最大使然估计(MLE)训练得到,事实上,这种情况下可以不需要g参数(但g参数可以作为点击特征值,而不再是0,1值,直接训练特征参数即可;而在训练数据未进行标注的情况下,可以采用点击区域对应的点击特征的置信度(也可以称为该点击区域的置信度)来设置w,例如,Offer点击区域内,Offer点击特征对应的W1设置为:ω1=1-perror,其中,perror表示使用Offer点击特征进行判断的错误率;中心NP的ω值可以设定为它与原始query的相似度分值。
基于上述定义的各种函数,参阅图5所示,本申请实施例中,基于用户输入的初始query,搜索装置向用户提供相关推荐词的详细流程如下:
步骤500:接收用户输入的初始query,并基于该初始query获得相应的推荐query。
本实施例中,搜索装置接收用户输入的初始query后,由于初始query可能是不完整的,因此搜索装置需要根据预设的字典对初始query进行补充,以获得相应的推荐query,即根据初始query获得相应的推荐词。
例如,假设用户输入“pho”,则搜索装置通过字典查询可以得到“phone”、“photo”、“photo frame”、“photo album”等具有“pho”前缀的推荐词,即推荐query。
又例如,假设用户输入“苹”,则搜索装置通过字典查询可以得到“苹果”这一推荐query。
又例如,假设用户输入“苹果”,则搜索装置通过字典查询可以得到“苹果手机”、“苹果MP3”......推荐query。
后续实施例中,以用户输入的初始query为“苹”,而搜索装置根据字典对其进行补充,获得推荐query“苹果”为例进行介绍。
步骤510:确定获得的推荐query对应的至少两种类目,以及用于查询推荐query的至少两种点击区域。
本实施例中,假设“苹果”对应两种类目,分别为“水果”和“电子”,而用于查询推荐query的点击区域也有两种,一种为Offer网页,一种为导航区。
步骤520:分别确定获得的每一种类目在每一种点击区域下的类目权重g,以及每一种点击区域的点击特征权重w。
本实施例中,在确定任意一个类目(称为类目x)在任意一个点击区域(称为区域x)下的类目权重g时,采用以下方式进行计算:根据推荐query在区域x内类目x下对应的点击总数目,以及推荐query在区域x内所有类目下对应的点击数总数目的比值,确定相应的类目权重g,即类目x在区域x内的类目权重g,具体计算公式参考公式三和公式四,在此不再赘述。
同时,任意一点击区域的点击特征权重w的确定方式如下:
在训练数据进行了标注的情况下,w使用极大似然估计方式获得;
在训练数据未进行标注的情况下,采用上述任意一点击区域对应的置信度来设置w。具体设置方式在之前实施例中已介绍,在此亦不再赘述。
上述参数g和参数w的取值可以预先由管理人员配置好进行保存,并根据用户数据的变更而进行实时更新,也可以在获取推荐query后,根据当前的用户数据进行实时计算。
例如,假设针对推荐query“苹果”,系统统计用户点击行为,在offer网页的区域内,在“水果”类目下,用户点击次数总共为75次,在“电子”类目下用户点击次数总共为75次,则g1(“苹果”,“水果”)=0.75,g1(“苹果”,“电子”)=0.25;而在导航区域内,在“水果”类目下,用户点击次数总共为80次,在“电子”类目下,用户点击次数总共为20次,则g2(“苹果”,“水果”)=0.8,g2(“苹果”,“电子”)=0.2;
同时,假设使用offer点击模型预测query类目的精确度为80%,则设置Offer网页的点击特征权重为w1=0.8;使用导航区点击模型预测query类目的精确度为60%,则设置导航区的点击特征权重为w2=0.6。
步骤530:分别根据每一种类目在每一种点击区域下针对上述推荐query的类目权重g,以及每一种点击区域的点击特征权重w,计算获得每一种类目针对上述推荐query的置信度h。
本实施例中,计算任意一种类目针对上述推荐query的置信度h时,采用公式五进行计算:
其中,使用h(x,y)作为x对y的置信度;
X表示推荐query;
Y表示类目对应的特征函数,如,click1(offer,query)或,click2(query),针对某一类目,若存在推荐query,则Y取值为1,若不存在推荐query,则Y取值为0,而由于本实施例中是针对存在的类目计算h(x,y)的,因此,Y就可以看作是作为计算对象的任意一种类目;
Wi表示点击区域i的点击特征权重;
K表示点击区域的数目;
gi表示类目Y在点击区域i内针对推荐query的类目权重;
fi(x,y)表示点击区域i对应的点击特征,参考公式一和公式二可以获知,若类目y下确实存在推荐query,则fi(x,y)取值为1,而公式五是针对推荐query与Y之间的对应关系存在的情况而计算的,因此,fi(x,y)取值为1,显然,可以将fi(x,y)的计算融入gi(x,y)的计算中;
Z表示归一化因子,
本实施例中,K=2,则i取值范围是1和2。
例如,结合步骤520中的举例,可以计算获得,Z==(0.8×0.75+0.6×0.8)+(0.8×0.25+0.6×0.2)=1.4;那么,
h(“苹果”,“水果”)/Z=(0.8×0.75+0.6×0.8)/1.4=77.14%;
h(“苹果”,“电子”)/Z=(0.8×0.25+0.6×0.2)/1.4=22.86%。
步骤540:分别根据每一种类目针对上述推荐query的置信度h,确定该推荐query的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
本实施例中,步骤540的执行方式包含但不限于以下几种:
1、将置信度超过设定阈值的类目确定为推荐query的目标类目,并按照目标类目的置信度从高到低的顺序对推荐query进行呈现;
例如,推荐query“苹果”对应两种目标类目,分别为置信度77.14%的“水果”,和置信度22.86%的“电子”类目,均超过设定门限值20%,因此,在呈现“苹果”这一推荐词,先呈现“水果”类目,再呈现“电子”类目;具体为:
初始query:苹
推荐query:苹果 水果类
推荐query:苹果 电子类
2、将置信度超过设定阈值的类目确定为推荐query的目标类目,并按照目标类目的种类对推荐query进行分组呈现。
例如,基于初始query“苹果”,其相应的推荐queryE “苹果手机”、“苹果MP3”和“苹果耳机”,分别对应置信度56%的“手机”类目,和置信度44%的“数码影音”类目,均超过设定门限值20%,因此,在呈现上述各推荐query时,按照不同的目标类目进行分组呈现,具体为:
初始query:苹果
手机类 数码影音类
推荐query:苹果手机 苹果MP3
苹果耳机
实际应用中还会随着业务的增加而出现多种灵活的呈现方法,上述两种方式仅为举例。
进一步地,当系统根据用户选择的推荐query作进一步搜索时,可以只在相应的目标类目下进行搜索,而不是在所有类目下进行搜索,从而有效减少了搜索信息量,进一步提高了搜索效率。
基于上述实施例,参阅图6所示,本实施例中,搜索装置包括获取单元60、第一确定单元61、第二确定单元62、
获取单元60,用于接收用户输入的推荐query,并基于该初始query获得相应的推荐query;
第一确定单元61,用于确定推荐query对应的至少两种类目,以及用于查询推荐query的至少两种点击区域;
第二确定单元62,用于分别确定获得的每一种类目针对推荐query在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
计算单元63,用于分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对推荐query的置信度;
呈现单元64,用于分别根据每一种类目针对推荐query的置信度,确定该推荐query的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
综上所述,本申请实施例中,使用用户查询日志建立推荐词典,并根据用户点击日志建立类目推荐方式,这样,系统根据用户输入的初始query得到相应的推荐query时,可以根据用户已有的点击行为确定各推荐query对应的目标类目,并在呈现各推荐query的同时也呈现相应的目标类目,这样,通过目标类目向用户提示各推荐query的引导意图,令用户可以根据各推荐query对应的目标类目,迅速确定自身的搜索意图,避免无关的推荐query所造成的干扰,从而有效地提高了信息搜索速度;同时,系统利用用户选取的推荐query进行搜索时只在相应目标类目下进行搜索,而不是在所有的类目下搜索,从而大量减少了搜索信息的数量,进一步提高信息检索速度,降低了服务器的处理压力。本申请可用于计算机、无线通讯设备等电子产品。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (8)
1.一种提供推荐词的方法,其特征在于,包括:
接收用户输入的初始查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
确定获得的推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;其中,计算获得任意一种类目针对所述推荐查询关键字的置信度,具体包括:采用公式 计算所述置信度;其中,h(x,y)表示x对y的置信度;x表示推荐查询关键字;y表示所述任意一种类目;ωi表示点击区域i的点击特征权重;k表示点击区域的数目;gi表示类目y在点击区域i内针对推荐查询关键字的类目权重;fi(x,y)表示点击区域i对应的点击特征,取值为1;Z表示归一化因子,
分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
2.如权利要求1所述的方法,其特征在于,确定获得的任意一种类目针对所述推荐查询关键字在任意一点击区域下的类目权重,包括:
根据所述推荐查询关键字在所述任意一点击区域内所述任意一种类目下对应的点击总数目,以及所述推荐查询关键字在所述任意一点击区域内的所有类目下对应的点击总数目的比值,确定所述类目权重。
3.如权利要求1所述的方法,其特征在于,确定任意一点击区域的点击特征权重时,包括:
采用极大似然估计方式设置所述点击特征权重;或者,采用所述任意一点击区域对应的置信度设置所述点击特征权重。
4.如权利要求1所述的方法,其特征在于,分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现,包括:
将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的置信度从高到低的顺序对所述推荐查询关键字进行呈现;
或者,
将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的种类对所述推荐查询关键字进行分组呈现。
5.一种提供推荐词的装置,其特征在于,包括:
获取单元,用于接收用户输入的初始查询关键字查询关键字,并基于该初始查询关键字获得相应的推荐查询关键字;
第一确定单元,用于确定所述推荐查询关键字对应的至少两种类目,以及用于查询推荐查询关键字的至少两种点击区域;
第二确定单元,用于分别确定获得的每一种类目针对所述推荐查询关键字在每一种点击区域下的类目权重,以及每一种点击区域的点击特征权重;
计算单元,用于分别根据获得的每一种类目对应的类目权重,以及每一种点击区域对应的点击特征权重,计算获得每一种类目针对所述推荐查询关键字的置信度;其中,计算获得任意一种类目针对所述推荐查询关键字的置信度,具体包括:采用公式 计算所述置信度;其中,h(x,y)表示x对y的置信度;x表示推荐查询关键字;y表示所述任意一种类目;ωi表示点击区域i的点击特征权重;k表示点击区域的数目;gi表示类目y在点击区域i内针对推荐查询关键字的类目权重;fi(x,y)表示点击区域i对应的点击特征,取值为1;Z表示归一化因子,
呈现单元,用于分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现。
6.如权利要求5所述的装置,其特征在于,所述第一确定单元确定获得的任意一种类目针对所述推荐查询关键字在任意一点击区域下的类目权重时,根据所述推荐查询关键字在所述任意一点击区域内所述任意一种类目下对应的点击总数目,以及所述推荐查询关键字在所述任意一点击区域内的所有类目下对应的点击总数目的比值,确定所述类目权重。
7.如权利要求5所述的装置,其特征在于,所述第二确定单元确定任意一点击区域的点击特征权重时,采用极大似然估计方式设置所述点击特征权重;或者,采用所述任意一点击区域对应的置信度设置所述点击特征权重。
8.如权利要求5所述的装置,其特征在于,所述呈现单元分别根据每一种类目针对所述推荐查询关键字的置信度,确定所述推荐查询关键字的目标类目,并对所述推荐查询关键字及相应的目标类目进行呈现时,将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的置信度从高到低的顺序对所述推荐查询关键字进行呈现;或者,将置信度超过设定阈值的类目确定为所述推荐查询关键字的目标类目,并按照目标类目的种类对所述推荐查询关键字进行分组呈现。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110138955.XA CN102799591B (zh) | 2011-05-26 | 2011-05-26 | 一种提供推荐词的方法及装置 |
TW100128685A TWI582619B (zh) | 2011-05-26 | 2011-08-11 | Method and apparatus for providing referral words |
JP2014512114A JP5984917B2 (ja) | 2011-05-26 | 2012-05-24 | 提案される語を提供するための方法および装置 |
PCT/US2012/039426 WO2012162541A1 (en) | 2011-05-26 | 2012-05-24 | Method and apparatus of providing suggested terms |
EP12789336.0A EP2715574A4 (en) | 2011-05-26 | 2012-05-24 | METHOD AND APPARATUS FOR PROVIDING SUGGESTED TERMS |
US13/522,142 US20120330962A1 (en) | 2011-05-26 | 2012-05-24 | Method and Apparatus of Providing Suggested Terms |
HK13100396.5A HK1173244B (zh) | 2013-01-10 | 一種提供推薦詞的方法及裝置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110138955.XA CN102799591B (zh) | 2011-05-26 | 2011-05-26 | 一种提供推荐词的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102799591A CN102799591A (zh) | 2012-11-28 |
CN102799591B true CN102799591B (zh) | 2015-03-04 |
Family
ID=47198703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110138955.XA Active CN102799591B (zh) | 2011-05-26 | 2011-05-26 | 一种提供推荐词的方法及装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20120330962A1 (zh) |
EP (1) | EP2715574A4 (zh) |
JP (1) | JP5984917B2 (zh) |
CN (1) | CN102799591B (zh) |
TW (1) | TWI582619B (zh) |
WO (1) | WO2012162541A1 (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103902535B (zh) * | 2012-12-24 | 2019-02-22 | 腾讯科技(深圳)有限公司 | 获取联想词的方法、装置及系统 |
CN103914492B (zh) * | 2013-01-09 | 2018-02-27 | 阿里巴巴集团控股有限公司 | 查询词融合方法、商品信息发布方法和搜索方法及系统 |
CN103942198B (zh) * | 2013-01-18 | 2017-07-28 | 佳能株式会社 | 用于挖掘意图的方法和设备 |
CN104281896A (zh) * | 2013-07-01 | 2015-01-14 | 富士通株式会社 | 信息整合系统和信息整合方法 |
US10255363B2 (en) | 2013-08-12 | 2019-04-09 | Td Ameritrade Ip Company, Inc. | Refining search query results |
US9881010B1 (en) * | 2014-05-12 | 2018-01-30 | Google Inc. | Suggestions based on document topics |
US11061893B2 (en) * | 2014-05-30 | 2021-07-13 | Apple Inc. | Multi-domain query completion |
CN105183733A (zh) * | 2014-06-05 | 2015-12-23 | 阿里巴巴集团控股有限公司 | 一种文本信息的匹配、业务对象的推送方法和装置 |
US9811559B2 (en) * | 2014-09-01 | 2017-11-07 | Mapquest, Inc. | Computerized systems and methods for identifying points-of-interest using customized query prediction |
US20160371340A1 (en) * | 2015-06-19 | 2016-12-22 | Lenovo (Singapore) Pte. Ltd. | Modifying search results based on context characteristics |
RU2632140C2 (ru) * | 2015-09-29 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер для кластеризации предложений для поисковых запросов |
CN105426535A (zh) * | 2015-12-18 | 2016-03-23 | 北京奇虎科技有限公司 | 基于搜索提示的搜索方法及装置 |
US10515402B2 (en) * | 2016-01-30 | 2019-12-24 | Walmart Apollo, Llc | Systems and methods for search result display |
CN108319585B (zh) * | 2018-01-29 | 2021-03-02 | 北京三快在线科技有限公司 | 数据处理方法及装置、电子设备、计算机可读介质 |
CN110515929B (zh) * | 2019-08-29 | 2023-03-31 | 掌阅科技股份有限公司 | 书籍展示方法、计算设备及存储介质 |
CN111552867B (zh) * | 2020-03-31 | 2021-09-28 | 北京城市网邻信息技术有限公司 | 一种业务信息的推荐方法和装置 |
CN114238705B (zh) * | 2020-09-09 | 2024-10-29 | 北京搜狗科技发展有限公司 | 一种相关搜索推荐方法、装置及电子设备 |
CN112256960B (zh) * | 2020-10-10 | 2024-04-16 | 成都一课量子科技有限公司 | 一种商场、社区、写字楼用户推荐服务的算法方法 |
CN113326420B (zh) * | 2021-06-15 | 2023-10-27 | 北京百度网讯科技有限公司 | 问题检索方法、装置、电子设备和介质 |
CN115618100B (zh) * | 2022-09-15 | 2024-02-06 | 中航信移动科技有限公司 | 用于关联事件推荐的数据处理方法、存储介质及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7836391B2 (en) * | 2003-06-10 | 2010-11-16 | Google Inc. | Document search engine including highlighting of confident results |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772150B1 (en) * | 1999-12-10 | 2004-08-03 | Amazon.Com, Inc. | Search query refinement using related search phrases |
US7499914B2 (en) * | 2003-04-04 | 2009-03-03 | Yahoo! Inc. | Search system using search subdomain and hints to subdomains in search query statements and sponsored results on a subdomain-by-subdomain basis |
TWI227417B (en) * | 2003-12-02 | 2005-02-01 | Inst Information Industry | Digital resource recommendation system, method and machine-readable medium using semantic comparison of query sentence |
US20050222987A1 (en) * | 2004-04-02 | 2005-10-06 | Vadon Eric R | Automated detection of associations between search criteria and item categories based on collective analysis of user activity data |
US7519581B2 (en) * | 2004-04-30 | 2009-04-14 | Yahoo! Inc. | Method and apparatus for performing a search |
US7620628B2 (en) * | 2004-12-06 | 2009-11-17 | Yahoo! Inc. | Search processing with automatic categorization of queries |
US7747639B2 (en) * | 2005-08-24 | 2010-06-29 | Yahoo! Inc. | Alternative search query prediction |
KR100643801B1 (ko) * | 2005-10-26 | 2006-11-10 | 엔에이치엔(주) | 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법 |
US20080294624A1 (en) * | 2007-05-25 | 2008-11-27 | Ontogenix, Inc. | Recommendation systems and methods using interest correlation |
US20090171929A1 (en) * | 2007-12-26 | 2009-07-02 | Microsoft Corporation | Toward optimized query suggeston: user interfaces and algorithms |
US20090241018A1 (en) * | 2008-03-18 | 2009-09-24 | Cuill, Inc. | Apparatus and method for displaying search results with configurable columns and textual summary lengths |
US8756219B2 (en) * | 2008-11-04 | 2014-06-17 | Microsoft Corporation | Relevant navigation with deep links into query |
CN101887437B (zh) * | 2009-05-12 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种搜索结果生成方法及信息搜索系统 |
CN102033877A (zh) * | 2009-09-27 | 2011-04-27 | 阿里巴巴集团控股有限公司 | 检索方法和装置 |
US9405841B2 (en) * | 2009-10-15 | 2016-08-02 | A9.Com, Inc. | Dynamic search suggestion and category specific completion |
US8954422B2 (en) * | 2010-07-30 | 2015-02-10 | Ebay Inc. | Query suggestion for E-commerce sites |
US20120072281A1 (en) * | 2010-09-21 | 2012-03-22 | Yahool Inc. | Method and system to monetize domain queries in sponsored search |
US8972895B2 (en) * | 2010-12-20 | 2015-03-03 | Target Brands Inc. | Actively and passively customizable navigation bars |
US8756121B2 (en) * | 2011-01-21 | 2014-06-17 | Target Brands, Inc. | Retail website user interface |
US20120265784A1 (en) * | 2011-04-15 | 2012-10-18 | Microsoft Corporation | Ordering semantic query formulation suggestions |
-
2011
- 2011-05-26 CN CN201110138955.XA patent/CN102799591B/zh active Active
- 2011-08-11 TW TW100128685A patent/TWI582619B/zh not_active IP Right Cessation
-
2012
- 2012-05-24 EP EP12789336.0A patent/EP2715574A4/en not_active Withdrawn
- 2012-05-24 JP JP2014512114A patent/JP5984917B2/ja active Active
- 2012-05-24 WO PCT/US2012/039426 patent/WO2012162541A1/en active Application Filing
- 2012-05-24 US US13/522,142 patent/US20120330962A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7836391B2 (en) * | 2003-06-10 | 2010-11-16 | Google Inc. | Document search engine including highlighting of confident results |
Also Published As
Publication number | Publication date |
---|---|
WO2012162541A1 (en) | 2012-11-29 |
TW201248435A (en) | 2012-12-01 |
TWI582619B (zh) | 2017-05-11 |
US20120330962A1 (en) | 2012-12-27 |
EP2715574A4 (en) | 2015-04-01 |
JP2014515514A (ja) | 2014-06-30 |
HK1173244A1 (zh) | 2013-05-10 |
EP2715574A1 (en) | 2014-04-09 |
JP5984917B2 (ja) | 2016-09-06 |
CN102799591A (zh) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102799591B (zh) | 一种提供推荐词的方法及装置 | |
CN105022840B (zh) | 一种新闻信息处理方法、新闻推荐方法和相关装置 | |
CN102054016B (zh) | 用于撷取及管理社群智能信息的系统及方法 | |
CN109299994B (zh) | 推荐方法、装置、设备及可读存储介质 | |
US8370282B1 (en) | Image quality measures | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
US10929409B2 (en) | Identifying local experts for local search | |
US20190318407A1 (en) | Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof | |
CN108763321A (zh) | 一种基于大规模相关实体网络的相关实体推荐方法 | |
CN103914478A (zh) | 网页训练方法及系统、网页预测方法及系统 | |
CN113065062A (zh) | 一种基于用户阅读时间行为的新闻推荐方法及系统 | |
CN104123332A (zh) | 搜索结果的显示方法及装置 | |
CN110503506B (zh) | 基于评分数据的物品推荐方法、装置及介质 | |
CN104933100A (zh) | 关键词推荐方法和装置 | |
EP3608799A1 (en) | Search method and apparatus, and non-temporary computer-readable storage medium | |
KR20180112718A (ko) | 유사 사용자 매칭을 이용한 자동 답변 방법 및 시스템 | |
US11941073B2 (en) | Generating and implementing keyword clusters | |
CN109460519B (zh) | 浏览对象推荐方法及装置、存储介质、服务器 | |
CN113392329A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
US8825641B2 (en) | Measuring duplication in search results | |
CN107193883B (zh) | 一种数据处理方法和系统 | |
CN112487283A (zh) | 训练模型的方法、装置、电子设备及可读存储介质 | |
CN107545075A (zh) | 一种基于在线评论和情境感知的餐馆推荐方法 | |
JP2011086043A (ja) | 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 | |
US8745059B1 (en) | Clustering queries for image search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1173244 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1173244 Country of ref document: HK |