CN101145936B - 一种在Web页面中添加标签的方法及其系统 - Google Patents
一种在Web页面中添加标签的方法及其系统 Download PDFInfo
- Publication number
- CN101145936B CN101145936B CN2006101272136A CN200610127213A CN101145936B CN 101145936 B CN101145936 B CN 101145936B CN 2006101272136 A CN2006101272136 A CN 2006101272136A CN 200610127213 A CN200610127213 A CN 200610127213A CN 101145936 B CN101145936 B CN 101145936B
- Authority
- CN
- China
- Prior art keywords
- page
- client
- web
- web server
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 230000003068 static effect Effects 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 abstract description 8
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种在Web页面中添加标签的方法,该方法为:Web服务器根据客户端的请求获取需要发送给该客户端的若干页面,扫描所述若干页面的代码以定位到插入标签的指定位置并在该指定位置嵌入标签代码,以及将嵌入标签代码的页面发送给客户端;日志文件服务器接收所述客户端根据该标签发送的访问信息。这样,便解决了现有技术下Web服务器向客户端发送的Web页面中有部分页面没有嵌入标签,从而导致日志文件数据分析结果不准确的问题;既保留了通过标签生成访问日志的优点,又防止了部分Web页面在嵌入标签时被遗漏,同时也减少了网站工程师的工作量。本发明还公开了一种Web服务器和一种网站系统。
Description
技术领域
本发明涉及互联网数据分析领域,特别涉及一种在Web页面中添加标签的方法及其系统。
背景技术
随着互联网上信息服务的发展,许多政府部门、公司、大专院校、科研院所等都已经拥有或正在建设自己的网站。每个网站的后面都运行着一个Web服务器,Web服务器也称为WWW(World Wide Web)服务器,主要功能是提供网上信息浏览服务。WWW是互联网Internet的多媒体信息查询工具,是Internet近年才发展起来的服务,也是发展最快和目前应用最广泛的服务。WWW采用的是客户端/服务器结构,WEB服务器的作用是整理和储存各种WWW资源,并响应客户端请求,把用户所需的资源传送到Windows95、Windows98、WindowsNT、UNIX或Linux等平台上;如Web服务器负责管理Web页面,在接收用户请求后将相应的页面通过本地网络或Internet传送至客户端Web浏览器以供用户使用。现在较常用的Web服务器包括Apache服务器、Microsoft IIS服务器和Iplanet的Enterprise服务器。
对网站的管理,要求不仅仅关注Web服务器每天的吞吐量,还要了解网站各页面的访问情况,根据各页面的点击频率来改善网页的内容和质量、提高信息的可读性,跟踪包含有商业交易的步骤以及管理网站的后台数据等,尤其是以电子商务或搜索引擎为业务的网络公司,更是需要对Web服务器的运行和访问情况进行详细而周全的分析以跟踪用户的行为;而这些要求都可以通过对Web服务器的日志文件进行统计和分析来做到。
目前,市场上有两种较为流行的日志文件的生成方式。
一种方式是由Web服务器直接生成日志文件。参阅图1所示,用户通过客户机发送Web页面浏览请求到Web服务器;Web服务器接收该请求后,将用户请求浏览的Web页面返回给客户端,并记录对应的访问日志;最后由日志文件服务器统一收集分散在各个Web服务器上的访问日志并进行分析、整理。
这种方法的主要缺点是,日志文件分散在各台Web服务器上,如果要进行分析,需要收集日志文件并进行处理。一般的以电子商务为主的网站,如果日浏览量超过五千万,就需要上百台Web服务器为其提供服务;收集上百台机器的访问日志,需要花费较长时间,又会影响Web服务器的负载,同时,由于Web服务器数量太多,日志文件服务器很容易遗漏部分访问日志,导致数据分析结果的不可靠。
另一种方式是采用标签(Tag)生成日志文件。用户通过客户端发送Web页面浏览请求到Web服务器;Web服务器将相应的已嵌入Tag的Web页面发送给客户端,所述Tag为一小段代码,一般为Javascript代码;客户端根据所述Web页面上嵌入的Tag生成对应的访问信息,并将该访问信息发送给日志文件服务器;日志文件服务器根据所述访问信息生成相应的访问日志并向客户端返回请求结果,接着对所述访问日志进行分析、整理。
这种方式直接将需要分析的访问日志集中生成在日志文件服务器,减少了日志收集的过程。但是,对于Tag的生成方式,现有技术还存在不足之处。
一般来说,用户访问的Web页面分为静态页面和动态页面两种。所述静态页面是指该页面只对应一个固定的页面内容;所述动态页面是指该页面可以依据预先设定的页面程序,根据用户的不同请求返回相应的数据。
对于静态页面,网站工程师先在页面代码中确定Tag的指定嵌入位置,再将Tag手工嵌入到所述位置上,有多少个静态页面网站工程师就需要手工嵌入Tag代码多少次;如果一个网站有较多的静态页面,那么手工嵌入Tag需要的工作量和日后维护的工作量将是非常大的,而且如果某些静态页面在手工嵌入Tag时被遗漏,那么这些页面的访问统计将不会被传送至日志文件服务器,从而导致日志文件数据分析结果不准确。
对于动态页面,网站工程师将Tag代码做成公用模板,并在页面代码中的指定位置加入调用命令,这样,Web服务器上的动态应用程序在生成动态页面时便根据所述命令调用对应的公用模板,将Tag嵌入动态页面中;一般一个大型的网站会有很多动态应用程序,若要在所有的动态页面中嵌入Tag,就需要手工修改所有的动态应用程序,其工作量和日后维护的工作量也将是非常大的,而且网络工程师可能会忘记修改新上线的动态应用程序,使得新生成的动态页面中没有嵌入Tag,那么这些页面的访问统计将同样不会被传送至日志文件服务器,从而导致日志文件数据分析结果不准确。
发明内容
本发明提供一种在Web页面中添加标签的方法及其系统,用以解决现有技术中在Web页面中嵌入标签存在工作量大和容易出错的问题。
本发明技术方案如下:
一种在Web页面中添加标签的方法,包括:
Web服务器根据客户端的请求获取需要发送给该客户端的若干页面;
所述Web服务器扫描所述若干页面的代码以定位到插入标签的指定位置,并在该指定位置嵌入标签代码;
所述Web服务器将嵌入标签代码的页面发送给所述客户端;
日志文件服务器接收所述客户端根据该标签发送的访问信息。
根据上述方法:
所述Web服务器获取的页面包括静态页面和动态页面。
所述日志文件服务器根据所述访问信息生成相应的访问日志。
一种Web服务器,包括:
用于接收客户端发送的Web页面浏览请求的单元;
用于获取需要发送给客户端的若干页面的单元;
用于扫描所述若干页面代码以定位插入标签的指定位置,并在该指定位置嵌入标签代码的单元;
用于向客户端发送嵌入标签代码的页面,以指示客户端根据该标签将相应的访问信息发送给日志文件服务器的单元。
一种网站系统,其特征在于,包括:
客户端,用于向Web服务器发送Web页面浏览请求、接收Web服务器发送的嵌入标签的页面,并根据所述标签向日志文件服务器发送相应的访问信息;
Web服务器,用于根据客户端的请求获取需要发送给该客户端的若干页面,扫描所述若干页面的代码以定位到插入标签的指定位置并在该指定位置嵌入标签代码,以及将嵌入标签代码的页面发送给所述客户端。
日志文件服务器,用于根据客户端发送的访问信息生成相应的访问日志。
本发明有益效果如下:
本发明通过Web服务器在发送Web页面前先扫描该页面的代码以确定嵌入标签的指定位置,并在所述位置添加标签代码。这样,既保留了通过标签生成访问日志的优点,又防止了部分Web页面在嵌入标签时被遗漏,从而确保了日志文件数据分析结果的准确性;同时,对于静态页面,不再需要手工插入标签,对于动态页面不再需要手工修改程序代码来调用公共模板,从而大幅度地降低了工作量。
附图说明
图1为采用Web服务器直接生成日志文件的系统体系结构图;
图2A为本发明实施例中网站系统体系结构图;
图2B为本发明实施例中Web服务器结构图;
图3为本发明实施例中Web服务器在Web页面中嵌入标签的流程图。
具体实施方式
本发明通过Web服务器在向客户端发送Web页面前先扫描所述页面的代码以确定插入标签Tag的指定位置,并在该位置嵌入标签代码,以减少工作量和避免页面遗漏标签。
参阅图2A所示,本发明实施例中的网站系统包括客户端20、Web服务器21和日志文件服务器22。所述客户端20用于向Web服务器21发送Web页面浏览请求、接收Web服务器21发送的嵌入Tag的页面,并根据所述Tag向日志文件服务器22发送相应的访问信息;所述Web服务器21用于根据客户端20的请求获取需要发送给客户端20的页面,扫描所述页面的代码以定位到插入Tag的指定位置并在该指定位置嵌入标签代码,以及将嵌入Tag的页面发送给所述客户端20;所述日志文件服务器用于根据客户端发送的访问信息生成相应的访问日志。
参阅图2B所示,所述Web服务器21包括接收单元210、选取单元211、处理单元212和发送单元213。所述接收单元210用于接收客户端发送的Web页面浏览请求;所述选取单元211用于根据所述Web页面浏览请求选取相应的静态页面或动态页面;所述处理单元212用于扫描所述选取的静态页面或动态页面的代码以确定嵌入Tag的指定位置,并在该位置添加标签代码;所述发送单元213用于将嵌入Tag的静态页面或动态页面发送给客户端20,所述标签代码由网站工程师预先定义并存储在Web服务器21上,并根据实际需要定期进行更新。
Web页面中插入Tag可以根据实际需要来指定,如页面代码中<body>部分的前面或后面(通过扫描代理中的“<body>”进行定位),或者页面中的其他位置。
参阅图3所示,Web服务器21在Web页面中嵌入Tag的详细流程如下:
步骤300:用户通过客户端20向Web服务器21发送Web页面浏览请求。
步骤301:Web服务器21根据所述请求在本地选取相应的静态页面或在数据库中选取相关数据生成相应的动态页面。
步骤302:Web服务器21扫描所述静态页面或动态页面的页面代码,确定该页面代码中<body>部分的位置,并将标签代码嵌入所述<body>部分的前面或后面。
步骤303:Web服务器21将含有Tag的静态页面或动态页面发送给客户端20。
客户端20接收到Web服务器21发送的静态页面或动态页面后,通过Web浏览器将所述页面呈现给用户,并根据该页面中嵌入的Tag将所述用户的访问信息发送给日志文件服务器22,由日志文件服务器22根据所述访问信息生成相应的日志文件并统一进行数据分析。
例如:一个Web页面的代码如下:
<!DOCTYPEHTMLPUBLIC″-//W3C/DTD HTML4.01//EN″″http://www.w3.org/TR/htm14/strict.dtd″>
<html><head><meta http-equiv=″Content-Type″content=″text/html″;charset=gb2312″><title>Alibaba</title>
</head>
<body>
Alibaba Alibaba Alibaba Alibaba Alibaba Alibaba
</body></html>
Web服务器21扫描到该页面的代码中的<Body>部分后,将Tag代码嵌入到<Body>部分的后面,嵌入Tag代码后Web页面的代码如下:
<!DOCTYPE HTMLPUBLIC″-//W3C//DTD HTML4.01//EN″″http://www.w3.org/TR/html4/strict.dtd″>
<html><head><meta http-equiv=″Content-Type″content=″text/html;charset=gb2312″<title>Alibaba</title>
</head>
<body><script language=″JavaScript″type=″text/javascript″>
<!-
var r=Math.random();
document.write(″img alt=\″\″width=\″1\″height=\″1\″style=\″1\″height=\″1\″style=\″display:none\″″);
document.write(″src=\″http://dmtracking.alibaba.com/b.jpg?cD0x.JnU9ey93d3cuYWxpYmFiYS5jb20vfSZtPXtHRVR9JnM9ezIwMH0mcj17LX0mYT17LX0mYj17LX0mYz17LX0=&rand=″+r+″\″>″);
->
</script>
Alibaba Alibaba Alibaba Alibaba Alibaba Alibaba
</body><html>
这样,所有由Web服务器21发送的静态页面或动态页面都会被嵌入Tag而不会被遗漏,其相应的访问信息也会由客户端20发送至日志文件服务器22。
通过Web服务器21在发送Web页面时在页面的指定位置添加标签代码,既保留了通过标签生成访问日志的优点,又防止了部分Web页面在嵌入标签时被遗漏,从而确保了日志文件数据分析结果的准确性;同时,对于静态页面,不再需要手工插入标签,对于动态页面不再需要手工修改程序代码来调用公共模板,从而大幅度地降低了工作量。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (7)
1.一种在Web页面中添加标签的方法,其特征在于,包括:
Web服务器根据客户端的请求获取需要发送给该客户端的若干页面;
所述Web服务器扫描所述若干页面的代码以定位到插入标签的指定位置,并在该指定位置嵌入标签代码;
所述Web服务器将嵌入标签代码的页面发送给所述客户端;
日志文件服务器接收所述客户端根据该标签发送的访问信息。
2.如权利要求1所述的方法,其特征在于,所述Web服务器获取的页面包括静态页面和动态页面。
3.如权利要求3所述的方法,其特征在于,所述日志文件服务器根据所述访问信息生成相应的访问日志。
4.一种Web服务器,其特征在于,包括:
用于接收客户端发送的Web页面浏览请求的单元;
用于获取需要发送给客户端的若干页面的单元;
用于扫描所述若干页面的代码以定位插入标签的指定位置,并在该指定位置嵌入标签代码的单元;
用于向客户端发送嵌入标签代码的页面,以指示客户端根据该标签将相应的访问信息发送给日志文件服务器的单元。
5.如权利要求4所述的Web服务器,其特征在于,所述Web服务器获取的页面包括静态页面和动态页面。
6.一种网站系统,其特征在于,包括:
客户端,用于向Web服务器发送Web页面浏览请求、接收Web服务器发送的嵌入标签的页面,并根据所述标签向日志文件服务器发送相应的访问信息;
Web服务器,用于根据客户端的请求获取需要发送给该客户端的若干页面,扫描所述若干页面的代码以定位到插入标签的指定位置并在该指定位置嵌 入标签代码,以及将嵌入标签代码的页面发送给所述客户端。
7.如权利要求6所述的网站系统,其特征在于,还包括:
日志文件服务器,用于根据客户端发送的访问信息生成相应的访问日志。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006101272136A CN101145936B (zh) | 2006-09-12 | 2006-09-12 | 一种在Web页面中添加标签的方法及其系统 |
HK08107741.9A HK1114486A1 (en) | 2006-09-12 | 2008-07-14 | A method for adding tags to web pages and system thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006101272136A CN101145936B (zh) | 2006-09-12 | 2006-09-12 | 一种在Web页面中添加标签的方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101145936A CN101145936A (zh) | 2008-03-19 |
CN101145936B true CN101145936B (zh) | 2012-04-18 |
Family
ID=39208250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006101272136A Active CN101145936B (zh) | 2006-09-12 | 2006-09-12 | 一种在Web页面中添加标签的方法及其系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN101145936B (zh) |
HK (1) | HK1114486A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103684823A (zh) * | 2012-09-12 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 网络日志记录方法、网络访问路径确定方法及相关装置 |
CN102999360A (zh) * | 2012-11-23 | 2013-03-27 | 奥维通信股份有限公司 | 基于嵌入式web-omt页面动态时钟的实现方法 |
CN105337930B (zh) * | 2014-06-30 | 2019-02-19 | 北京新媒传信科技有限公司 | 一种对数据进行处理的方法及装置 |
CN105119955B (zh) * | 2015-07-09 | 2018-10-09 | 中国科学院计算技术研究所 | 一种分布式文件系统中读目录多页支持的方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1026608A2 (en) * | 1999-01-28 | 2000-08-09 | Lucent Technologies Inc. | Method and apparatus for logging web user activity using client-side support |
CN1519722A (zh) * | 2003-01-20 | 2004-08-11 | 鼎新电脑股份有限公司 | Java网页事件处理系统及其方法 |
CN1744498A (zh) * | 2004-08-31 | 2006-03-08 | 华为技术有限公司 | 一种网络服务器以及网络服务器与浏览器的数据交互方法 |
-
2006
- 2006-09-12 CN CN2006101272136A patent/CN101145936B/zh active Active
-
2008
- 2008-07-14 HK HK08107741.9A patent/HK1114486A1/xx not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1026608A2 (en) * | 1999-01-28 | 2000-08-09 | Lucent Technologies Inc. | Method and apparatus for logging web user activity using client-side support |
CN1519722A (zh) * | 2003-01-20 | 2004-08-11 | 鼎新电脑股份有限公司 | Java网页事件处理系统及其方法 |
CN1744498A (zh) * | 2004-08-31 | 2006-03-08 | 华为技术有限公司 | 一种网络服务器以及网络服务器与浏览器的数据交互方法 |
Also Published As
Publication number | Publication date |
---|---|
HK1114486A1 (en) | 2008-10-31 |
CN101145936A (zh) | 2008-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101211364B (zh) | 用于万维网页中暴露的资源的公共书签的方法和系统 | |
CN101427229B (zh) | 用于修改向计算机系统的终端用户显示的信息表示的技术 | |
US8065620B2 (en) | System and method for defining and presenting a composite web page | |
CN101452453B (zh) | 一种输入法网址导航的方法和一种输入法系统 | |
US9767082B2 (en) | Method and system of retrieving ajax web page content | |
US20040254935A1 (en) | Method and apparatus for automatic consolidation of personalized dynamic data | |
US20020143523A1 (en) | System and method for providing a file in multiple languages | |
US20010039540A1 (en) | Method and structure for dynamic conversion of data | |
US9311303B2 (en) | Interpreted language translation system and method | |
US20100199169A1 (en) | Web browser extension for simplified utilization of web services | |
US9177263B2 (en) | Identifying and tracking grouped content in e-mail campaigns | |
CN101146040B (zh) | 分析网站流量的方法和装置 | |
US8195762B2 (en) | Locating a portion of data on a computer network | |
US7069292B2 (en) | Automatic display method and apparatus for update information, and medium storing program for the method | |
US7623741B2 (en) | System and method for transferring scanned imaging data to a personal imaging repository | |
WO2002065359A1 (en) | Electronic information management system | |
CN101145936B (zh) | 一种在Web页面中添加标签的方法及其系统 | |
US20130019152A1 (en) | Method and Apparatus for Tracking Exit Destinations of Web Page | |
WO2009058622A2 (en) | Federated search data normalization for rich presentation | |
US7581167B2 (en) | Method and system for automated simulation of dynamic URL-based Web application | |
US20020133517A1 (en) | Method and apparatus for processing of internet forms | |
CN101923463A (zh) | 信息处理装置和方法 | |
CN101772196A (zh) | 处理移动终端发送的信息的方法和系统以及代理服务器 | |
US20020029257A1 (en) | Method of aiding portal site making and method of providing services | |
CN101158974A (zh) | 一种资源引用的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1114486 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1114486 Country of ref document: HK |