CN103488617A - 一种数据截取的方法和装置 - Google Patents
一种数据截取的方法和装置 Download PDFInfo
- Publication number
- CN103488617A CN103488617A CN201210192127.9A CN201210192127A CN103488617A CN 103488617 A CN103488617 A CN 103488617A CN 201210192127 A CN201210192127 A CN 201210192127A CN 103488617 A CN103488617 A CN 103488617A
- Authority
- CN
- China
- Prior art keywords
- byte
- intercept point
- character string
- character
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 239000000284 extract Substances 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 238000003491 array Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种数据截取的方法和装置,能够达到对截取的数据解码后不会出现乱码,提高解码质量和用户体验的技术效果。本发明实施例提供的一种数据截取的方法包括:将需要截取的字符串转换为预定编码格式;判断转换后的字符串的长度是否大于截取长度,若否,提取所有转换后的字符串作为截取到的数据;若是,执行如下处理:将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前;若是,从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据;若否,利用所述截取点字节的前一字节更新截取点字节,直至判断出截取点字节位于后一个字符的开头字节之前。
Description
技术领域
本发明涉及信息处理技术领域,特别涉及一种数据截取的方法和装置。
背景技术
在数据传输和存储的过程中,由于容量的限制等因素,在很多场景下,都需要对原数据进行截取处理。例如,在传输协议中,头信息一般会固定长度。如果头信息超过了这个固定长度,就需要对这个头信息进行截取。现有方案通常采用直接从原数据中截取固定长度数据的方式进行数据截取。
然而,现有的截取方案至少存在如下问题:
当信息中包含了采用统一码(UNICODE)编码的字符时,由于一个字符所对应的UNICODE编码字节个数不确定,则有极大的可能所截取的最后一个字节是代表一个字符的若干字节中的中间的某个字节,从而导致对截取到的数据解码时最后一个字符的位置出现乱码,降低了解码质量和用户体验。
发明内容
本发明提供的一种数据截取的方法和装置,以解决现有数据截取方案导致解码后最后一个字符为乱码,解码质量和用户体验较低的问题。
为达到上述目的,本发明实施例采用了如下技术方案:
本发明实施例提供的一种数据截取的方法包括:
将需要截取的字符串转换为预定编码格式;
判断转换后的字符串的长度是否大于截取长度,若否,提取所有转换后的字符串作为截取到的数据;若是,执行如下处理:
将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前;
若是,从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据;若否,利用所述截取点字节的前一字节更新截取点字节,直至判断出截取点字节位于后一个字符的开头字节之前。
本发明实施例提供的一种数据截取的装置包括:
格式转换单元,用于将需要截取的字符串转换为预定编码格式;
长度判断单元,用于判断转换后的字符串的长度是否大于截取长度;
第一截取单元,用于在长度判断单元判断出转换后的字符串的长度不大于截取长度时,提取所有转换后的字符串作为截取到的数据;
第二截取单元,用于在长度判断单元判断出转换后的字符串的长度大于截取长度时,将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前,若是,从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据;若否,利用所述截取点字节的前一字节更新截取点字节,直至判断出截取点字节位于后一个字符的开头字节之前。
本发明实施例的有益效果是:
本发明实施例通过在预定编码格式下,判断截取点字节是否位于后一字符的开头字节之前,并在截取长度内从位于后一字符开头字节之前的截取点字节执行数据的截取,确保了截取点不会出现在一个字符的多个字节的中间,能够达到对截取的数据解码后不会出现乱码,提高解码质量和用户体验的技术效果。
附图说明
图1为本发明实施例一提供的一种数据截取的方法流程图;
图2为本发明实施例二提供的判断截取点字节位置的方法流程图;
图3为本发明实施例三提供的一种数据截取的装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明的技术构思主要在于每个字符都有对应的一个UNICODE表示,根据UNICODE编码和预定编码(如UTF-8编码)的对应关系,可以找出一个UNICODE字符的开头,如找出一个汉字的开头,该字符的开头之前,就是前面字符的结尾。这样的话,在截取时,通过只截取到前面字符结尾部分,即当前字符开头的前面,就不会出现截取到字符的中间字节导致对截取数据无法正常解码的问题,从而对字符的截取更精确,解码质量和用户体验更好。
本发明实施例一提供的一种数据截取的方法,参见图1,包括:
11:将需要截取的字符串转换为预定编码格式。
12:判断转换后的字符串的长度是否大于截取长度,若否,执行步骤13,若是,执行步骤14。
13:提取所有转换后的字符串作为截取到的数据,截取操作结束。
14:将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前,若是,执行步骤15,若否,执行步骤16。其中,在“判断所述截取点字节是否位于后一个字符的开头字节之前”的步骤中,将截取点字节所归属的字符作为当前字符时,后一个字符是指在字符串中紧邻该当前字符且在当前字符之后的下一个字符。后一个字符可以包含一个或多个字节,当后一个字符包含一个字节(如字节1)时,上述开头字节即为这个字节(即字节1),当后一个字符包含多个字节(如字节1至字节3)时,上述开头字节即为这多个字节中的第一个字节(字节1)。
15:从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据,截取操作结束。
16:利用所述截取点字节的前一字节更新截取点字节,对更新后的截取点字节重复上述步骤14中的判断操作,直至判断出截取点字节位于后一个字符的开头字节之前,截取操作才结束。其中,在“利用所述截取点字节的前一字节更新截取点字节”的步骤中,截取点字节的前一字节是指在字符串中紧邻截取点字节且在截取点字节之前的上一个字节,更新的方式可以为将当前截取点字节的前一字节作为更新后所使用的截取点字节。
注:对于本实施例中所描述的“前”“后”方向,一种示例的方式为将字符串的起始字节所在的位置视为前方,将字符串的结尾字节所在的位置视为后方。
上述预定编码格式可以为8比特统一码转换格式(8-bit UnicodeTransformation Format,UTF-8),UTF-8是一种针对统一码(Unicode)的可变长度字符编码,其用1到6个字节编码UNICODE字符,UTF-8的转换表参见下述表1,其中,符号X表示该比特位的数值既可能为0也可能为1。
表1
由上表可知,在每一行上,UNICODE编码在左框数值范围内的字符(如汉字),采用右框中的方式进行编码。1个字符可以由1至6个字节进行编码。
本实施例利用的UTF-8的编码方式的特点,通过判断截取点字节是否位于后一字符的开头字节之前,并在截取长度内从位于后一字符开头字节之前的截取点字节执行数据的截取的技术手段,实现对字符串的精确截取,达到对截取的数据解码后不会出现乱码,提高解码质量和用户体验的技术效果。
下面对本发明实施例二提供的数据截取的方法进行说明。本实施例主要以对汉字字符串进行按字节精确截取的场景为例进行说明。
21:判断需要截取的字符串是否为空,若为空,返回空字符串,若不为空,将需要截取的字符串转换为预定编码格式。
作为可选步骤,在本步骤中,首先对截取操作是否可执行进行判断,当字符串为空时,该截取操作无法执行,则快速进行响应,直接返回空字符串的信息,不再进行后续的转换等操作。只有在字符串不为空,截取操作可执行时,才继续进行下述的步骤22,从而使截取操作的反馈更加及时,效率更高。
在实现时,可以设置content参数和length参数,content表示需要截取的原始字符串,length表示截取长度,即需要从原始字符串中截取的字节长度。
22:将需要截取的字符串转换为预定编码格式。
本实施例采用的预定编码格式为UTF-8,并通过对UTF-8的编码格式进行分析,得出如下两点编码规律:
1)对符合UTF-8编码的字节,若该字节的最高位为“0”,则该字节为一个字符的开头,参见上述表1,其中第一行UTF-8编码字节的最高位为0;
2)若该字节的最高位不为“0”,则判断该字节的次高位是否为“1”,若是,则当前字节为一个汉字的开头字节,参见上述表1,其中第二至六行中,UTF-8高位编码字节的最高位和次高位均为1。
不满足上述两点条件的UTF-8编码字节则不是一个字符的开头字节。
本实施例采用的上述编码规律,不但能够准确区分出一个字符的开头字节,而且简单易行,能够加快数据截取的速度。
在实现时,可以设置buffer参数,根据UNICODE和UTF8对应关系,将content对应的原始字符串转换为UTF-8对应的字节数组,buffer表示转换后的字节数组。若content对应的原始字符串即为UTF-8下的字节数组,则可以省略步骤22中的转换操作。
23:判断转换后的字符串的长度是否大于截取长度,若否,执行步骤24,若是,执行步骤25。
在实现时,设置pos参数,用于表示所使用的截取点字节的位置,取buffer的长度(要截取的原始字符串的总长度)和length(所需截取的字节长度)的较小的值作为pos参数,判断buffer和length的大小,buffer大于length则执行步骤25,否则执行步骤24。
24:提取所有转换后的字符串作为截取到的数据,截取操作结束。
这时,获得buffer字节数组从0开始,长pos个字节的字符串并返回,截取操作执行完毕。
25:将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前,若是,从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据;若否,利用所述截取点字节的前一字节更新截取点字节,直至判断出截取点字节位于后一个字符的开头字节之前。
本实施例基于上述两点编码规律,参见图2,利用如下方式,判断所述截取点字节是否位于后一个字符的开头字节之前:
S1:判断截取点字节的后一字节的最高位是否为0,若是,执行步骤S2,若否,执行步骤S3;
S2:确认该截取点字节位于后一个字符的开头字节之前,操作结束。
这时,上述“从字符串的起始字节至所述截取点字节对转换后的字符串进行截取”还可以表述为:在执行数据截取时,从字符串的起始字节截取到最高位为0的上述截取点字节的后一字节的前面。
S3:判断截取点字节的后一字节的次高位是否为1,若该次高位为1,则确认该截取点字节位于后一个字符的开头字节之前,操作结束,这时,上述“从字符串的起始字节至所述截取点字节对转换后的字符串进行截取”还可以表述为:在执行数据截取时,从字符串的起始字节截取到最高位不为0但次高位为1的上述截取点字节的后一字节的前面;若该次高位不为1,则执行步骤S4。
S4:确认该截取点字节不位于后一个字符的开头字节之前,操作结束。在步骤S4执行之后,本实施例更新截取点字节,利用更新后的截取点字节重复上述步骤S1至S4,在确认截取点字节位于后一个字符的开头字节之前时,再执行对字符串的截取。
示例性的,步骤25中的操作可以表述如下:
起始时,截取长度所对应的字节为buffer的第pos个字节,将第pos个字节作为截取点字节,该截取点字节的后一字节为第pos+1个字节,则判断buffer的第pos+1个字节的最高位是否为0;
若是,则该截取点字节位于后一个字符的开头字节之前,获得buffer字节数组从0开始,长pos个字节的字符串并返回,即在执行数据截取时,从字符串的起始字节截取到最高位为0的上述截取点字节的后一字节的前面;
若否,则判断buffer的第pos+1个字节的次高位是否为0,若次高位为0,则pos自减1走循环,该循环即在pos的值更新(减1)后,重新判断截取点字节第pos个字节是否位于后一个字符的开头字节之前(执行上述步骤S1至S4),若否,则重复更新pos的操作直至判断出第pos个字节位于后一个字符的开头字节之前,再结束循环;若次高位不为0,则该截取点字节位于后一个字符的开头字节之前,获得buffer字节数组从0开始,长pos个字节的字符串并返回,即在执行数据截取时,从字符串的起始字节截取到最高位不为0但次高位为1的上述截取点字节的后一字节的前面。
由上所述,步骤21至25可以利用上述参数示例性描述如下:
1:设置content参数和length参数,content表示需要截取的原始字符串,length表示截取长度;
2:判断content是否为空,是则返回空字符串,否则执行步骤3;
3:根据UNICODE和UTF8对应关系,获取content的字符串在UTF-8下对应的字节数组为buffer;
4:取buffer的长度(要截取字节数组的总长度)和length(规定要截取的字节长度)的较小的值做为pos;
5:判断buffer的长度和length的大小,buffer大于length则执行步骤6,否则执行步骤8;
6:判断buffer的第pos+1个字节的最高位是否为0,是则执行步骤8,否则执行步骤7;
7:循环判断buffer的第pos+1个字节的第二高位是否为0,是则pos自减1走循环,返回至步骤6,否则执行步骤8;
8:获得buffer字节数组从0开始,长pos个字节的字符串并返回,截取操作执行完毕。
执行以上的步骤1至8,能够保证对字符串的截取做到最接近需要的长度,即在保证解码后不出现乱码的情况下,获取截取长度允许下的最大数据量,实现了精确地数据截取。
在采用上述方案对数据执行截取之后,若需要数据传输,可以将截取的字符串放入文件头中,传输至对端。对端接收到文件后,在解码过程中,需要按照UTF-8编码格式进行解码。
下面以一个具体的示例将现有方案与本实施例的方案进行对比,来验证本实施例的有益效果。
需要截取的字符串为带汉字的字符串A:“阁下莫非就是当年”
将字符串A转换为对应的UTF-8字节数组为:
11101001 10011000 10000001 11100100 10111000 10001011 11101000
10001110 10101011 11101001 10011101 10011110 11100101 10110000
10110001 11100110 10011000 10101111 11100101 10111101 10010011
11100101 10111001 10110100
本示例中仅允许截取10个字节,即截取长度length=10
现有方案截取后得到:
11101001 10011000 10000001 11100100 10111000 10001011 1110100010001110 10101011 11101001(共10个字节)
解码后对应的汉字:阁下莫?(结尾有乱码)
采用本实施例的方案截取后得到:
11101001 10011000 10000001 11100100 10111000 10001011 1110100010001110 10101011(共9个字节)
解码后对应的汉字:阁下莫
对于上述示例,本实施例截取操作包括:
1:设置content参数为“阁下莫非就是当年”,length参数为要截取的字节长度,数值为“10”。
2:参数content不为空,执行步骤3
3:获取content对应字符串UTF8对应的字节数组buffer为:
11101001 10011000 10000001 11100100 10111000 10001011 11101000
10001110 10101011 11101001 10011101 10011110 11100101 10110000
10110001 11100110 10011000 10101111 11100101 10111101 10010011
11100101 10111001 10110100
4:取buffer的长度(24)和length(10)的较小的值做为pos,则pos为10;
5:判断buffer的长度(24)和length值(10)的大小,buffer长度大于length值,执行步骤6;
6:判断buffer的第pos+1(11)个字节(10011101)的最高位是否为0。不为0,执行步骤7;
7:循环判断buffer的第pos+1(11)个字节(10011101)的第二高位(次高位)是否为0。是为0,则pos自减1走循环,执行步骤6,继续判断buffer的第pos+1(10)个字节(11101001)的第二高位是否为0;不为0,执行步骤8。
8:获得buffer字节数组从0开始,长pos个字节的字符串并返回,得到如下字节数组:
11101001 10011000 10000001 11100100 10111000 10001011 1110100010001110 10101011
解码后对应的字符串是:阁下莫
由上所述,本方案能够在保证解码后不出现乱码的情况下,获取截取长度允许下的最大数据量,实现了精确地数据截取,并且本方案只需外部输入截取长度即可自动实现数据截取,操作简单,计算量小。
本发明实施例三提供的一种数据截取的装置,参见图3,所述装置包括:
格式转换单元31,用于将需要截取的字符串转换为预定编码格式;
长度判断单元32,用于判断转换后的字符串的长度是否大于截取长度;
第一截取单元33,用于在长度判断单元32判断出转换后的字符串的长度不大于截取长度时,提取所有转换后的字符串作为截取到的数据;
第二截取单元34,用于在长度判断单元32判断出转换后的字符串的长度大于截取长度时,将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前,若是,从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据;若否,利用所述截取点字节的前一字节更新截取点字节,直至判断出截取点字节位于后一个字符的开头字节之前。
进一步的,所述格式转换单元31,用于将需要截取的字符串转换为8比特统一码转换格式(UTF-8)。
所述第二截取单元34利用如下方式,根据预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前:判断截取点字节的后一字节的最高位是否为0,若是,则确认该截取点字节位于后一个字符的开头字节之前,若否,判断截取点字节的后一字节的次高位是否为1,若该次高位为1,则确认该截取点字节位于后一个字符的开头字节之前,若该次高位不为1,确认该截取点字节不位于后一个字符的开头字节之前。即本实施例中对符合UTF-8编码的字节,若该字节的最高位为“0”,则该字节为一个字符的开头;若该字节的最高位不为“0”,则判断该字节的次高位是否为“1”,若是,则当前字节为一个汉字的开头字节,否则,对不满足上述两点条件的UTF-8编码字节则确认其不是一个字符的开头字节。本实施例采用这种判决方式,不但能够准确区分出一个字符的开头字节,而且简单易行,能够加快数据截取的速度。
并且,上述装置还包括解码单元,用于对所述截取到的数据按照UTF-8编码格式进行解码。当数据截取操作和数据解码操作都在本地执行时,解码单元和上述格式转换单元、长度判断单元、第一截取单元和第二截取单元可以集成在一台设备中实现;可以理解,对于数据截取操作和数据解码操作在异地执行的场景,也可以将该解码单元单独分离出来,在数据解码端的设备上实现。
进一步的,所述装置还包括空字符串处理单元,用于判断需要截取的字符串是否为空,若为空,返回空字符串,若不为空,调用所述格式转换单元将需要截取的字符串转换为预定编码格式。
本发明装置实施例中各单元的具体工作方式可以参见本发明方法实施例中的相关内容。
由上所述,本发明实施例通过在预定编码格式下,判断截取点字节是否位于后一字符的开头字节之前,并在截取长度内从位于后一字符开头字节之前的截取点字节执行数据的截取,确保了截取点不会出现在一个字符的多个字节的中间,能够达到对截取的数据解码后不会出现乱码,提高解码质量和用户体验的技术效果。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种数据截取的方法,其特征在于,所述方法包括:
将需要截取的字符串转换为预定编码格式;
判断转换后的字符串的长度是否大于截取长度,若否,提取所有转换后的字符串作为截取到的数据;若是,执行如下处理:
将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前;
若是,从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据;若否,利用所述截取点字节的前一字节更新截取点字节,直至判断出截取点字节位于后一个字符的开头字节之前。
2.根据权利要求1所述的方法,其特征在于,
所述预定编码格式为8比特统一码转换格式UTF-8。
3.根据权利要求2所述的方法,其特征在于,利用如下方式,根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前:
判断截取点字节的后一字节的最高位是否为0,若是,则确认该截取点字节位于后一个字符的开头字节之前,若否,判断截取点字节的后一字节的次高位是否为1,若该次高位为1,则确认该截取点字节位于后一个字符的开头字节之前,若该次高位不为1,确认该截取点字节不位于后一个字符的开头字节之前。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
对所述截取到的数据按照UTF-8编码格式进行解码。
5.根据权利要求1至3任一项所述的方法,其特征在于,在所述将需要截取的字符串转换为预定编码格式之前,所述方法还包括:
判断需要截取的字符串是否为空,若为空,返回空字符串,若不为空,将需要截取的字符串转换为预定编码格式。
6.一种数据截取的装置,其特征在于,所述装置包括:
格式转换单元,用于将需要截取的字符串转换为预定编码格式;
长度判断单元,用于判断转换后的字符串的长度是否大于截取长度;
第一截取单元,用于在长度判断单元判断出转换后的字符串的长度不大于截取长度时,提取所有转换后的字符串作为截取到的数据;
第二截取单元,用于在长度判断单元判断出转换后的字符串的长度大于截取长度时,将截取长度所对应的字节作为截取点字节,并根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前,若是,从字符串的起始字节至所述截取点字节对转换后的字符串进行截取,作为截取到的数据;若否,利用所述截取点字节的前一字节更新截取点字节,直至判断出截取点字节位于后一个字符的开头字节之前。
7.根据权利要求6所述的装置,其特征在于,
所述格式转换单元,用于将需要截取的字符串转换为8比特统一码转换格式UTF-8。
8.根据权利要求7所述的装置,其特征在于,所述第二截取单元利用如下方式,根据所述预定编码格式,判断所述截取点字节是否位于后一个字符的开头字节之前:
判断截取点字节的后一字节的最高位是否为0,若是,则确认该截取点字节位于后一个字符的开头字节之前,若否,判断截取点字节的后一字节的次高位是否为1,若该次高位为1,则确认该截取点字节位于后一个字符的开头字节之前,若该次高位不为1,确认该截取点字节不位于后一个字符的开头字节之前。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述装置还包括解码单元,用于对所述截取到的数据按照UTF-8编码格式进行解码。
10.根据权利要求6至8任一项所述的装置,其特征在于,所述装置还包括空字符串处理单元,用于判断需要截取的字符串是否为空,若为空,返回空字符串,若不为空,调用所述格式转换单元将需要截取的字符串转换为预定编码格式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210192127.9A CN103488617A (zh) | 2012-06-11 | 2012-06-11 | 一种数据截取的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210192127.9A CN103488617A (zh) | 2012-06-11 | 2012-06-11 | 一种数据截取的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103488617A true CN103488617A (zh) | 2014-01-01 |
Family
ID=49828860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210192127.9A Pending CN103488617A (zh) | 2012-06-11 | 2012-06-11 | 一种数据截取的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103488617A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105897875A (zh) * | 2016-04-01 | 2016-08-24 | 乐视控股(北京)有限公司 | 文本截断、上传方法和装置 |
CN109213102A (zh) * | 2018-09-11 | 2019-01-15 | 深圳众城卓越科技有限公司 | 多命令监测方法、装置、计算机设备及存储介质 |
CN112307010A (zh) * | 2019-07-29 | 2021-02-02 | 创新先进技术有限公司 | 一种数据存储方法、装置及设备 |
CN112307011A (zh) * | 2019-07-29 | 2021-02-02 | 创新先进技术有限公司 | 一种数据存储方法、装置及设备 |
CN113672778A (zh) * | 2021-08-04 | 2021-11-19 | 苏州优炫智能科技有限公司 | 一种工业园区数据的管理方法及管理系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1444378A (zh) * | 2002-03-11 | 2003-09-24 | 联想(北京)有限公司 | 超长短消息发送的方法 |
US20060284745A1 (en) * | 2005-06-21 | 2006-12-21 | International Characters, Inc. | Method and apparatus for processing character streams |
CN101655836A (zh) * | 2009-09-03 | 2010-02-24 | 厦门敏讯信息技术股份有限公司 | 嵌入式终端及其utf-8、gb2312编码转换方法 |
-
2012
- 2012-06-11 CN CN201210192127.9A patent/CN103488617A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1444378A (zh) * | 2002-03-11 | 2003-09-24 | 联想(北京)有限公司 | 超长短消息发送的方法 |
US20060284745A1 (en) * | 2005-06-21 | 2006-12-21 | International Characters, Inc. | Method and apparatus for processing character streams |
CN101655836A (zh) * | 2009-09-03 | 2010-02-24 | 厦门敏讯信息技术股份有限公司 | 嵌入式终端及其utf-8、gb2312编码转换方法 |
Non-Patent Citations (4)
Title |
---|
ENCHANTER: "《字符集》", 《HTTP://BLOG.SINA.COM.CN/S/BLOG_46618DF40100AZHP.HTML》, 20 October 2008 (2008-10-20) * |
佚名: "《PHP截取utf-8字符串的具体方法介绍》", 《HTTP://DEVELOPER.51CTO.COM/ART/200911/165737.HTM》, 30 November 2009 (2009-11-30) * |
田海立: "《Unicode编码及其实现:UTF-16、UTF-8》", 《HTTP://BLOG.CSDN.NET/THL789/ARTICLE/DETAILS/7506133》, 25 April 2012 (2012-04-25) * |
陶宏: "《用PHP实现UTF-8和Unicode编码转换的技术》", 《南通纺织职业技术学院学报(综合版)》, vol. 8, no. 3, 30 September 2008 (2008-09-30) * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105897875A (zh) * | 2016-04-01 | 2016-08-24 | 乐视控股(北京)有限公司 | 文本截断、上传方法和装置 |
CN109213102A (zh) * | 2018-09-11 | 2019-01-15 | 深圳众城卓越科技有限公司 | 多命令监测方法、装置、计算机设备及存储介质 |
CN109213102B (zh) * | 2018-09-11 | 2022-01-18 | 深圳众城卓越科技有限公司 | 多命令监测方法、装置、计算机设备及存储介质 |
CN112307010A (zh) * | 2019-07-29 | 2021-02-02 | 创新先进技术有限公司 | 一种数据存储方法、装置及设备 |
CN112307011A (zh) * | 2019-07-29 | 2021-02-02 | 创新先进技术有限公司 | 一种数据存储方法、装置及设备 |
CN112307010B (zh) * | 2019-07-29 | 2024-04-16 | 创新先进技术有限公司 | 一种数据存储方法、装置及设备 |
CN113672778A (zh) * | 2021-08-04 | 2021-11-19 | 苏州优炫智能科技有限公司 | 一种工业园区数据的管理方法及管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103488617A (zh) | 一种数据截取的方法和装置 | |
KR101603751B1 (ko) | 명령어 병렬 처리 컴퓨터를 위한 명령어 압축 장치 및 방법 | |
CN101510819B (zh) | 速率匹配方法及装置 | |
WO2022088876A1 (zh) | 通信数据的处理方法、装置、设备及存储介质 | |
CN110942763A (zh) | 语音识别方法及装置 | |
JP2022518636A (ja) | データ処理方法、装置、設備、システム、記憶媒体及びプログラム製品 | |
CN103036641B (zh) | 数据交换方法、系统及反序列化方法 | |
CN102970596A (zh) | 一种实现机顶盒多语言字体显示的方法、系统及机顶盒 | |
CN111147462A (zh) | 一种基于FPGA的step协议解析方法、系统、终端及存储介质 | |
CN105897875A (zh) | 文本截断、上传方法和装置 | |
US20150055585A1 (en) | Method and apparatus compatible with multi-version for storing wireless resource | |
CN106101250A (zh) | 应用功能的定制方法及装置 | |
JP2012085274A (ja) | テキストをマトリクスコードシンボルに符号化するコンピュータ実行方法、マトリクスコードシンボルを復号化するコンピュータ実行方法、テキストをマトリクスコードシンボルに符号化するためのエンコーダ、およびマトリクスコードシンボルを復号化するためのデコーダ | |
CN105550535A (zh) | 一种基因字符序列快速编码为二进制序列的编码方法 | |
CN102880874B (zh) | 字符识别方法和字符识别器 | |
CN109379083A (zh) | 基于教育系统的base64编码转换方法及电子设备 | |
CN105095268A (zh) | 结构化数据的存取方法以及装置 | |
CN108235022A (zh) | 一种计算机视频数据处理方法 | |
CN117332374A (zh) | 一种ai芯片的计算和通信的融合方法、装置及ai芯片 | |
CN105207747A (zh) | 一种基于hid协议的数据传输方法 | |
CN105099571B (zh) | 一种音频通信方法 | |
CN109104581A (zh) | 一种无线传屏的方法、系统及接收终端 | |
CN110535963A (zh) | 一种用于信息技术的数据传输系统 | |
CN104917637A (zh) | 一种文件分享的方法及系统 | |
CN106844450A (zh) | 一种基于流计算实现快速提取号码热度的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140101 |
|
RJ01 | Rejection of invention patent application after publication |