[go: up one dir, main page]

CN101038581A - 用于评价理解文件的难度的系统和方法 - Google Patents

用于评价理解文件的难度的系统和方法 Download PDF

Info

Publication number
CN101038581A
CN101038581A CNA2007100885819A CN200710088581A CN101038581A CN 101038581 A CN101038581 A CN 101038581A CN A2007100885819 A CNA2007100885819 A CN A2007100885819A CN 200710088581 A CN200710088581 A CN 200710088581A CN 101038581 A CN101038581 A CN 101038581A
Authority
CN
China
Prior art keywords
evaluation
estimate
user
page
difficulty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100885819A
Other languages
English (en)
Other versions
CN100570596C (zh
Inventor
佐藤大介
浅川智惠子
高木启伸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101038581A publication Critical patent/CN101038581A/zh
Application granted granted Critical
Publication of CN100570596C publication Critical patent/CN100570596C/zh
Withdrawn - After Issue legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

为了高准确性地评价通过听由屏幕读取器输出的声音来理解文件内容的难度,本发明提供一种用于评价通过听由屏幕读取器输出的声音理解文件每页内容的难度的系统。该系统包括:第一函数记录部,其基于表示页面特征的特征量计算页面难度的评价值;收集部,其从用户收集用户的难度评价值和其评价值与用户的难度评价值不一致的至少一页中的每个页面的特征量;和第一更新部,其基于从用户收集到的特征量和评价值更新记录在第一函数记录部中的评价函数,以便输出与用户的评价更为一致的评价值。

Description

用于评价理解文件的难度的系统和方法
技术领域
本发明涉及一种用于评价理解文件的难度程度的系统和方法。尤其是,本发明涉及一种用于评价通过从屏幕读取器输出的声音对文件中每页内容进行理解的难度的系统。
背景技术
近年来,人们使用屏幕读取器(文本到语音读取系统)目的是视力弱的人可以通过听声音来理解文本数据。屏幕读取器将文件中的文本数据转换成音频数据,并为用户输出该音频数据。因此,用户通过听该音频数据而不用看屏幕就可以理解文件的内容。然而,即使使用屏幕读取器,也很难理解包括向量图形的文件的内容。
下面将给出关于理解向量图形的内容的技术。有一种传统的屏幕读取器以Z顺序朗读包括在页面中的显示对象(或它们的替代文本)(参见非专利文献1和2)。Z顺序是在多个显示对象被相互重叠地显示的情况下该多个显示对象的重叠顺序的排序。对于一个视力正常的人来说,就像在被指定了较低优先级的显示对象之前显示被指定了较高优先级的显示对象。通过使用这个技术,可以确定朗读显示对象的某种顺序。但是,即使当按照Z顺序朗读页面上的显示对象时,总还是不能从总体上轻易地理解该页面。
此外,还有一些已提出的技术,它们通过在文件上执行图像处理来分析文件的结构(参见专利文献1和2)。利用该技术,可以将通过使用复杂结构和例如灰度的色彩信息表示的文件转换成音频数据。然而,这些技术不能广泛应用于普通文件,因为这些技术只可以应用于具有特定的规则结构的文件。
此外,有一种技术,该技术对应于屏幕上显示对象的显示位置产生音域(参见专利文献3)。利用这个技术,对应于文字大小和字体类型可以生成具有音质的声音。而且,对应于屏幕上文字所显示的相关位置,可以在音区的该位置生成声音。然而,通过听声音而获得的位置信息的准确性要明显低于通过使用视觉而获得的位置信息的准确性。由于这个原因,有时仅仅通过使用这个技术很难理解图示的内容。此外,已经使用二维针显示作为使用非声音手段的技术(参见专利文献4)。然而,人类手指尖的分辨率非常低,以至于很难获得与视觉信息相等的信息。
【专利文献11日本专利申请公开平5-342326
【专利文献2】日本专利申请公开平6-68300
【专利文献3】日本专利申请公开平8-263260
【专利文献1】日本专利申请公开平10-232600
【非专利文献1】Jaws,http://www.freedomscientific.com/fs_products/software_jaws.asp
【非专利文献2】WindowEyes,http://www.gwmicro.com/products/
【非专利文献3】Valbo,A.B.&Johanson,R.S.The tactile sensoryinnervation of glabrous skin of the human hand.In G. Gordon(Ed.),Active Touch.2954,Pergamon Press,1978.
【非专利文献4】Shardanand,U.and Maes,P. Social informationfiltering:Algorithms for automating“word of mouth”.In Proceedings ofthe 1995ACM Conference on Human Factors in Computing Systems.
发明内容
如上所述,通常对于弱视的人来说通过使用目前技术水平的任何技术很难理解图形的内容。另一方面,当文件包括多个页面时,存在这样一种情况,即有些页面可以容易地理解。为了发现哪页面可以清楚地理解,弱视的人不得不通过使用屏幕读取器来理解每一页面。这需要大量的时间和力气。
注意,已经为HTML格式(超文本链接标示语语言)的文件建立了用于评价获得信息的难度程度的方针。该方针的一个例子是由W3C(The World Wide Web Consortium)的WAI(Web Accessibility Initiative)制成的WCAG(Web Content Accessibility Guidelines)。HTML文件包括称为标签的meta信息。然后,通过使用标签中的关系定义文件结构。如果通过使用标签定义的结构符合该方针,即使是弱视的人在许多情况下可以容易地理解其内容。反之,如果通过使用标签定义的结构不符合该方针,弱视的人在许多情况下难以理解其内容。简言之,关于HTML文件,即使是当不能通过使用屏幕读取器逐页面地朗读文件中的所有页面时,还是有可能发现具有一定准确度的难度。
然而,通过使用软件创建用于显示的一般图形经常不包括在HTML文件中所用的任何标签。这种情况下,难以应用上述方针来评价难度。而且,虽然至少以HTML所写的整个HTML文件具有统一性,但在一般图形的情况下不存在这样的统一性。这是因为一般图形是通过使用不同类型的软件而创建的。为此,很难制造一个标准,可以利用该标准以统一地评判理解通过使用不同类型的软件中的任意一种而创建的图形的内容的难度。不仅如此,由于还存在各种不同类型的屏幕读取器,因此文件创建器经常无法决定要创建哪种类型的文件。
作为相关技术,已提出的技术有用于根据用户的喜好估计用户对信息的评价(参见非专利文献4)。利用该技术,基于由多个用户(每个用户具有和某用户A类似的喜好)作出的评价,可以估计由用户A所做的评价。然而,该文献简单地指出用于估计未知评价的大概想法,而没有描述将该技术应用于弱视人的文件的特殊方法。例如,考虑到依据用户喜好的分类通常不影响理解文件的容易度。
因此,本发明的目的是提供一种可以解决上述问题的系统、方法和程序。该目的可以通过结合权利要求范围中独立权利要求的特征而获得。此外,从属权利要求进一步指定了本发明的优选的特定例子。
为了解决上述问题,本发明的实施例提供了一种系统,用于评价通过听由屏幕读取器输出的声音理解文件每一页面内容的难度。该系统包括第一函数记录部、收集部和第一更新部。该第一函数记录部记录用于基于表示页面特征的特征量来计算该页面难度的评价值的评价函数。针对其通过使用评价函数所计算的评价值与用户对难度的评价不一致的页面中至少一个页面,该收集部从用户收集由用户对于理解该页面的难度所评价的值(此后,简称为“用户对难度的评价值”)和该页面的特征量。该第一更新部基于从用户收集的该特征量和评价值更新该记录在第一函数记录部中的评价函数,以便能输出与用户的评价更为一致的评价值。此外,本实施例还提供一种通过使用该系统评价难度的方法,和一种使信息处理设备作为该系统工作的程序。
注意,对本发明的上述概要不是包括本发明所有必要特征的列举,这些特征的任何子集合并都包括在本发明中。
根据本发明,可以以高准确度评价通过听由屏幕读取器输出的声音理解文件内容的难度。
附图说明
图1示出信息处理系统10的整体配置。
图2示出服务器设备20的功能性配置。
图3示出用户终端30的功能性配置。
图4示出评价值DB 230的数据结构的示例。
图5示出由难度评价部330输出的屏幕的第一个显示示例。
图6示出由难度评价部330输出的屏幕的第二个显示示例。
图7示出由难度评价部330输出的屏幕的第三个显示示例。
图8示出一过程的流程图,其中服务器设备20收集用户对难度的评价值,并更新评价函数。
图9示出了用户终端30计算和输出评价值的过程的流程图。
图10A和10B示出了以Z顺序扫描显示对象所遵循的扫描轨迹。
图11示出了步骤S900中过程的细节。
图12示出了服务器设备20为文件创建者执行的处理的范例。
图13示出了信息处理设备500的硬件配置的范例,该设备作为服务器设备20或用户终端30作。
【附图标记】
10    信息处理系统
20    服务器设备
30    用户终端
200   第一函数记录部
210   发出部
220   收集部
230   评价值DB
240   第一更新部
250   性能评价部
300   文件DB
310   特征量计算部
320   第二函数记录部
330   难度评价部
340   输入部
350   评价值DB
360   第二更新部
500   信息处理设备
具体实施方式
以下将通过使用本发明的实施例解释本发明。但是,下面所描述的实施例不限制在权利要求范围内所陈述的本发明。此外,实施例中所描述特征的整体组合对于本发明的解决装置并不总是必要的。
图1示出信息处理系统10的整个配置。该信息处理系统10包括服务器设备20和多个用户终端30。该服务器设备20向每个用户终端30发出计算程序,用于计算代表文件中所包括的每个页面特征的特征量。而且,该服务器设备20也向每个用户终端30发出评价函数,用于计算通过使用屏幕读取器理解文件内容的难度的评价值。
多个用户终端30中的每一个与多个用户之一相关联,并且包括用于以声音输出文件内容的屏幕读取器。通过使用由服务器设备20发出的该计算程序和评价函数,每个用户终端30计算包括在由用户指定的文件中每个页面的评价值,并输出该用户所计算的评价值。因此,在实际朗读该文件之前,该用户可以发现理解该文件中每个页面内容的难度,并可以有效地选择一个页面以实际朗读。
图2示出服务器设备20的功能配置。该服务器设备20包括第一函数记录部200、发出部210、收集部220、评价值DB 230和第一更新部240。该第一函数记录部200记录与用户的用户配置文件相关联的评价函数,该评价函数用于该用户,并且用于基于该页面的特征量计算该页面难度的评价值。例如,该用户的用户配置文件包括该用户所使用的屏幕读取器的类型、或用户生成该用户试图理解的文件的创建系统的类型。
所述发出部210向每个用户终端30发出记录在第一函数记录部200中的评价函数。向某用户所发出的评价函数与该用户的用户配置文件相关联。此外,正如下面将描述的,每次第一更新部240更新评价函数时,发出部210向多个用户终端30中的每一个发出已更新的评价函数,并因此使得用户终端30中的第二函数记录部320记录该已更新的评价函数。此外,当从管理者处获得用于计算特征量的计算程序时,该发出部210可以响应该获得,并向多个用户终端30中的每一个发出该计算程序。
针对其通过使用评价函数所计算的评价值与用户对难度的评价不一致的页面中至少一个页面,该收集部220从用户收集由用户的难度评价值和该页面的特征量,并一起收集用户的用户配置文件。特别地,该收集部220可以在用户终端30中所记录的用户的难度评价值的数量达到预定水平时收集用户的难度评价值和特征量,或者不管评价值的数量而周期地对其进行收集。
评价值DB 230与用户配置文件相关联地记录通过收集部220从用户收集的用户的难度评价值和特征量。在第一函数记录部200中,该第一更新部240更新与每个用户配置文件相关的评价函数。这里,基于与用户配置文件相关联地收集的评价值和特征量更新所述评价函数。此外,该服务器设备20可以包括表现评价部250。该表现评价部250通过使用由收集部220收集的评价值评价每种屏幕读取器的表现水平。例如,在对应于某种屏幕读取器的评价值平均高于那些对应于其它各种屏幕读取器的评价值的情况下,该表现评价部250可以以高水平评估某种屏幕读取器的表现。
图3示出了用户终端30的功能配置。除作为屏幕读取器之外,该用户终端30还包括用于评价通过听所输出的声音理解内容的难度的功能。特别地,该用户终端30包括文件DB 300、特征量计算部310、第二函数记录部320、难度评价部330、输入部340、评价值DB 350和第二更新部360。该文件DB 300记录通过使用文件创建系统而生成的文件。该文件可以包括多个页面,这些页面具有相互不同的结构。而且,每个页面不仅可以包括文字还可以包括图形。此外,图形可以包括多个显示对象。
响应于来自用户的指定页面的指示,特征量计算部310计算代表所指定页面的特征量。根据以预定次序扫描包括在所指定页面中的多个显示对象的轨迹,可以计算该特征量。第二函数记录部320接收由发出部210的发出,并由此获得来自第一函数记录部200的评价函数。接着,第二函数记录部320记录因此所获得的评价函数。通过将特征量计算部310所计算的特征量传递至评价函数,难度评价部330计算该页面的评价值。这样,该难度评价部330为用户输出所计算的评价值。优选地,可以在屏幕读取器朗读文件之前,为用户输出该评价值。在由难度评价部330所计算的评价值与用户的难度评价不一致的情况下,输入部340接收用户的难度评价值的输入。
评价值DB 350记录用户的难度评价值及该页面的特征量,该评价值由用户关于每页面输入。这里,评价值 DB 350只是本发明的页面记录部的一个例子。评价值DB 350可以记录多个页面中的每个页面,其所计算的评价值与用户的难度评价不一致,并一起记录由输入部340输入的该页面的用户的难度评价值。基于所输入的每个页面的用户的难度评价值和该页面的特征量,第二更新部360更新记录在第二函数记录部320中的评价函数,以便可以输出与用户的评价更为一致的评价值。
图4示出了评价值DB 230的数据结构的示例。在该评价值DB 230中,记录由收集部220从每个用户终端30所收集的特征量和用户对难度的评价值,并相关联地记录与作为收集目标的用户的用户配置文件和用于计算特征量的计算程序的版本。图4中所示的用户配置文件包括屏幕读取器的类型和创建系统的类型。该屏幕读取器并不一定是单独的软件,也可以是某软件的一部分,诸如浏览器软件的插件之类。这种情况下,优选的是,软件和插件的类型在用户配置文件中是可辨别的。作为另一个例子,屏幕读取器可以通过将多个软件组合而获得。例如,该屏幕读取器可以包括用于转换文件的数据格式的转换程序,和用于在转换之后朗读文件的朗读程序。这种情况下,优选的是,每个构成屏幕读取器的程序在用户配置文件中是可辨别的。
此外,记录在评价值DB 230中的特征量可以是包括多个元素的矢量数据。一组矢量数据中的元素分别表示一页面的不同特征。而且,例如,通过使用比例表示记录在评价值DB 230中的评价值,并因此指示通过听声音理解的容易度。取而代之的是,可以通过使用基于比例100的连续值之一来表示该评价值,并因此指示通过听声音理解的容易度。计算程序的版本示出新计算程序和旧计算程序中的哪一个用于在更新计算程序的过渡期中评价特征量。下面将参考附图11描述涉及该版本信息的过程。
图5示出由难度评价部330输出的屏幕的第一显示示例。在该第一显示示例中的文件是演示程序包。该演示程序包包括多页面,且各个页面的标题显示在屏幕上。通过使用用户终端30中所提供的屏幕读取器的功能,用户可以使这些标题以声音被朗读。该难度评价部330使每页面难度的评价值与该页面的标题一起被显示。例如,在图5中,显示为5星的等级指示其内容很容易理解。另一方面,显示为1星的等级指示其内容很难理解。
图6示出由难度评价部330输出的屏幕的第二显示示例。该第二显示示例说明当用户指定某页面时所显示的弹出窗口。为了更加精确,当用户指定某页面时,该难度评价部330使该页面的评价值及该评价值所表达的内容显示在弹出窗口内。通过指定页面,用户可以在该页面被实际朗读之前确定理解该页面内容的难度。
图7示出由难度评价部330输出的第三显示示例。该第三显示示例显示当输入部340收到用于改变评价值的操作时所显示的屏幕。收到用于改变评价值的选择菜单(例如,工具栏上的编辑菜单)的操作后,输入部340使屏幕显示用于改变难度的评价值的命令选项。这里,显示有Change Star 1等。这样,通过使用户选择这些命令中的任意一个,输入部340可以接收用户的难度评价值的输入。
图8示出服务器设备20收集用户的难度评价值并更新评价函数的过程的流程图。第一更新部240基于预定的样品文件产生评价函数,并在第一函数记录部200中记录该评价函数(S800)。如果评价值是新记录在第一函数记录部200中的,或者第一函数记录部200中所记录的评价函数被更新,则发出部210向每个用户终端30发出记录在第一函数记录部200中的评价函数(S810)。如果由难度评价部330计算的评价值与用户的难度评价不一致,则收集部220从每个用户终端30收集输入至输入部340的用户的难度评价值和由特征量计算部310计算的特征量(S820)。可选地,例如,可以定期进行收集。
第一更新部240在所收集的与用户配置文件相关的特征量和用户的难度评价值的基础上更新记录在第一函数记录部200中的评价函数,以便可以输出与用户的评价更为一致的评价值(S830)。下面将描述处理过程的详细示例。首先,第一更新部240将所收集的特征量和所收集的用户的难度评价值分类为各用户配置文件的组。接下来,第一更新部240通过使用诸如多元回归分析或机器学习(神经网络、决策树学习、支持向量机等)的技术为分类而成的每组生成评价函数。所生成的评价函数最有可能是可以通过使用所收集的特征量返回所收集的用户的难度评价值的函数。第一更新部240将现有的评价函数更新成新生成的评价函数。
发出部210判断用于计算特征量的计算程序是否已经更新(S840)。如果该计算程序已经更新(S840:是),发出部210向用户终端30发出更新后的计算程序(S850),然后该处理返回至步骤S810。这样,每次评价函数被更新时,向用户终端30发出新的评价函数。
图9示出用户终端30计算和输出评价值的过程的流程图。响应于来自用户的用于指定页面的指令,特征量计算部310计算该指定页面的特征量(S900)。通过使用在以预定顺序扫描的指定页面中所包括的多个显示对象所遵循的扫描轨迹来计算特征量是可行的。其细节示于图10A和10B。
每个图10A和10B示出了以Z顺序扫描显示对象所遵循的扫描轨迹。该Z顺序是在多个显示对象被相互重叠着显示的情况下该多个显示对象的重叠顺序。例如,显示对象按照该对象被创建的顺序从底层到顶层顺序重叠显示。在每个图10A和10B中,诸如矩形和箭头线的形状表示显示对象,而将这些显示对象相互连接的虚线表示扫描轨迹。在图10A中,扫描轨迹非常复杂。这样,以Z顺序进行朗读的屏幕读取器分立地朗读显示对象,而不考虑屏幕上在X方向和Y方向上的相对位置。结果,朗读显示对象的顺序与视力正常的人直观地观察到的显示结构极其不一致。另一方面,在10B中,扫描轨迹相对线性。结果,朗读显示对象的顺序与视力正常的人直观地观察到的显示结构更为一致。
为了检测如上所述的作为特征量的朗读顺序和显示结构之间的不一致性,特征量计算部310通过使用以Z顺序扫描多个显示对象所遵循的扫描轨迹来计算特征量。例如,根据轨迹中的距离和角度可以计算特征量。下面将描述该过程的细节。在一个例子中,特征量计算部310计算第一显示对象和邻接该第一显示对象扫描的第二显示对象之间的距离。这里,特征量计算部310对每个显示对象进行这样的计算。然后,在所计算的总的或平均的距离较长的情况下,特征量计算部310计算比总的或平均的距离较短的情况下的大的特征量。换句话说,在某页面中的扫描轨迹复杂并因此总体很长的情况下,特征量计算部310将该页面鉴定为具有可能不易理解页面内容的特征的页面。
在另一个例子中,特征量计算部310计算连接第一显示对象和邻接该第一显示对象扫描的第二显示对象的线与连接第二显示对象和邻接该第二显示对象扫描的第三显示对象的线之间的角度。这里,特征量计算部310对每个显示对象进行这样的计算。然后,在所计算的总的或平均的角度的绝对值较大的情况下,特征量计算部310计算比总的或平均的角度的绝对值较小的情况下大的特征量。例如,如公式1所示用于计算特征量的公式。通过使用该公式,特征量计算部310可以计算如图10A所示的部分扫描轨迹相互重叠的情况下的大特征量,也可计算如图10B所示的部分扫描轨迹不相互重叠的情况下的小特征量。
max ( abs ( Σ l = 1 k Aj ) | 1 ≤ k ≤ N - 2 ) …公式1
通过参考附图10A和10B所示的过程是一个示例。特征量计算部310可以通过使用其它多种方法计算多个特征量,并可以将由所计算的特征量所组成的矢量输入评价函数。下面将描述用于计算特征量的方法的示例。
(1)显示对象的数目、其区域尺寸等
特征量计算部310将包括在一页面中的显示对象分类成多种类型。该分类是根据标准进行的,诸如,每个显示对象是否包括文本数据和可选的文本数据中的任意一个,及显示对象是否是表示页面标题和概要文本中的任意一个的占位符。此后,特征量计算部310计算每个标准的显示对象的数目或由每个标准的显示对象所占据的区域占该页面整个区域的比例作为特征量。这样,此显示对象是否具有某种特征,并且如果有,占有大区域(即很可能非常重要)的显示对象具有何特征,可以作为特征量来表示。
(2)文本中文字的数目和字体的改变量
特征量计算部310可以计算页面中所包括的文字的总数或每个显示对象中所包括的文字的平均数或总数作为特征量。而且,特征量计算部310可以计算在以Z顺序朗读完显示对象的时间期间内文字的字体或颜色改变的次数作为特征量。这是因为,弱视的人一般很难理解包括少量文字的句子。此外,也难以将通过使用文字的颜色和字体所表达的信息翻译成音频数据。
(3)在分组等级的每个水平上对象和文字的数目
有时,显示对象具有由将多个显示对象分组而形成的结构。为了更为精确,如果文件创建者执行将多个显示对象分组的操作,则该文件创建者可以处理该多个显示对象(改变其位置、增大或减小其尺寸等),就像它们是一个显示对象一样。此外,显示对象可以具有包括显示对象的嵌套组的结构。
特征量计算部310可以计算包括在某页面中的组的等级的数目,或者可以计算包括在每个组的等级中的显示对象或文字数的平均值和方差,然后可以将所计算的结果作为特征量输出。一般而言,这是因为在某页面具有过于深的等级或根本没有等级的情况下,弱视的人通常难以理解该页面的内容。
(4)其它
在另一个实施例中,特征量计算部310可以计算关于页面是否包括动画的信息作为特征量。如果显示对象是相互重叠着显示的,特征量计算部310可以在显示对象相互重叠的区域的基础上来计算特征量。这是因为,当页面上大量使用动画或者当页面包括相互重叠的显示对象时,弱视的人通常难以理解页面的内容。
此处,将再次描述图9。在修改用于寻找特征量的计算程序的过渡期中,特征量计算部310在步骤S900的处理过程中执行用于减少由于该修改而引发的问题的另一处理。稍后将参考图11对用于最小化问题的该处理进行详细描述。步骤S900之后,难度评价部330将由特征量计算部310计算出的特征量传递至已发出的评价函数,并因此计算评价值(S910)。接着,难度评价部330为用户输出评价值(S920)。输入部340接收与由难度评价部330计算出的评价值不同的用户的难度评价值的输入(S930)。
如果输入部340接收用户的难度评价值的输入(S930:是),则第二更新部360在所输入的用户对每页面难度的评价值和该页面的特征量的基础上更新记录在第二函数记录部320中的评价函数(S940)。由于此更新,评价函数被修改,以便评价函数可以输出与用户的评价更为一致的评价值。与该页面的特征量一起,评价值DB 350存储由用户输入的每页面的评价值(S950)。此外,评价值DB 350可以存储多页面中的每个其所计算的评价值与用户对困难的评价不一致的页面,并一起存储输入至输入部340的用户的难度评价值。
图11示出了步骤S900中过程的细节。如果用户终端30在已经具有第一计算程序的同时新收到第二计算程序的发出,则使用先前产生的未修改的评价函数有时会导致问题的出现。因此,希望产生新的评价函数。然而,用户的评价并没有反映在新评价函数上。因此,新评价函数有时返回准确性不够的评价值。为了避免这个问题,在收到第二计算程序的发出之后,用户终端30在预定的参考期中执行下列处理。此处,将参考期认作用于改变计算程序的过渡期。
特征量计算部310判断是否已经接收到第二计算程序的发出(S1100)。响应于发出了第二计算程序的接收(S1100:是),特征量计算部310判断自从接收到第二计算程序的发出以来参考期是否已经结束(S1110)。当没有接收到第二计算程序的发出,或者如果自从接收到第二计算程序的发出以来参考时间已经结束,则特征量计算部310通过使用最新的计算程序来计算特征量,然后终止该处理过程(S1105)。
当参考期没有结束时(S1110:否),特征量计算部310执行下面的处理。顺便提一句,如果较新的第二计算程序是在参考期结束之前发出的,则特征量计算部310将把现有的第二计算程序所执行的处理无效掉,并为新的第二计算程序执行下列处理。
首先,特征量计算部310通过使用第一计算程序来计算特征量(S1120)。然后,如上所述,难度评价部330在步骤S910中,从通过使用第一计算程序所计算的特征量中计算评价值。接着,特征量计算部310通过使用第二计算程序来计算评价值(S1130)。特征量计算部310在文件DB 300中存储通过使用第二计算程序所计算的特征量,并与通过使用第一计算程序在步骤S910中所计算的评价值和指示第二计算程序的版本的信息相关联地存储(S1140)。注意,如果由于所计算的评价值与用户的评价不一致而接收新的用户的难度评价值的输入,则与新的用户的难度评价值相关联地存储特征量。
例如,服务器设备20周期性地收集存储在文件DB 300中的特征量、评价值和指示版本的信息。特别地,收集部220从文件DB 300收集由难度评价部330计算的评价值或输入至输入部340的用户的难度评价值;及特征量计算部310通过使用第二计算程序计算的特征量。对此响应,第一更新部240基于所收集的评价值和所收集的特征量产生一对应于第二计算程序的第二评价函数。这样,对应于新计算程序的第二评价函数的评价准确性可以由发出新计算程序的点提高到参考期结束的点。
除了上述处理,服务器设备20可以使用已经被存储在文件DB 300中的每页面(也就是,其通过使用第一评价函数计算的评价值与用户的评价不一致的页面),以便提高第二评价函数的评价准确性。为了更加精确,通过使用第二计算程序,特征量计算部310计算已经存储在文件DB 300中的每页面的特征量。期望可以在用户终端30的计算负荷低于预定参考负荷的条件下执行此计算处理。然后,收集部220收集存储在文件DB 300中的每页面的特征量,该特征量是通过使用第二计算程序计算出的,在某种意义上,该特征量与和该页面相关联地存储在文件DB 300中的评价值(也就是,通过使用第一评价函数计算的评价值,或由用户输入的用户的难度评价值)相关。因此,为了提高新评价函数的评价准确性,上述处理使得可以利用其通过使用第一评价函数计算的评价值先前与用户的评价不一致的页面。
图12示出了服务器设备20为文件创建者执行的处理的示例。参考图12,将描述文件创建者使用用户终端30的处理示例。在此例子中,用户终端30也作为文件创建系统工作。每次用户终端响应于文件创建者的指令更新页面时(S1200:是),特征量计算部310计算表示被更新页面的特征的特征量(S1210)。接着,难度评价部330通过将如此计算的特征量传递至评价函数来计算该页面的评价值,然后为该文件的创建者输出该评价值(S1220)。
正如图12的示例中所描述的,在每次更新页面时计算评价值。根据这个例子,文件创建者可以参考着评价值来编辑页面,并且因此可以简单地创建弱视的人可以容易理解的文件。注意,另一种关于为弱视的人创建文件的技术可以附加地合并在用户终端30中。例如,用户终端30先存储指示为了弱视的人可以容易地理解文件要满足的要求的信息。此处,该要求包括代替图像而被朗读的字符串的指定。该要求的另一个例子是构成表格的多个对象与指示表格的信息(标签或类似的)相关联地记录,而不是简单地任意地分散地显示在屏幕上。此外,该要求也可以是表示标题的字符串,与指示该字符串表示该标题的信息(占位符等)相关联地记录。然后,每当更新页面时,用户终端30判断所更新的页面是否满足该要求。如果不满足该要求,则用户终端30为文件创建者输出当前不满足的要求,并因此鼓励文件创建者修改文件。将这些处理和本发明结合起来使得更容易创建一种弱视的人可以容易理解的文件。
图13示出了信息处理设备500的硬件配置的示例,该设备作为服务器设备20或用户终端30工作。信息处理设备500包括CPU外围单元,输入/输出单元和传统输入/输出单元。CPU外围单元包括CPU1000,RAM 1020和图形控制器1075,它们通过主控制器1082互相连接。输入/输出单元包括通信接口1030,硬盘驱动器1040和CD-ROM驱动器,它们通过输入/输出控制器1084连接至主控制器1082。传统输入/输出单元包括BIOS 1010、软盘驱动器1050和输入/输出芯片1070,它们都连接至输入/输出控制器1084。
主控制器1082将RAM 1020连接至CPU 1000和图形控制器1075,二者以高转换速率对RAM 1020进行存取。CPU 1000根据存储在BIOS 1010和RAM 1020中的程序进行操作,并控制每个组件。图形控制器1075获得在RAM 1020内部提供的帧缓冲器中由CPU 1000等所产生的图像数据,并将所获得的图像数据显示在显示设备1080上。或者,图形控制器1075内部可以包括帧缓冲器,该帧缓冲器存储由CPU 1000等所产生的图像数据。
输入/输出控制器1084将主控制器1082连接至通信接1030、硬盘驱动器1040和CD-ROM驱动器1060,它们都是高速输入/输出设备。通信接口1030通过网络与外围设备通信。硬盘驱动器1040存储供信息处理设备500使用的程序和数据。CD-ROM驱动器1060从CD-ROM 1095中读取程序或数据,并向RAM 1020或硬盘1040提供读出的程序或数据。
然而,输入/输出控制器1084连接至BIOS 1010和诸如软盘驱动器1050和输入/输出芯片1070的低速输入/输出设备。BIOS 1010存储程序,诸如由CPU 1000在信息处理装置500启动时所执行的引导程序和取决于信息处理设备500的硬件的程序。所述软盘驱动器1050从软盘1090读取程序或数据,并经由输入/输出芯片1070将所读取的程序或数据提供给RAM 1020或硬盘驱动1040。输入/输出芯片1070连接至软盘驱动1050和例如带并行端口、串行端口、键盘端口、鼠标端口等的各种输入/输出设备。
将要提供给信息处理设备500的程序由具有存储在诸如软盘1090、CD-ROM 1095和IC卡中的程序的用户所提供。经由输入/输出芯片1070和/或输入/输出控制器1084从记录介质读取该程序,并将其安装在信息处理设备500中。从而执行该程序。由于在使信息处理装置500执行程序中的操作与参考图1至12所描述的服务器设备20或用户终端30的操作相同,因此省略对其的描述。
上述程序可存储在外部存储介质中。除软盘1090和CD-ROM1095之外,待用的存储介质的例子包括诸如DVD和PD的光存储介质、诸如MD的磁光存储介质、磁带介质和诸如IC卡的半导体介质。或者,通过使用提供给连接至专用通信网络或互联网的服务器系统的诸如硬盘和RAM的存储设备作为记录介质,可以经由网络将该程序提供给信息处理设备500。
如上所述,本实施例的信息处理系统10可以恰当地评价对包括图形的文件进行理解的难度,而对于图形理解的难度的评价曾经很难。在此系统中,基于从多个用户所收集到的评价,适宜地更新用于评价难度的函数。因此,即使用于最新开始使用屏幕读取器的用户,仍然可以恰当地评价其难度。此外,用户的评价以这样的状态收集,即其中用户的评价由包括一种屏幕读取器等上的信息的用户配置文件所分类。通过使用所收集的用户评价,可以进一步提高难度的评价准确性。而且,在更新用于计算特征量的计算程序的情况下,设定更新的过渡期,使得可以防止在更新之后的评价准确性降低。
至此,已经通过使用实施例描述了本发明。然而,本发明的技术范围并不受限于上述实施例。对于本领域技术人员来说很明显的是,可以对该实施例进行各种变化和改进。而且,同样明显的是,对本发明的权利要求的范围所进行的变化和改进包括在本发明的技术范围内。

Claims (14)

1.一种用于评价通过听由屏幕读取器输出的声音理解文件中每页内容的难度的系统,该系统包括:
第一函数记录部,其记录用于基于表示页面特征的特征量计算页面的评价值的评价函数;
收集部,其从用户收集用户的难度评价值和其使用评价函数计算出的评价值与用户的难度评价值不一致的至少一页中的每个页面的特征量;
和第一更新部,其基于从用户收集到的特征量和评价值更新记录在第一函数记录部中的评价函数,以便输出与用户的评价更为一致的评价值。
2.如权利要求1所述的系统,其中
对于每种屏幕读取器,第一函数记录部记录用于计算通过听由该种屏幕读取器输出的声音理解内容的难度的评价值的评价函数,
对于这样的页面,即其通过使用对应于由多个用户的每一个所使用的屏幕读取器的类型的评价函数所计算的评价值与用户对困难的评价不一致,该收集部从用户与屏幕读取器的类型相关联地收集用户的难度评价值和该页面的特征量,并且
第一更新部基于用户的难度评价值和特征量更新对应于每种屏幕读取器的评价函数,其中用户对困难的评价值和特征量与屏幕读取器的类型相关联地被收集。
3.如权利要求2所述的系统,其中
对于每种用于创建文件的文件创建系统,该第一函数记录部记录用于计算通过听由屏幕读取器输出的声音理解文件的难度的评价值的评价函数,该文件由该种文件创建系统所创建,
对于这样的页面,即其通过使用对应于用于创建文件的文件创建系统的类型的评价函数所计算的评价值与用户的难度评价不一致,该收集部与文件创建系统的类型相关联地收集用户的难度评价值和该页面的特征量,并且
第一更新部基于用户的难度评价值和特征量更新对应于每种文件创建系统的评价函数,其中用户的难度评价值和特征量与文件创建系统的类型相关联地被收集。
4.如权利要求2所述的系统,还包括:
表现评价部,该表现评价部基于由收集部收集的用户的难度评价值评价每个类型的屏幕读取器的表现水平。
5.如权利要求1所述的系统,还包括:
特征量计算部,其根据以预定顺序扫描页面中所包括的多个显示对象所遵循的轨迹计算用户所指定的页面的特征量;和
难度评价部,其通过将所计算的特征量传递给评价函数而计算该页面的评价值,然后为用户输出该评价值,
所述系统中,如果由难度评价部计算的评价值与用户的难度评价不一致,则收集部从用户收集用户的难度评价值。
6.如权利要求5所述的系统,其中,在显示对象互相重叠着显示的情况下,特征量计算部根据以Z顺序扫描指定页面中所包括的多个显示对象所遵循的轨迹计算页面的特征量,Z顺序是多个显示对象重叠的顺序。
7.如权利要求5所述的系统,其中
关于多个显示对象的每一个,所述特征量计算部计算第一显示对象和邻接第一显示对象扫描的第二显示对象之间的距离,并且
在如此计算的总的或平均的距离较大的情况下,所述特征量计算部计算比所计算的总的或平均的距离较小的情况下的大的特征量。
8.如权利要求5所述的系统,其中
关于多个显示对象的每一个,所述特征量计算部计算连接第一显示对象和邻接第一显示对象之后扫描的第二显示对象之间的线到连接第二显示对象和邻接第二显示对象扫描的第三显示对象之间的线之间的角度,并且
在如此计算的总的或平均的角度较大的情况下,所述特征量计算部计算比所计算的总的或平均的角度较小的情况下的大的特征量。
9.如权利要求1所述的系统,还包括向多个用户分别提供的多个用户终端,每个用户终端包括:
第二函数记录部,记录从第一函数记录部获得的评价函数;
特征量计算部,计算用户所指定的页面的特征量;
难度评价部,通过将所计算的特征量传递给评价函数,计算该页面的评价值,并接着向用户输出该评价值;
输入部,如果由难度评价部计算的评价值和用户的难度评价不一致,则接收用户的难度评价值的输入;以及
第二更新部,基于所输入的用户的难度评价值和所计算的特征量更新记录在第二函数记录部中的评价函数;
该系统还包括具有第一函数记录部、收集部和第一更新部的服务器设备,
所述系统中,该收集部从多个用户终端的每一个收集输入至输入部的用户的难度评价值和由特征量计算部计算的特征量,并且
所述服务器设备还包括发出部,该发出部向多个用户终端的每一个发送由第一更新部更新的评价函数,并使得第二函数记录部记录该评价函数。
10.如权利要求9所述的系统,其中
所述发出部向多个用户终端的每一个发出用于计算特征量的计算程序;并且
在已接收到第一计算程序的状态下响应于第二计算程序的接收,
在之后的预定参考期期间,
所述特征量计算部通过使用各第一和第二计算程序计算特征量,
所述难度评价部通过使用第一计算程序将所计算的特征量传递至评价函数来计算该页面的评价值,
所述收集部收集如此计算的评价值或被输入至输入部的用户的难度评价值,以及通过使用第二计算程序由特征量计算部所计算的特征量,并且
所述第一更新部基于所收集的评价值和所收集的特征量生成对应于第二计算程序的评价函数,并将该评价函数记录在第一函数记录部中。
11.如权利要求10所述的系统,其中
每个用户终端还包括页面记录部,与输入至输入部的该页面的用户的难度评价值相关联地记录多个页面中所计算的评价值与用户的难度评价不一致的每个页面;
而且,在参考期期间,
所述特征量计算部通过使用第二计算程序还计算记录在页面记录部中的每个页面的特征量,并且
所述收集部将所计算的记录在页面记录部中的每个页面的特征量与对应于页面记录部中的该页面而记录的评价值相关联地收集。
12.如权利要求11所述的系统,其中
在参考期期间,如果用户终端的计算负载低于预定的参考负载,则每个用户终端的所述特征量计算部通过使用第二计算程序,计算记录在页面记录部中的每个页面的特征量。
13.如权利要求1所述的系统,还包括:
特征量计算部,在每次创建或编辑文件的用户更新页面时计算表示页面特征的特征量;和
难度评价部,通过将所计算的特征量传递给评价函数计算该页面的评价值,并因此向用户输出评价值。
14.一种用于评价通过听由屏幕读取器输出的声音理解文件中每页内容的难度的方法,该方法包括步骤:
记录基于表示页面特征的特征量计算页面难度的评价值的评价函数;
从用户收集用户的难度评价值和其通过使用评价函数计算的评价值与用户的难度评价不一致的至少一页中的每个页面的特征量;和
基于从用户收集到的特征量和评价值更新评价函数,以便输出与用户的评价更为一致的评价值。
CNB2007100885819A 2006-03-17 2007-03-16 用于评价理解文件的难度的系统和方法 Withdrawn - After Issue CN100570596C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP200674222 2006-03-17
JP2006074222A JP2007249755A (ja) 2006-03-17 2006-03-17 ドキュメントを理解する難易度を評価するシステムおよびその方法

Publications (2)

Publication Number Publication Date
CN101038581A true CN101038581A (zh) 2007-09-19
CN100570596C CN100570596C (zh) 2009-12-16

Family

ID=38593957

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007100885819A Withdrawn - After Issue CN100570596C (zh) 2006-03-17 2007-03-16 用于评价理解文件的难度的系统和方法

Country Status (3)

Country Link
US (1) US20080040115A1 (zh)
JP (1) JP2007249755A (zh)
CN (1) CN100570596C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107111475A (zh) * 2015-01-07 2017-08-29 微软技术许可有限责任公司 管理用于输入理解确定的用户交互
WO2017166990A1 (zh) * 2016-03-31 2017-10-05 深圳光启合众科技有限公司 具备评价能力的人工智能系统及其评价方法
US10446137B2 (en) 2016-09-07 2019-10-15 Microsoft Technology Licensing, Llc Ambiguity resolving conversational understanding system

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467090B1 (en) * 2008-02-27 2008-12-16 International Business Machines Corporation Using web FAQ data for creating self-service speech applications
JP5336748B2 (ja) 2008-03-06 2013-11-06 インターナショナル・ビジネス・マシーンズ・コーポレーション コンテンツ中のアクセシビリティに関する問題箇所を他人へ効果的に伝達するためのコンピュータ、方法、プログラム
US9798653B1 (en) * 2010-05-05 2017-10-24 Nuance Communications, Inc. Methods, apparatus and data structure for cross-language speech adaptation
JP5775417B2 (ja) * 2011-10-18 2015-09-09 Kddi株式会社 ユーザインタフェース自動分析評価システム及びユーザインタフェース自動分析評価方法
JP5906217B2 (ja) * 2013-06-17 2016-04-20 京セラドキュメントソリューションズ株式会社 文書処理プログラム、文書処理装置および文書処理システム
JP6344024B2 (ja) * 2014-04-09 2018-06-20 富士通株式会社 既読判断装置、既読判断方法および既読判断プログラム
CN105824845A (zh) * 2015-01-08 2016-08-03 阿里巴巴集团控股有限公司 一种页面显示方法和装置
CN105068993B (zh) * 2015-07-31 2018-08-07 成都思戴科科技有限公司 一种评估文本难度的方法
CN111078874B (zh) * 2019-11-29 2023-04-07 华中师范大学 基于随机子空间的决策树分类的对外汉语难度评估方法
WO2023022323A1 (ko) * 2021-08-16 2023-02-23 박봉래 외국어 음성의 청취 난이도 평가 방법, 장치 및 프로그램
US12051399B2 (en) * 2021-12-02 2024-07-30 Jpmorgan Chase Bank, N.A. Evaluating screen content for accessibility

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
US6950991B2 (en) * 1995-11-13 2005-09-27 Citrix Systems, Inc. Interacting with software applications displayed in a web page
US8069075B2 (en) * 2003-03-05 2011-11-29 Hewlett-Packard Development Company, L.P. Method and system for evaluating performance of a website using a customer segment agent to interact with the website according to a behavior model
EP1854027A4 (en) * 2004-12-14 2013-03-27 Freedom Scientific Inc USER-SPECIFIC IDENTIFICATION FOR SCREEN LENSERS
US20080133500A1 (en) * 2006-11-30 2008-06-05 Caterpillar Inc. Website evaluation and recommendation tool

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107111475A (zh) * 2015-01-07 2017-08-29 微软技术许可有限责任公司 管理用于输入理解确定的用户交互
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
CN107111475B (zh) * 2015-01-07 2020-09-11 微软技术许可有限责任公司 管理用于输入理解确定的用户交互
WO2017166990A1 (zh) * 2016-03-31 2017-10-05 深圳光启合众科技有限公司 具备评价能力的人工智能系统及其评价方法
US10446137B2 (en) 2016-09-07 2019-10-15 Microsoft Technology Licensing, Llc Ambiguity resolving conversational understanding system

Also Published As

Publication number Publication date
CN100570596C (zh) 2009-12-16
US20080040115A1 (en) 2008-02-14
JP2007249755A (ja) 2007-09-27

Similar Documents

Publication Publication Date Title
CN101038581A (zh) 用于评价理解文件的难度的系统和方法
US11003862B2 (en) Classifying structural features of a digital document by feature type using machine learning
US11361526B2 (en) Content-aware selection
CN107291822B (zh) 基于深度学习的问题分类模型训练方法、分类方法及装置
US8196066B1 (en) Collaborative gesture-based input language
KR101087443B1 (ko) 디지털 잉크 스트로크 제공 방법
CN1120432C (zh) 产生显示控制信息的方法和计算机
US8892594B1 (en) System and method for search with the aid of images associated with product categories
US20020164070A1 (en) Automatic algorithm generation
CN108717853B (zh) 一种人机语音交互方法、装置及存储介质
CN1573923A (zh) 用于用户模型化以增强对命名实体识别的系统和方法
CN1190205A (zh) 表意字符的递增输入方法
CN1517904A (zh) 墨水划分器及关联的应用编程接口
CN106293074A (zh) 一种情绪识别方法和移动终端
CN110827236B (zh) 基于神经网络的脑组织分层方法、装置、计算机设备
CN1799020A (zh) 信息处理方法和设备
CN1607539A (zh) 检测墨水输入中列表的系统和方法
EP2115737B1 (en) Method and system to improve automated emotional recognition
CN110197175A (zh) 一种图书书名定位及词性标注的方法及系统
CN117690545A (zh) 一种基于大模型的治疗方案生成方法及装置
US7580570B2 (en) Accuracy model for recognition signal processing engines
KR20210050771A (ko) 이미지 기반의 사용자 인터페이스 객체 탐지 시스템 및 방법
KR20230162696A (ko) 사용자 콘텐츠를 위한 분류 추천들의 결정
CN117807317A (zh) 基于智能体的交互方法及装置
JP6924450B2 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
AV01 Patent right actively abandoned

Granted publication date: 20091216

Effective date of abandoning: 20120417

AV01 Patent right actively abandoned

Granted publication date: 20091216

Effective date of abandoning: 20120417

C20 Patent right or utility model deemed to be abandoned or is abandoned