CN1585969A

CN1585969A - 在预定窗口编辑文本的装置

Info

Publication number: CN1585969A
Application number: CNA028226216A
Authority: CN
Inventors: D·霍伊
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2001-11-16
Filing date: 2002-10-29
Publication date: 2005-02-23
Also published as: EP1456838A1; WO2003042975A1; JP2005509906A; US20030097253A1

Abstract

转录装置(1)的用户能够把口述文本(GT)以及相关标记信息(MI)输出至转录装置(1)。转录装置(1)把口述文本(GT)自动转录成认可文本(ET)并按照标记信息(MI)把认可文本(ET)的某些部分分配给显示窗口(D1，D2，D3)。认可文本(ET)的这些部分在标记信息(MI)所标识的显示窗口(D1，D2，D3)显示出来，其中相应窗口(D1，D2，D3)在口述文本(GT)声音复制期间的适当时候启动。

Description

在预定窗口编辑文本的装置

本发明涉及到将口述文本转录成认可文本并对该认可文本进行编辑的转录装置。

本发明还涉及到对经转录装置认可的文本进行编辑的编辑装置。

本发明再涉及到在执行转录过程期间对认可的文本进行编辑的编辑过程。

本发明进一步涉及到计算机程序产品，该产品可以直接装入数字计算机的内部存储器，且其包括软件代码节。

从文件US 5,267,155公知了这种转录装置、这种编辑装置、这种编辑过程，以及计算机程序产品，文件中公开了所谓的“在线”口授装置。已知的口授装置由执行话音认可软件和文本处理软件的计算机构成。这种已知口授装置的用户可以将口述文本口授入与计算机相连接的麦克风。构成转录器的话音认可软件执行话音认可过程。这样一来就把认可字分配给口述文本的每个口述字，由此得到了口述文本的认可文本。

执行文本处理软件的计算机构成了编辑装置并存储认可文本而且使认可文本的编辑或校正变得更加方便。监视器与计算机相连接，编辑装置中的编辑器便于在监视器上所示的几个窗口同时地显示几个文本。这里，第一显示窗口表示出标准文本，第二显示窗口表示出可以插进标准文本的字。

已知口授装置的用户能够把构成输入窗口的第一显示窗口中的文本光标定位在标准文本中的某一具体位置上并将第二显示窗口所示可插入字中的一个字口述进麦克风。口述字由转录器认可，而认可的字在文本光标位置插进标准文本。这就便于简单地产生出标准字句，这些字句可由用户通过口述字对所讨论的各个情况进行修改。

已知的转录装置还便于借助口述命令和口述文本来完成各种格式。为此，编辑器在显示窗显示出要完成的格式。用户可以首先把标记格式中的区域的命令口述进麦克风，然后把要输入的文本口授进格式中被标记的这个区域。

已经发现使用已知转录装置的一个缺点是，用户始终必须启动其内将要显示转录装置所认可文本的显示窗。发现的另一缺点是，在编辑由转录装置所认可的文本时用户从编辑装置得不到任何支持。

本发明的目的是建立第一自然段中所规定的那种转录装置，第二自然段中所规定的那种编辑装置，第三自然段中所说明的编辑过程，以及第四自然段中所说明的那种计算机程序产品，在它们当中避免了上述缺点。

为达到上述目的，使这种转录装置具有依据本发明的特性，所以可以用下文中所说的方式表示转录装置的特性。

转录装置用来把口述文本转录成认可文本并且对认可文本进行编辑，其中

接收装置用来接收口述文本以及相关的标记信息，相关标记信息把口述文本的某些部分分配给具体的显示窗口，

转录器用来转录口述文本并输出相关的认可文本，

存储器用来存储口述文本、标记信息、以及认可文本，

编辑器用来编辑认可文本，使得能够按照相关的标记信息至少在两个显示窗口可视地显示出认可文本。

为了达到上述目的，使这种编辑装置具有根据本发明的特性，所以可以用下文中所说的方式表示编辑装置的特性。

编辑装置用来编辑转录装置所认可的文本，其中

接收装置用来接收口述文本以及相关的标记信息并把口述文本的某些部分分配给具体的显示窗口，还用来接收口述文本经转录装置认可的文本，

存储器用来存储口述文本、标记信息、以及认可文本，

为了达到上述目的，使这种编辑过程具有根据本发明的特性，所以可以用下文中所说的方式表征编辑过程。

编辑过程用来在执行转录过程中编辑认可文本，转录过程有下述执行步骤：

接收口述文本以及相关的标记信息，相关标记信息将口述文本的某些部分分配给具体的显示窗口；

接收在转录过程中的口述文本的认可文本；

存储口述文本、标记信息、以及认可文本；

编辑认可文本，使得能够按照相关标记信息至少在两个显示窗口在视觉上显示出认可文本。

为了达到上述目的，使这种计算机程序产品具有根据本发明的特性，所以可以以下文中所说的方式表示计算机程序产品的特性。

计算机程序产品可以直接装入数字计算机的内部存储器且其包括软件代码节。这样当所述产品在计算机上运行时，计算机就执行按照权利要求10的过程步骤。

根据本发明的特征使口授或口述文本的作者能够把口述文本的这些部分分配给具体的显示窗口，口授期间在转录装置自动转录之后在这些显示窗口中将显示出相关的认可文本。这对所谓“脱机”转录装置是特别有利的，作者将口授文本传输给“脱机”转录装置并利用该装置先进行自动转录。在此之后，由转录装置自动认可的文本再由校对员借助编辑装置进行人工编辑。

因此，有利的是，校对员不必担心在显示窗口上进行认可文本的分配。通常，显示窗中显示的每一部分认可文本还存储在单独的计算机文档中。存储在独立计算机文档中认可文本的这些部分随后可能受到不同形式的处理，而这也是有利的。

权利要求2，8，以及11中的措施所得到的好处是，在存储于存储器中的口述文本的声音复制期间，为支持校对员的人工校正，显示窗口作为输入窗口而自动启动，此输入窗口含有刚刚进行过声音复制的口述文本的认可文本。这就意味着校对员能够集中在认可文本的校正上而无需首先启动对认可文本进行校正的相关显示窗口。

如果认可文本的这些部分在几个显示窗口显示，可能会出现并非所有显示窗口同时被看得见的情况。另外，可能最好是始终在监视器上只显示一个显示窗口。权利要求3，9，以及12中的措施所得到的好处是，含有刚刚被复制口述文本之认可文本的显示窗口的显示是自动启动的。这样，在口述文本的声音复制期间，认可文本的各显示窗口间可以自动进行有利的转换。

权利要求4中的措施所得到的好处是，它们允许同步型复制以在认可文本的校正期间支持校对员。

权利要求5中的措施所得到的好处是，由转录装置传输的用于同步型复制的连接信息被用作为标记信息，而与刚进行完声音复制之口述文本的连接信息相对应的显示窗口则被启动。

口述文本的作者可以利用麦克风上的按钮或其口授装置上的按钮输入标记信息来标记部分口述文本。权利要求6中的措施所得到的好处是，作者能够以口述命令的形式输入标记信息。这就大大地简化了标记信息的输入，作者的麦克风和口授装置则不必提供输入的可能性。

将参照附图所示实施方案对本发明予以进一步说明，不过，本发明并不局限于这些实施方案。

图1示出转录装置，它把口述文本转录成认可文本，其中认可文本的一些部分在三个不同的显示窗口显示。

图2示出在监示器上三个不同显示窗口显示的认可文本。

图1表示出转录装置1，它把口述文本GT转录成认可文本ET，同时对认可文本ET中被错误认可的文本部分进行编辑。转录装置1便于转录服务，利用这一服务几个医院的医生借助于他们的电话可以口授病历作为口述文本GT以便通过转录装置1的邮件或电子邮件来得到书面病历作为认可文本ET。医院的操作员将向转录服务的操作员支付使用转录服务的费用。这种转录服务特别是在美国广为使用，为医院节约了大量打字员。

转录装置1由一台第一计算机2和大量的第二计算机3构成，但是，其中第二计算机3在图1中只示出一个。第一计算机2执行话音认可软件，这一来就构成了转录器4。转录器4用来把从电话5接收到的口述文本GT通过电话网络PSTN转录成认可文本ET。人们早已知道了这种话音认可软件，例如由本申请人在“speech Magic^TM”品牌下就曾销售过，因此此处将不予详述。

第一计算机2还有电话接口6。电话接口6构成接收装置来接收口述文本GT，根据本发明其还包含相关的标记信息MI。标记信息MI将口述文本的一些部分分配给具体的显示窗口D，将参照图2对此予以更详细的说明。

第一计算机2还有存储器7，用来存储收到的口述文本GT、标记信息MI、以及由转录器4认可的文本ET。存储器7由第一计算机2中的RAM(随机存取存储器)和硬盘构成。

转录服务中的校对员编辑或校正由转录器4认可的文本ET。这些校对员中的每个校对员都可以使用这些第二计算机3中的一台计算机，该计算机构成了对认可文本ET进行编辑的编辑装置。第二计算机3执行文本处理软件——例如像“Word for Windows^”——这样一来就构成了编辑器8。与第二计算机3相连接的是键盘9、监视器10、扬声器11、以及数据调制解调器12。由转录器4认可并用编辑器8编辑的文本ET可以由编辑器8经过数据调制解调器12和数据网络NET以电子邮件的形式传输至属于医院医生的第三计算机13。参照转录装置1应用的下述实例将对此予以更详细的说明。

对于这个应用实例来说，假定“Rudolfstiftung”医院的医生“Haunold博士”口授患者“F.Mueller”的病历以便得到书面病历。此外，与此同时，与转录服务操作员商定转录服务支付以及按医疗保险计划安排医疗服务支付所需的所有数据都要输入到相关的数据库。

为了使用转录服务，医生用电话5拨转录装置1的电话号码并参与到转录装置1中去。为此，他要说出字句“医生数据”，然后说明其姓名“haunold博士”，他的医院“Rudolfstiftung”以及赋予他的代号“2352”。

然后，医生口授患者的数据。为此，他说出字句“患者数据”以及“ F.Mueller...男性...47岁...WGKK...一二...三”。接着。他开始口授病历。为此，他说出字句“病历”以及“患者...左腿疼痛...”。这里，口述字句“医生数据”，“患者数据”及“病历”构成了标记信息MI，用于将口述文本GT的一些部分分配给显示窗口，下面将对此予以更详细的说明。

电话5将通过电话网络PSTN把电话信号传输到电话接口6，电话接口6含有由医生“Haunold博士”口授的口述文本GT。包含有口述文本GT的数字数据然后通过电话接口6存储到存储器7。

接着，转录器4在执行话音认可软件时确定分配给所存口述文本GT的认可文本ET并将其存入存储器7。此外，转录器4用来认可口述文本GT中的口授命令并生成标记信息MI，其把口授中的后继口述文本GT分配给显示窗口。标记信息MI也存入存储器7。

如果校对员开始对医生“Haunold博士”口授的认可文本ET进行校正或编辑，并因而使用键盘9启动第二计算机3的话，监视器10就显示出图2中所示的图象。由标记信息MI＝“医生数据”所标识的认可文本部分通过编辑器8插进第一显示窗口D1中的格式。这是可能的，因为在医生进行口授时，他遵守数据输入进该格式的顺序。由标记信息＝“患者数据”所标识的认可文本部分输入到第二显示窗口D2中的格式，由标记信息MI＝“病历”所标识的认可文本部分被插进第三显示窗口D3中的文本区域。

这样做所得到的好处是，校对员不必把转录器4认可的文本ET分成为几部分，再借助人工“复制”和“插入”将这几部分分配到各个显示窗口D1-D3。所得到的另一个好处是，由于标记信息MI的作用，分配至显示窗口的认可文本ET的这些部分也存入其各自的文档。但是，情况不必就是这样的这一事实在这种应用中也是特别有利的，因为对与转录服务操作员和医疗保险计划计算帐目时的数据必须进行不同的处理。

编辑器8用来把从存储器7读出的口述文本GT输出至扬声器11对口述文本进行声音复制。编辑器8有启动装置14，其用来在口述文本GT声音复制时启动显示窗口的显示，由标记信息MI识别的显示窗口被分配给刚刚进行过声音复制的口述文本GT。

这一点是特别有利的，如果要是不能够在监视器10上同时显示所有显示窗口的话。例如，可以在整个监视器10上显示第三显示窗口D3以便能够立刻看到较大部分病历。如果对其相关认可文本ET在第一显示窗口D1显示、存储在存储器7中的口述文本GT进行声音复制，那么根据本发明，第一显示窗口D1的显示被启动，因此第一显示窗口D1在第三显示窗口D3之前显示。这就使得校对员能够听取口述文本GT，而相关的显示窗口D1-D3在适当时向启动并在前景中显示出来。

启动装置14还用来启动由标记信息MI分配作为输入窗口的相关显示窗口，在口述文本GT声音复制期间对认可文本ET进行编辑。这样做所得到的好处是，如果校对员识别出了认可文本ET中的错误或想要对认可文件进行其他改动的话，那么他/她此刻正在听相关口述文本GT的显示窗口就已经被作为输入窗口而启动了。

可以说，如果将文本光标在显示窗口中定位并显示，那么显示窗口就作为输入窗口启动了。文本光标C指示出认可文本ET中的位置，在此位置由校对员用键盘9将文本项目输入。如图2所示，第一显示窗口有双框，因此向校对员标识为活动显示窗口和输入窗口。

转录器4还用来确定转录期间的连接信息，所说的连接信息要标识出口述文本GT每个部分的相关认可文本ET。另外，由于在转录装置1中启动了同步型复制，编辑器8被用于口述文本GT的声音复制及由连接信息所标识之相关认可文本ET的同步可视标记。

这样做所得到的好处是，在口述文本GT的声音复制期间，被复制口述字的相关认可字进行了可视标记，另外活动显示窗口也在适当时间改变了。因此，校对员能够特别好地集中在待校正认可文本ET的内容上。

如果对应于标记信息MI经转录器4认可的文本ET已经由编辑器8分配给了显示窗口或文档，那么在同步型复制期间，显示窗口在适当时间还可以由连接信息启动。因此，在这种情况下，连接信息还构成了启动显示窗口的标记信息。

转录装置1的用户能够以许多不同的方式输入标记信息MI。例如，他可以在待分配给显示窗口的每一部分口述文本GT的开头和/或结尾处启动电话5辅助键盘上的按钮。用户还可以事先用口授装置记录口授内容，并使用口授装置上的标记按钮输入标记信息MI。不过，特别有利的是——如关于应用实例所说明的那样一一通过包含在口述文本GT中的口述命令来输入标记信息MI对口述文本GT的部分进行标记。

可以说，转录装置1还可以由执行话音认可软件和文本处理软件的计算机构成。这台计算机例如可以由与因特网相连接的服务器构成。

类似地，按照用户的标记信息MI根据本发明把认可文本ET的一些部分分成文档的工作可以由转录器4完成。在这种情况下，编辑器8将在单独的显示窗口单独的文档中显示认可文本部分，如使用Windows^程序就是这种情况。

可以说，根据本发明的措施，特别是使用所谓“脱机”转录装置——如关于应用实例所述——是有利的。但是，还能够提供使用所谓“在线”转录装置的措施，利用这些措施通过转录器直接转录用户口述的字句并将其在监视器上显示出来。

可以说，根据本发明由计算机执行的计算机程序产品可以储存在光或磁可读数据载体上。

可以说，根据本发明的编辑装置可以用于口述文本及相关标记信息的手工打字员。在这种情况下，打字员将听取口述文本并借助计算机键盘将其用手工写下来。根据本发明，启动装置将根据分配给口述文本的标记信息在适当时间启动相关的显示窗口作为输入窗口并使文本光标在输入窗口中定位。这样做所得到的好处是，打字员只需集中在输入文本上而不必集中在改变输入窗口。

可以说，口述文本和标记信息还可以由数字式口授装置通过转录装置中的数据调制解调器作为数字数据进行接收。

Claims

1.转录装置(1)，用来将口述文本(GT)转录成认可文本(ET)并对认可文本(ET)进行编辑，其中

-接收装置(6)，用来接收口述文本(GT)以及相关的标记信息(MI)，标记信息将口述文本(GT)的一些部分分配给具体的显示窗口(D1，D2，D3)，

-转录器(4)，用来转录口述文本(GT)并输出相关的认可文本(ET)，

-存储器(7)，用来存储口述文本(GT)、标记信息(MI)、以及认可文本(ET)，及

-编辑器(8)，用来编辑认可文本(ET)，使得能够按照相关标记信息(MI)在至少两个显示窗口(D1，D2，D3)可视地显示认可文本(ET)。

2.按权利要求1中所要求的转录装置(1)，其中能够对口述文本(GT)进行声音复制，提供的启动装置(14)用来启动显示窗口(D1，D2，D3)作为输入窗口在口述文本(GT)声音复制期间对认可文本(ET)进行编辑，由标记信息(MI)标识的显示窗口(D1，D2，D3)被分配给刚刚进行过声音复制的口述文本(GT)。

3.按权利要求1中所要求的转录装置(1)，其中提供的启动装置(14)用来在口述文本(GT)声音复制时启动显示窗口(D1，D2，D3)的显示，由标记信息(MI)标识的显示窗口(D1，D2，D3)分配给刚刚进行过声音复制的口述文本(GT)。

4.按权利要求1所要求的转录装置(1)，其中转录器(4)用来在转录时确定连接信息，所说的连接信息对每一部分的口述文本(GT)的相关认可文本(ET)加以标识，其中，由于使用了在转录装置(1)中启动的同步型复制，编辑器(8)用于口述文本(GT)的声音复制以及由连接信息标识的相关认可文本(ET)的同步可视标记。

5.按权利要求4中所要求的转录装置(1)，其中提供的启动装置(14)用来启动显示窗口(D1，D2，D3)作为输入窗口以在口述文本(GT)声音复制期间对认可文本(ET)进行编辑，由连接信息标识的显示窗口(D1，D2，D3)被分配给刚刚进行过声音复制的口述文本(GT)。

6.按权利要求1中所要求的转录装置(1)，其中标记信息(MI)由口述命令构成，该口述命令包含在口述文本(GT)中被分配给显示窗口(D1，D2，D3)的口述文本(GT)相应部分的开头和/或结尾。

7.编辑装置(3)，用来编辑由转录装置(1)认可的文本(ET)，其中

-接收装置，用来接收口述文本(GT)以及相关标记信息(MI)，该相关标记信息将部分口述文本(GT)分配给具体的显示窗口(D1，D2，D3)，其还用来接收口述文本(GT)由转录装置(1)认可的文本(ET)，

-存储器，用来存储口述文本(GT)、标记信息(MI)、以及认可文本(ET)，及

8.按权利要求7中所要求的编辑装置(3)，其中能够对口述文本(GT)进行声音复制，提供的启动装置(14)用来启动显示窗口(D1，D2，D3)作为输入窗口以在口述文本(GT)的声音复制期间对认可文本(ET)进行编辑，由标记信息(MI)标识的显示窗口(D1，D2，D3)被分配给刚刚进行过声音复制的口述文本(GT)。

9.按权利要求7中所要求的编辑装置(3)，其中提供的启动装置(14)用来在口述文本(GT)声音复制期间启动显示窗口(D1，D2，D3)的显示，由标记信息(MI)标识的显示窗口(D1，D2，D3)被分配给刚刚进行过声音复制的口述文本(GT)。

10.编辑过程，用来在执行转录过程期间对认可文本(ET)进行编辑，其中执行下述步骤：

-接收口述文本(GT)以及相关标记信息(MI)，相关标记信息(MI)把部分口述文本(GT)分配给具体的显示窗口(D1，D2，D3)；

-在转录过程期间接收口述文本(GT)的认可文本(ET)；

-存储口述文本(GT)、标记信息(MI)、以及认可文本(ET)；

-编辑认可文本(ET)，使得能够按照相关标记信息(MI)在至少两个显示窗口(D1，D2，D3)可视地显示认可文本(ET)。

11.按权利要求10中所要求的编辑过程，其中还执行下述步骤：口述文本(GT)的声音复制，其中启动显示窗口(D1，D2，D3)作为输入窗口以在口述文本(GT)的声音复制期间对认可文本(ET)进行编辑，由标记信息标识的显示窗口(D1，D2，D3)被分配给刚刚进行过声音复制的口述文本(GT)。

12.按权利要求10中所要求的编辑过程，还执行下述步骤：在口述文本(GT)声音复制期间启动显示窗口(D1，D2，D3)的显示，由标记信息(MI)标识的显示窗口(D1，D2，D3)被分配给刚刚进行过声音复制的口述文本(GT)。

13.计算机程序产品，其可以直接装入数字计算机(1)的内部存储器且其含有软件代码节，其中当产品在计算机(1)上运行时，计算机(1)执行按权利要求10中所要求的程序步骤。

14.按权利要求13中所要求的计算机程序产品，所说的产品存储在计算机可读介质上。