[go: up one dir, main page]

CN113241076A - 语音处理方法、装置和电子设备 - Google Patents

语音处理方法、装置和电子设备 Download PDF

Info

Publication number
CN113241076A
CN113241076A CN202110519888.XA CN202110519888A CN113241076A CN 113241076 A CN113241076 A CN 113241076A CN 202110519888 A CN202110519888 A CN 202110519888A CN 113241076 A CN113241076 A CN 113241076A
Authority
CN
China
Prior art keywords
interview
question
interviewer
response
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110519888.XA
Other languages
English (en)
Inventor
刘世杰
徐倩凇
钟信
杨雅雯
程昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202110519888.XA priority Critical patent/CN113241076A/zh
Publication of CN113241076A publication Critical patent/CN113241076A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本公开实施例公开了的语音处理方法、装置和电子设备,在检测到第一面试题目的提问开始指令之后,可以实时将接收到的语音信号转换为文本信息,并可以在检测到第一面试题目的提问结束指令之后,获得与第一面试题目对应的第一对话记录。而通过将第一面试题目提问开始至第一面试题目提问结束期间转换获得的文本信息,获得第一对话记录,通过这种方式,使得面试过程中的任一面试题目均会有一个对应的对话记录,从而使得面试细节可以得以保存。也即,可以准确的保存面试细节。

Description

语音处理方法、装置和电子设备
技术领域
本公开涉及互联网技术领域,尤其涉及一种语音处理方法、装置和电子设备。
背景技术
随着科学技术的发展,面试者与面试官之间可以通过视频系统进行面试,使得面试更加灵活,节约了用户往返与各个公司进行面试时所消耗的通行时间。
现有的视频面试系统与传统面试并无太大差别,也是面试官在面试结束之后,通过回忆面试细节,判断面试者是否与面试工作相匹配。
发明内容
提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开实施例提供了一种语音处理方法、装置和电子设备,可以将面试题目与对话记录进行对应存储,可以将面试过程进行更加细致的保存。
第一方面,本公开实施例提供了一种语音处理方法,包括:响应于检测到针对第一面试题目的开始提问指令,将实时接收到的语音信号转换为文本信息;响应于接收到针对第一面试题目的结束答复指令,根据上述第一面试题目开始提问至结束答复期间转换获得的文本信息,获得与上述第一面试题目对应的第一对话记录。
第二方面,本公开实施例提供了一种语音处理装置,包括:转换单元,用于响应于检测到针对第一面试题目的开始提问指令,将实时接收到的语音信号转换为文本信息;获得单元,用于响应于接收到针对第一面试题目的结束答复指令,根据上述第一面试题目开始提问至结束答复期间转换获得的文本信息,获得与上述第一面试题目对应的第一对话记录。
第三方面,本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面上述的语音处理方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面上述的语音处理方法的步骤。
本公开实施例提供的语音处理方法、装置和电子设备,在检测到第一面试题目的提问开始指令之后,可以实时将接收到的语音信号转换为文本信息,并可以在检测到第一面试题目的提问结束指令之后,获得与第一面试题目对应的第一对话记录。而通过将第一面试题目提问开始至第一面试题目提问结束期间转换获得的文本信息,获得第一对话记录,通过这种方式,使得面试过程中的任一面试题目均会有一个对应的对话记录,从而使得面试细节可以得以保存。也即,可以准确的保存面试细节。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是根据本公开的语音处理方法的一个实施例的流程图;
图2A是根据本公开的语音处理方法的另一个实施例的展示界面示意图;
图2B是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2C是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2D是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2E是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2F是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2G是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2H是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2I是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2J是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2K是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图2L是根据本公开的语音处理方法的又一个实施例的展示界面示意图;图3是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图4是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图5A是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图5B是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图5C是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图6A是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图6B是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图7A是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图7B是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图7C是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图8A是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图8B是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图8C是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图8D是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图9是根据本公开的语音处理方法的又一个实施例的展示界面示意图;
图10是根据本公开的语音处理装置的一个实施例的结构示意图;
图11是本公开的一个实施例的语音处理方法可以应用于其中的示例性系统架构;
图12是根据本公开实施例提供的电子设备的基本结构的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本申请的应用场景可以为视频面试场景,在视频面试场景中,面试者与面试官之间需要可能会进行语音沟通,可以将面试者与面试官之间的沟通过程进行记录,以便后续回顾沟通过程,或者便于其它面试官观看沟通过程中。鉴于此,本申请提供了一种语音处理方法,请参考图1,其示出了根据本公开的语音处理方法的一个实施例的流程。该语音处理方法可以应用于终端设备。如图1所示该语言处理方法,包括以下步骤:
步骤101,响应于检测到针对第一面试题目的开始提问指令,将实时接收到的语音信号转换为文本信息。
作为示例,展示界面可以展示至少一个面试题目,而第一面试题目可以为至少一个面试题目中的任一题目。而至少一个面试题目可以为面试官需要询问面试者的面试题目。
作为示例,在展示界面可以展示提问控件,提问控件与面试题目对应,当提问控件被触发时,此时则可以生成提问开始指令。例如,用户触发了与第一面试题目对应的提问控件,则此时可以确定生成了针对第一面试题目的提问开始指令。
在这里,当检测到第一面试题目的开始提问指令时,可以实时将接收到的语音信号转换为文本信息。而接收到的语音信号可以包括:面试者的语音信号和面试官的语音信号。
为了便于理解,可以如图2A所示,在展示界面展示了多个面试题目,而在每个面试题目的展示区域均设置了一个提问控件,当某个提问控件被触发时,则可以表征面试官输入了针对该面试题目的开始提问指令。如图2A,则可以理解为此时输入了用于指示面试题目C的开始提问指令,相应的,此时面试题目C可以理解为第一面试题目。
步骤102,响应于接收到针对第一面试题目的结束答复指令,根据第一面试题目开始提问至结束答复期间转换获得的文本信息,获得与第一面试题目对应的第一对话记录。
在这里,第一对话记录中包括了与面试者对应的文本信息和与面试官对应的文本信息。换言之,第一对话记录可以反映面试官与面试者针对第一题目的对话过程。
作为示例,当检测到第一面试题目的开始提问指令后,展示界面可以展示结束控件,结束控件也可以与面试题目对应,当结束控件被触发时,此时可以生成结束答复指令。当然,在具体实施方式中,生产答复结束指令的方式还有许多,例如,当用户点击展示界面另一面试题目的提问控件时,也可以表征生成了第一面试题目的结束答复指令,并生成了另一面试题目的开始提问指令。
在这里,第一面试题目开始提问至结束答复期间可以理解为:面试官开始询问面试者第一面试题目至面试者回答完第一面试题目的整个时间段。作为示例,当面试官与面试者针对某一问题在进行语音交互时,可以将这段语音交互与面试题目对应存储。换言之,通过这种方式,可以使得面试官可以利用第一面试题目,获得第一面试题目提问开始至第一面试提问结束期间的对话记录,从而了解第一面试题目的具体对话过程。
在这里,由于第一面试题目为面试过程中的任一面试题目,也即,面试过程中的任一面试题目均会有一个对应的对话记录。换言之,通过这种方式,使得面试官可以便于查看每个面试题目的对话记录,从而可以便于面试官可以更加清晰地回忆面试过程中的面试细节。
可以看出,本申请在检测到第一面试题目的提问开始指令之后,可以实时将接收到的语音信号转换为文本信息,并可以在检测到第一面试题目的提问结束指令之后,获得与第一面试题目对应的第一对话记录。而通过将第一面试题目提问开始至第一面试题目提问结束期间转换获得的文本信息,获得第一对话记录,通过这种方式,使得面试过程中的任一面试题目均会有一个对应的对话记录,从而使得面试细节可以得以保存。也即,可以准确的保存面试细节。
在一些实施例中,在检测到第一面试题目的开始提问指令时,可以展示题目交互页面,而题目交互页面可以显示第一面试题目,响应于接收到语音信号,在题目交互页面显示语音信号对应的文字内容,以及显示与语音信号对应的人员信息。
作为示例,可以在展示页面的第一交互页面内显示至少一个题目,而题目交互页面可以理解为第一交互页面的二级页面。
为了便于理解,可以结合图2A和图2B进行举例说明,在展示界面可以展示多个面试题目,而在每个面试题目的展示区域均设置了一个提问控件,当某个提问控件被触发时,则可以表征针对该面试题目执行了触发操作。如图2A所示,则可以理解为针对面试题目C执行了触发操作;之后,展示界面可以如图2B所示,也即,可以展示题目交互页面201,并在题目交互页面201中展示面试题目C,以及展示文字内容和人员信息。例如,图2B中的人员标识A用于指示面试官,而人员标识B用于指示面试者,则人员标识A下面的矩形框202中的文字内容与面试官对应(可以理解为根据面试官的语音信息转换获得的文字内容),而人员标识B下面的矩形框203中的文字内容与面试者对应(可以理解为根据面试者的语音信息转换获得的文字内容)。
也即,题目交互界面的展示内容,可以清晰地反映面试官与面试者针对第一题目的对话过程。
可以看出,当检测到针对面试题目的触发操作(针对某个面试题目的开始提问指令)之后,可以显示题目交互页面,以及在题目交互页面显示该面试题目,并在接收到语音信号之后,在题目交互页面显示语言信号对应的文字内容,以及显示语言信号对应的用户信息。而通过这种显示方式,使得可以通过观看题目交互页面的显示内容,清晰获知某个面试题目的面试详细过程。而通过将接收到的语音信息转换为文字内容进行显示,也可以使得面试题目的面试过程可以被详细记录。
在一些实施例中,题目交互界面可以包括第一记录区域和第二记录区域,第一记录区域可以用于显示与语音信号对应的文字内容,以及显示与语音信号对应的人员信息,第二记录区域可以包括第一输入组件和/或第二输入组件。
在这里,第一输入组件可以用于接收针对题目信号的评价信息,第二输入组件可以用于接收针对题目信息的打分信息。
作为示例,在面试过程中,面试官可以根据面试者针对面试题目的回答,确定面试者的某些能力(可以理解为,面试者的优点和缺点),从而可以利用第一输入组件输入针对面试者的评价信息。也即,展示第一输入控件可以便于面试者输入针对面试者针对该题目信息的评价信息。例如,题目交互页面所展示的题目信息可以反应出面试者的‘带队能力’、‘协助能力’等,则输入的评价信息可以包括:能带团队攻坚、执行能力强等。
作为示例,在面试过程中,面试官可以根据面试者针对面试题目的回答,为面试者针对这道面试题目进行打分,而分数可以更为直接的反映出面试者的针对该面试题目的作答情况。例如,当分数较高,则可以表征面试官认为面试者回答得较为完美,若分数较低,则可以表征面试官认为面试者的回答较差。
可以看出,题目交互页面包括第一记录区域和第二记录区域,可以使得题目交互页面不仅可以展示详细面试细节,面试官还可以对面试者进行点评和打分,也即,可以便于面试官在面试过程中记录面试者的特点。也就可以使得在针对这道题目的面试结束之后,面试官可以根据评价信息和/或打分信息快速获知面试者针对该面试题目的大体面试情况,并可以了解面试者的一些特点,加深对面试者的面试印象。
为了便于理解,可以结合如图2C-图2E进行说明,在图2C-图2E中,虚线框204可以理解为第一记录区域,而虚线框205可以理解为第二记录区域。如图2C所示,在题目交互页面的第二记录区域205可以包括第一输入组件2051,继续如图2D所示,题目交互页面的第二记录区域205还可以包括第二输入组件2052,继续如图2E所示,题目交互页面的第二记录区域205还可以同时包括第一输入组件2051和第二输入组件2052。而可以利用第一输入组件2051输入评价信息,并可以利用第二输入组件2052输入打分信息。可以看出,通过将题目交互页面划分为第一记录区域和第二记录区域,使得第一记录区域可以展示对语音信号转换获得的文字内容,第二记录区域可以展示面试官输入的文本内容,从而可以更为细致的展示面试过程,可以便于面试官更好的了解面试者。
在一些实施例中,响应于在第二记录区域的第一输入组件接收到输入指令时,扩展与第一输入组件对应的输入区域。
在这里,扩展与第一输入组件对应的输入区域,可以便于面试官的输入评价信息,以及便于面试官查看已输入的评价信息。
作为示例,当在输入区域执行诸如点击操作、长按操作等操作时,可以表征第一输入组件接收到输入指令。当然,具体生成输入指令的方式有很多,仅需根据实际情况进行合理选取即可。
为了便于理解,请参阅图2F-图2G,当在输入区域206执行点击操作时,可以理解为第一输入组件接收到输入指令,此时,则可以将输入区域206进行扩展,如图2G所示。
在一些实施例中,响应于接收到返回第一交互页面的操作指令,显示第一交互页面。
在这里,第一交互页面用于显示面试题目和与面试题目对应的交互标识。
作为示例,面试官可以对第一交互页面显示的面试题目执行触发操作,从而生成针对某个面试题目的开始提问指令。
在这里,交互标识用于指示面试题目的交互进展。作为示例,通过展示的交互标识,可以指示展示的那些面试题目已经考查,而那些面试题目还没有考查(也可以理解为:面试者已经回答了那些面试问题,以及还有那些面试问题还没有回答)。
为了便于理解,可以如图2H所示,当接收到返回第一交互页面的操作指令时,可以显示第一交互页面207,并在第一交互页面207中显示题目信息和交互标识。如,交互标识A可以表征该题目信息A已经交互完成了(面试者已经回答了该面试题目),交互标识B可以表征该题目信息B还未进行交互(面试者还未回答该面试题目)。
在一些实施例中,第一交互页面可以包括题目交互页面。也即,题目交互页面可以理解为第一交互页面的二级页面。
在一些实施例中,在接收到返回第一交互页面的操作指令之前,此时,响应于在显示题目交互页面过程中接收到语音信号,则确定第一交互页面内包括语音交互标识。
在这里,语音交互标识用于指示当前题目的记录状态。
作为示例,在显示题目交互页面的过程中,接收到了语音信号,然后在接收到返回第一交互页面的操作指令后,在第一交互页面内将显示语言交互标识,以指示该面试题目对应有对话记录。也即,展示语音交互标识,可以使得面试官获知,面试者针对该题目信息进行的作答已被记录。
为了便于理解,可以参阅图2I,若在返回第一交互页面之前,接收到了语音信号,当返回第一交互页面之后,在第一交互页面可以展示的圆形框208可以理解为语音交互标识,此时,可以表征有针对面试题目A的对话记录。
在一些实施例中,在接收到返回第一交互页面的操作指令之前,此时,响应于在显示题目交互页面过程中第一输入组件接收到评价信息,则确定第一交互页面包括面试题目关联页面。
在这里,面试题目关联页面用于展示评价信息。
作为示例,当在显示题目交互页面的过程中,第一输入组件接收到了评价信息,则可以表征在面试官与面试者针对该面试题目进行交互的过程中,面试官输入了评价信息。当返回第一交互页面之后,则可以将评价信息进行展示,以便面试官可以在第一交互页面浏览面试者针对某个题目的作答情况。
为了便于理解,可以如图2J所示,若显示题目交互页面的过程中,第一输入组件接收到了评价信息,则返回第一交互页面进行显示时,第一交互页面可以包括面试题目关联页面209,面试题目关联页面209可以展示评论信息。
在一些实施例中,在接收到返回第一交互页面的操作指令之前,此时,响应于在显示题目交互页面过程中第二输入组件接收到打分信息,则确定第一交互页面包括面试题目关联页面。
在这里,面试题目关联页面用于展示打分信息。
作为示例,当返回第一交互页面后,展示打分信息,使得面试官可以在第一交互页面浏览面试者针对面试题目的作答情况,从而可以使得面试官快速了解面试者针对每道题目的作答情况。
为了便于理解,可以如图2K所示,第一交互页面可以包括面试题目关联页面209,面试题目关联页面209可以展示打分信息。
在一些实施例中,当第一输入组件接收到评价信息,且第二输入组件接收到打分信息时,面试题目关联页面还可以同时展示评价信息和得分信息。
在一些实施例中,当题目交互页面展示面试题目时,若还未接收到语音信号,此时,题目交互页面可以展示等待接收语音信号的标识。作为示例,可以如图2L,此时,题目交互页面206可以展示面试者标识210,以及‘省略号’;也即,虚线框211中展示的标识可以理解为等待接收语音信号的标识。
在一些实施例中,响应于确定展示第一对话记录,根据第一对话记录对应的至少一个用户,对第一对话记录进行分段展示。
在这里,当面试官需要查看整个面试过程时,可以展示第一对话记录,或者,面试官也可以仅查看第一面试题目的面试过程,此时,也可以展示第一对话记录。作为示例,面试官可以输入针对第一面试题目的面试记录查看指令,从而可以查看第一面试题目和第一对话记录,也即,面试官通过输入针对第一面试题目的面试记录查看指令,可以获知第一面试题目开始至第一面试题目结束期间的面试细节,当然,面试官也可以输入针对整个面试过程的面试记录查看指令,此时可以查看各面试题目与对应的对话记录,此时,也就展示了第一对话记录。
在这里,由于第一面试题目为整个面试过程中的任一面试题目,相应的,第一对话记录则可以为整个面试过程中的任一对话记录。
作为示例,第一对话记录中的某些内容与面试官对应(某些内容是面试官说的话通过转换获得的),而某些内容与面试者对应。因此,为了使用户获知第一对话记录中,与面试者对应的内容,以及与面试官对应的内容,可以根据用户的不同,将第一对话记录中的文本信息进行分段展示。
作为示例,执行主体可以有录音装置,执行主体的录音装置接收到的语音信号所转换获得的文本信息可以理解为与面试官对应的文本信息,而执行主体接收到的语音信号所转换获得的文本信息可以理解为与面试者对应的文本信息。
为了便于理解,可以参阅图3,当展示第一对话记录时,可以根据用户的不同,将第一对话记录分段展示。可以看出,用户A(面试者)对应了部分对话记录,而用户B(面试官)也对应了部分对话记录。
而通过这种方式,使得面试官在浏览第一面试记录时,可以轻松获知哪些内容是面试官所说的,哪些内容是面试者所说的,从而使得面试过程体现得更为清晰,也可以便于面试官更好的了解面试过程。
在一些实施例中,响应于确定第一面试题目开始提问至第一面试题目结束答复期间接收到同一用户的至少一段语音信号,此时,可以获得与该用户对应的至少一段文本信息;并可以将获得的文本信息进行拼接并展示。
作为示例,在第一面试题目开始提问至第一面试题目结束答复期间,面试官可能与面试者进行了多次互动,因此,此时可能接收到了面试者的多段语音信号,相应的,也可能接收到了面试官的多段语音信号。
作为示例,面试者每一次与面试官互动可以理解为产生了一段语音信号。
作为示例,面试者每说一句话也可以理解为一段语音信号。
在这里,将获得的文本信息进行拼接并展示可以理解为:将面试者/面试官在第一面试题目的面试过程中所说的话,拼接成一段进行展示。
通过这种方式,可以使得面试官在浏览第一对话记录时,可以清晰获知与面试者对应的文本信息,以及与面试官对应的文本信息,可以将获得的文本信息进行拼接,也即,面试者或者面试官虽然说了多段话,但是,进行了拼接展示。也就可以使得展示的对话记录更加整洁,便于面试官回忆面试过程。
在一些实施例中,可以根据至少一段语音信号中每段语音信号对应的时间段;确定是否对获得的文本信息进行分段展示。
作为示例,当用户(面试者或面试官)说完一段语音信号,间隔较长时间又说了一段语音信号,则可以表明这两段语音信号对应的文本信息的关联度可能不高,此时,则可以将这两段语音信号对应的文本信息进行分段展示。例如,面试者对应了3段语音信号,第一段语音信号对应的时间段为10:00-10:02,第二段语音信号对应的时间段为10:05-10:06,第三段语音信号对应的时间段为10:06-10:07;可以看出,用户说完第一段语音信号,过来3分钟再说第二段语音信号,此时,可以将第一段语音信号对应的文本信息与第一段语音信号对应的文本信息进行分段展示。
而通过这种方式,可以使得面试官清晰获知那些是用户中途没有停顿,或者仅进行了短暂停顿所说的内容。
在一些实施例中,可以根据拼接后的文本信息中的句子数量,确定是否对拼接后的文本信息进行分段展示。
作为示例,当拼接之后的句子数量过多时,则可能会影响面试官的浏览体验,因此,在拼接后的文本信息中的句子数量大于预设数量阈值之后,可以将拼接后的文本信息进行分段展示。
而通过这种方式,可以使得对话记录看起来更加规整,从而可以便于面试官更快的浏览面试记录。
在一些实施例中,在第一面试题目开始提问至结束答复期间,展示界面展示第一点评输入框,此时,可以确定第一点评输入框接收到文本内容,将第一点评输入框内的文本内容确定为第一面试题目的第一点评记录。
在这里,面试官在第一面试题目的面试过程中,可以针对面试者的面试情况而输入的文本内容。
作为示例,第一点评记录可以用于表征面试者在面试第一面试题目的面试情况。例如,第一点评记录可以包括:能带团队攻坚、执行能力强等。
作为示例,面试官在第一面试题目开始提问至结束答复期间,可以根据面试者针对第一面试题目的回答,确定面试者的某些能力(可以理解为,面试者的优点和缺点),并可以将其记录在评论输入框内,从而生成第一点评记录。此时,展示第一点评记录,使得在第一面试题目面试结束之后,面试官可以清晰获知面试者的能力。
为了便于理解,如图4所示,在第一面试题目开始提问至结束答复期间,可以展示第一点评输入框401,从而便于面试官输入文本内容。并可以在第一面试题目结束答复之后,根据输入的文本内容,生成第一点评记录。
通过这种方式,可以使得在面试题目的面试过程中,面试官还可以输入针对面试者的评价内容,从而使得面试结束后,面试官仅需浏览点评记录即可获知面试者的大体情况。
在一些实施例中,在第一面试题目结束答复之后,还可以将第一面试题目和第一点评记录进行展示,以加深面试官对于面试者的印象。
在一些实施例中,响应于检测到针对第二面试题目的结束答复指令,展示总结评语输入控件,并可以在响应于检测到针对总结评语输入控件的触发操作,展示面试总结评语输入框;之后可以将面试总结评语输入框内输入的文本内容确定为总结评语,并将总结评语进行展示。
在这里,第二面试题目为面试的最后一个面试题目。
作为示例,第一面试题目为面试过程中的任一题目,第二面试题目为面试过程的最后一个面试题目,因此,在某些场景下,第一面试题目和第二面试题目可能指示同一题目。例如,一共有5个面试题目,当第一面试题目指示第5个面试题目时,第二面试题目与第一面试题目相同。
作为示例,当面试者将面试题目全部问完之后,可以展示面试总结评语输入框,从而可以便于面试官输入面试者的总结评语。例如,面试者很符合面试工作、面试者的能力不足等。
为了便于理解,可以如图5A-图5B所示,当检测到针对第二面试题目的结束答复指令时,可以展示总结评语输入控件501,面试官可以对总结评语输入控件510执行触发操作,之后,展示界面可以如图5B所示,此时展示界面可以展示面试总结评语输入框502。
在一些实施例中,在展示面试总结评语输入框时,还可以展示各面试题目和与面试题目对应的点评记录,从而可以辅助面试官可以更加准确的输入针对面试者的总结评语。
作为示例,面试官通过输入总结评语,可以使得后续可以在多个候选面试者中快速筛选出更符合面试工作实际需求的面试者。
在一些实施例中,响应于检测到针对第二面试题目的结束答复指令,展示至少一个得分等级;并可以根据从至少一个得分等级中选取出的得分等级,确定面试得分。
在这里,第二面试题目可以为面试的最后一个面试题目。
在这里,至少一个得分等级可以反映面试者的总体面试情况,例如,得分等级可以为:1级、2级、3级、4级、5级;若选取出得分等级为3级或者3级以上,则可以表征面试者与面试工作较为匹配,此时可以确定面试得分为60分以上,若选取出的得分等级在3级以下,则可以表征面试者与面试工作可能不匹配,此时面试得分为60分以下。需要说明的是,得分等级的设置方式有很多,仅需根据实际情况进行合理设定即可。例如,还可以将得分等级设置为A级、A-级、A+级、B级、C级等。相应的,不同等级对应的面试得分也可以根据实际需要进行设定。仅需使得可以通过展示的得分等级,确定面试者的面试得分即可。
在这里,展示至少一个得分等级,可以使得面试官仅需根据面试情况,选择一个得分等级即可获得面试者的面试得分,从而可以提升确定面试者的面试得分的效率。
为了便于理解,可以如图5C所示,当检测到针对第二面试题目的结束答复指令时,可以展示至少一个得分等级(虚线框503中每一个椭圆均可以表征一个得分等级),而用户仅需根据面试情况选择合理的得分等级即可。而通过这种方式,可以较为高效的确定面试者的面试得分。
在一些实施例中,响应于检测到面试结束指令,展示各面试题目和与面试题目对应的点评记录。
在这里,当检测到面试结束指令时,展示各面试题目和与面试题目对应的点评记录,从而可以便于面试官通过展示内容,回忆起面试整个过程,加深面试官针对面试者的印象。
为了便于理解,可以如图6A所示,当检测到面试结束指令时,展示界面可以展示各个面试题目和每个面试题目对应的点评记录。从而使得面试官可以再一次回顾面试的大体过程,以及面试者的一些优缺点,加深对面试者的印象。
在一些实施例中,展示界面还可以展示与每个面试题目对应的查看控件,此时,响应于检测到针对目标查看控件的触发操作,展示目标面试题目和与目标面试题目对应的目标对话记录。
在这里,目标查看控件与目标面试题目对应。
作为示例,为每个面试题目设置对应的查看控件,可以便于面试官在查看面试题目和对应的点评记录的过程中,可以便于查看面试题目与对话记录;并可以复查点评记录是否正确。例如,面试官在看某个面试题目以及对应的点评记录时,可能认为点评记录中某些地方描述得不够准确,此时,面试官则可能需要回顾面试的过程,以确定该处描述是否恰当。
在一些实施例中,可以仅为存在对应对话记录的面试题目设置查看控件,从而可以便于面试官了解哪些面试题目可以查看对话记录。
为了便于理解,可以结合6A-6B进行说明,如图6A所示,当用户需要查看面试题目C的对话记录时,则可以对面试题目C对应的查看控件执行触发操作。之后,展示界面即可展示面试题目C对应的对话记录C,此时展示界面可以如图6B所示。而通过这种方式,可以便于面试官查看面试者针对面试题目C的回答过程。
可以看出,通过为每个面试题目设置对应的查看控件,可以使得面试官可以便于查看每个面试题目对应对话记录,从而便于面试官更好的了解面试过程。
在一些实施例中,响应于检测到点评记录修改指令,根据点评记录修改指令的指示,修改展示的点评记录。
作为示例,面试官在浏览各面试题目以及各面试题目对应的点评记录时,面试官可能会发现某些点评记录并不准确,例如,某个点评记录中记载了‘带队能力强’;而面试题目与‘带队能力’没有关联关系;此时可以输入点评记录修改指令,修改该点评记录。再如,面试官在查看面试过程记录的过程中,发现了面试者的一些其它的特点(例如,团队感强等),此时也可以将点评记录进行修改。
在这里,点评记录修改指令可以针对任一点评记录,也可以同时针对多个点评记录。例如,多个点评记录中均记载了‘热情’,若点评记录修改指令指示删除点评记录中所记载的‘热情’;则可以将多个点评记录中记载的‘热情’均进行删除。
可以看出,当面试官需要修改点评记录时,仅需输入点评记录修改指令即可,从而使得点评记录可以更加准确的反映面试者的面试情况。
在一些实施例中,响应于接收到总结评语修改指令,可以根据总结评语修改指令的指示,修改总结评语。
作为示例,当面试官在浏览各面试题目以及各面试题目对应的点评记录时,可以认为针对面试者的某些总结评语并不准确,从而可以输入总结评语修改指令,修改总结评语,以使总结评语也可以更加准确的反映面试者的总体情况。
在一些实施例中,当修改之后,展示界面可以展示修改查看控件,通过触发修改查看控件,可以查看修改记录。例如,修改时间、修改内容、利用具体哪个用户标识触发修改控件等。
在一些实施例中,在第一面试题目开始提问至结束答复期间,展示至少一个题目得分等级,此时,响应于检测到针对至少一个题目得分等级中第一题目得分等级的选取操作,根据第一题目得分等级,确定第一面试题目的题目得分。
在这里,展示至少一个题目得分等级,可以便于面试官为第一面试题目进行打分。
为了便于理解,可以如图7A所示,在第一面试题目开始提问至结束答复期间,可以展示至少一个题目得分等级(面试题目A下发的每一个小矩形框均可以看作一个题目得分等级),从而可以便于面试官针对第一面试题目的回答,确定面试者针对第一面试题目的题目得分。如图7A所示,全黑的小矩形框则可以理解为用户选取出的得分等级。
在这里,题目得分可以更加直观的反应面试者针对面试题目的回答情况。也即,后续面试官可以根据第一面试题目的题目得分,获知面试者对第一题目的回答情况。例如,当题目得分较高,则可以表征面试者针对这道题目回答较好,当题目得分较低,可以表征面试者针对这道题目回答较差。
在一些实施例中,当每一道面试题提问开始至提问结束期间,都可以展示至少一个题目得分等级,从而使得面试官可以便于对每道面试题目进行打分,使得后续面试官可以根据面试题目的得分,获知面试者那些面试题目回答得较好。
在一些实施例中,响应于检测到面试结束指令,展示各面试题目和与面试题目对应的题目得分。
在这里,在检测到面试结束指令时,可以表征面试已经结束了,此时展示面试题目和与每个面试题目对应的题目得分,可以使得面试官获知在面试过程中,面试者针对那些面试题目回答较好,从而可以使得在面试结束之后,面试官可以通过展示的面试题目和每个面试题目对应的题目得分进一步加深对面试者的了解。
为了便于理解,可以如图7B所示,当面试结束后,可以展示各个面试题目以及对应的题目得分,从而即可便于面试官快速或者面试者那些面试题目回答较好,而那些面试题目回答较差。可以看出,用户针对面试题目C回答较好,而针对面试题目B回答较差。
在一些实施例中,响应于检测到面试结束指令,展示总结评语和面试得分。
在这里,总结评语可以用于指示面试者的面试总体情况,面试得分可以更加直观的反映面试者是否可以胜任面试工作。也即,通过展示面试得分和总结评语,可以使得面试官可以快速了解面试情况,且可以更为准确的判断面试者是否可以胜任面试工作。
在一些实施例中,响应于检测到面试结束指令,展示各面试题目和与面试题目对应的题目得分,以及展示总结评语和面试得分。
为了便于理解,可以如图7C所示,在展示界面不仅展示了面试题目和每个面试题目对应的题目得分,还展示了总结评语701和面试得分702。使得面试官可以清晰获知面试总体情况,以及各面试题目的大体情况,从而可以便于面试官对面试者进行快速筛选。
在一些实施例中,可以响应于检测到面试结束指令,展示面试记录查看控件;还可以响应于检测到针对面试记录查看控件的触发操作,展示各面试题目和与面试题目对应的对话记录。
在这里,当检测到面试结束指令时,可以展示面试记录查看控件,而当检测到针对面试记录查看控件的触发操作时,可以表征面试官可能需要查看整个面试过程,也即,查看面试官与面试者的对话记录,因此,此时可以展示个面试题目与各面试题目对应的对话记录,从而使得面试官可以了解详细的面试过程。
为了便于理解,可以如图8A-8B所示,如图8A所示,当检测到面试结束指令时,可以展示面试记录查看控件801,当检测到针对面试记录查看控件801的触发操作后,此时展示界面的展示图像可以如图8B所示,则可以展示各面试题目以及对应的对话记录。
在一些实施例中,响应于检测到针对面试过程的面试记录删除指令,删除各面试题目和与面试题目对应的对话记录。
作为示例,当面试结束之后,某个面试者已经确定与面试工作不匹配了,为了减少对存储空间的占用,可以输入面试记录删除指令,以删除面试题目和与各面试题目对应的对话记录。
在一些实施例中,当需要删除面试记录时,面试官可以对展示界面展示的删除控件执行触发操作,此时,展示界面可以出现提示信息页面,在提示信息页面中可以显示确认删除控件、拒绝删除控件和提示信息(用于提醒用户,面试记录删除之后,不可以进行恢复)。若面试官对确认删除控件执行了触发操作,则可以理解为,此时面试官需要将该面试题目和对应的对话记录进行删除。
为了便于理解,可以如图8C-8D所示,在展示界面展示了面试题目和对话记录,展示界面还展示了删除控件802,此时,可以触发删除控件802,之后,展示界面即可如图8D所示,也即可以显示提示信息页面803,在提示信息页面中可以显示提示信息、确认删除控件、拒绝删除控件。若用户对确认删除控件执行触发操作,则可以直接将面试题目A和相应的对话记录A进行删除。
在一些实施例中,当开始面试时,展示界面还可以展示用于开启语音转文字的标识,以提醒面试工作者,此时所说的话,可以转换为文本信息。
为了便于理解,可以如图9所示,当开始面试时,可以展示标识A,标识A用于指示此时已经开启了语音转文字功能。
在一些实施例中,还可以停止或者暂停语音转文字功能,例如,当执行主体的处理压力较大时,为了保证通话质量,可以暂停语音转文字的功能。又如,当面试官与面试者在讨论较为敏感的话题(例如,面试者的家庭情况等)时,可以暂停语音转文字的功能,也即,可以不将面试者的具体身份信息进行保存,以维护面试者的隐私。
进一步参考图10,作为对上述各图所示方法的实现,本公开提供了一种语音处理装置的一个实施例,该装置实施例与图1所示的语音处理方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图10所示,本实施例的语音处理装置包括:转换单元1001,用于响应于检测到针对第一面试题目的开始提问指令,将实时接收到的语音信号转换为文本信息;获得单元1002,用于响应于接收到针对第一面试题目的结束答复指令,根据上述第一面试题目开始提问至结束答复期间转换获得的文本信息,获得与上述第一面试题目对应的第一对话记录。
在一些实施例中,上述装置还包括:展示单元1003,用于响应于确定展示第一对话记录,根据上述第一对话记录对应的至少一个用户,对上述第一对话记录进行分段展示。
在一些实施例中,上述展示单元1003还具体用于:响应于确定上述第一面试题目开始提问至第一面试题目结束答复期间接收到同一用户的至少一段语音信号,获得与该用户对应的至少一段文本信息;将获得的文本信息进行拼接并展示。
在一些实施例中,上述装置还包括:确定单元1004,用于根据上述至少一段语音信号中每段语音信号对应的时间段,确定是否对获得的文本信息进行分段展示。
在一些实施例中,上述确定单元1004具体还用于:根据拼接后的文本信息中的句子数量,确定是否对拼接后的文本内容进行分段展示。
在一些实施例中,在上述第一面试题目开始提问至结束答复期间,展示界面展示第一点评输入框,以及,上述确定单元1004具体还用于:响应于确定上述第一点评输入框接收到文本内容,将上述第一点评输入框内的文本内容确定为上述第一面试题目的第一点评记录。
在一些实施例中,上述展示单元1003还具体用于:响应于检测到针对第二面试题目的结束答复指令,展示总结评语输入控件,其中,上述第二面试题目为面试的最后一个面试题目;响应于检测到针对上述总结评语输入控件的触发操作,展示面试总结评语输入框;将上述面试总结评语输入框内输入的文本内容确定为总结评语,并将上述总结评语进行展示。
在一些实施例中,上述确定单元1004具体还用于:响应于检测到针对第二面试题目的结束答复指令,展示至少一个得分等级,其中,上述第二面试题目为面试的最后一个面试题目;根据从上述至少一个得分等级中选取出的得分等级,确定面试得分。
在一些实施例中,上述展示单元1003还具体用于:响应于检测到面试结束指令,展示各面试题目和与面试题目对应的点评记录。
在一些实施例中,展示界面还展示与每个面试题目对应的查看控件,以及,上述展示单元1003还具体用于:响应于检测到针对目标查看控件的触发操作,展示目标面试题目和与上述目标面试题目对应的目标对话记录,其中,上述目标查看控件与目标面试题目对应。
在一些实施例中,上述装置还包括:修改删除单元1005,用于响应于检测到点评记录修改指令,根据上述点评记录修改指令的指示修改展示的点评记录。
在一些实施例中,在上述第一面试题目开始提问至结束答复期间,展示至少一个题目得分等级,以及,上述确定单元1004具体还用于:响应于检测到针对上述至少一个题目得分等级中第一题目得分等级的选取操作,根据上述第一题目得分等级,确定上述第一面试题目的题目得分。
在一些实施例中,上述展示单元1003还具体用于:响应于检测到面试结束指令,展示各面试题目和与面试题目对应的面试题目得分。
在一些实施例中,上述展示单元1003还具体用于:响应于检测到面试结束指令,展示总结评语和面试得分。
在一些实施例中,上述展示单元1003还具体用于:响应于检测到面试结束指令,展示各面试题目和与面试题目对应的题目得分,以及展示总结评语和面试得分。
在一些实施例中,上述展示单元1003还具体用于:响应于检测到面试结束指令,展示面试记录查看控件;响应于检测到针对上述面试记录查看控件的触发操作,展示各面试题目和与面试题目对应的对话记录。
在一些实施例中,上述修改删除单元1005具体还用于:响应于确定展示界面展示各面试题目和与面试题目对应的对话记录,展示删除控件;响应于检测到针对删除控件的触发操作,删除各面试题目和与面试题目对应的对话记录。
请参考图11,图11示出了本公开的一个实施例的语音处理方法可以应用于其中的示例性系统架构。
如图11所示,系统架构可以包括终端设备1101、1102、1103,网络1104,服务器1105。网络1104可以用以在终端设备1101、1102、1103和服务器1105之间提供通信链路的介质。网络1104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备1101、1102、1103可以通过网络1104与服务器1105交互,以接收或发送消息等。终端设备1101、1102、1103上可以安装有各种客户端应用,例如网页浏览器应用、搜索类应用、新闻资讯类应用。终端设备1101、1102、1103中的客户端应用可以接收用户的指令,并根据用户的指令完成相应的功能,例如根据用户的指令在信息中添加相应信息。
终端设备1101、1102、1103可以是硬件,也可以是软件。当终端设备1101、1102、1103为硬件时,可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备1101、1102、1103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器1105可以是提供各种服务的服务器,例如接收终端设备1101、1102、1103发送的信息获取请求,根据信息获取请求通过各种方式获取信息获取请求对应的展示信息。并展示信息的相关数据发送给终端设备1101、1102、1103。
需要说明的是,本公开实施例所提供的信息处理方法可以由终端设备执行,相应地,语音处理装置可以设置在终端设备1101、1102、1103中。此外,本公开实施例所提供的信息处理方法还可以由服务器1105执行,相应地,信息处理装置可以设置于服务器1105中。
应该理解,图11中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图12,其示出了适于用来实现本公开实施例的电子设备(例如图11中的终端设备或服务器)的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图12所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储装置1108加载到随机访问存储器(RAM)1203中的程序而执行各种适当的动作和处理。在RAM 1203中,还存储有电子设备1200操作所需的各种程序和数据。处理装置1201、ROM1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
通常,以下装置可以连接至I/O接口1205:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1206;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1207;包括例如磁带、硬盘等的存储装置1208;以及通信装置1209。通信装置1209可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图12示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1209从网络上被下载和安装,或者从存储装置1208被安装,或者从ROM1202被安装。在该计算机程序被处理装置1201执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:响应于检测到针对第一面试题目的开始提问指令,将实时接收到的语音信号转换为文本信息;响应于接收到针对第一面试题目的结束答复指令,根据上述第一面试题目开始提问至结束答复期间转换获得的文本信息,获得与上述第一面试题目对应的第一对话记录。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,转换单元1001还可以被描述为“将实时接收到的语音信号转换为文本信息的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (20)

1.一种语音处理方法,其特征在于,包括:
响应于检测到针对第一面试题目的开始提问指令,将实时接收到的语音信号转换为文本信息;
响应于接收到针对第一面试题目的结束答复指令,根据所述第一面试题目开始提问至结束答复期间转换获得的文本信息,获得与所述第一面试题目对应的第一对话记录。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于确定展示第一对话记录,根据所述第一对话记录对应的至少一个用户,对所述第一对话记录进行分段展示。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于确定所述第一面试题目开始提问至第一面试题目结束答复期间接收到同一用户的至少一段语音信号,获得与该用户对应的至少一段文本信息;
将获得的文本信息进行拼接并展示。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述至少一段语音信号中每段语音信号对应的时间段,确定是否对获得的文本信息进行分段展示。
5.根据权利要求3所述的方法,其特征在于,所述将获得的文本内容进行拼接并展示,包括:
根据拼接后的文本信息中的句子数量,确定是否对拼接后的文本内容进行分段展示。
6.根据权利要求1所述的方法,其特征在于,在所述第一面试题目开始提问至结束答复期间,展示界面展示第一点评输入框;以及
所述方法还包括:
响应于确定所述第一点评输入框接收到文本内容,将所述第一点评输入框内的文本内容确定为所述第一面试题目的第一点评记录。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于检测到针对第二面试题目的结束答复指令,展示总结评语输入控件,其中,所述第二面试题目为面试的最后一个面试题目;
响应于检测到针对所述总结评语输入控件的触发操作,展示面试总结评语输入框;
将所述面试总结评语输入框内输入的文本内容确定为总结评语,并将所述总结评语进行展示。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于检测到针对第二面试题目的结束答复指令,展示至少一个得分等级,其中,所述第二面试题目为面试的最后一个面试题目;
根据从所述至少一个得分等级中选取出的得分等级,确定面试得分。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于检测到面试结束指令,展示各面试题目和与面试题目对应的点评记录。
10.根据权利要求9所述的方法,其特征在于,展示界面还展示与每个面试题目对应的查看控件;以及
所述方法还包括:
响应于检测到针对目标查看控件的触发操作,展示目标面试题目和与所述目标面试题目对应的目标对话记录,其中,所述目标查看控件与目标面试题目对应。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
响应于检测到点评记录修改指令,根据所述点评记录修改指令的指示修改展示的点评记录。
12.根据权利要求1所述的方法,其特征在于,在所述第一面试题目开始提问至结束答复期间,展示至少一个题目得分等级;以及
所述方法还包括:
响应于检测到针对所述至少一个题目得分等级中第一题目得分等级的选取操作,根据所述第一题目得分等级,确定所述第一面试题目的题目得分。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
响应于检测到面试结束指令,展示各面试题目和与面试题目对应的面试题目得分。
14.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于检测到面试结束指令,展示总结评语和面试得分。
15.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于检测到面试结束指令,展示各面试题目和与面试题目对应的题目得分,以及展示总结评语和面试得分。
16.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于检测到面试结束指令,展示面试记录查看控件;
响应于检测到针对所述面试记录查看控件的触发操作,展示各面试题目和与面试题目对应的对话记录。
17.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于确定展示界面展示各面试题目和与面试题目对应的对话记录,展示删除控件;
响应于检测到针对删除控件的触发操作,删除各面试题目和与面试题目对应的对话记录。
18.一种语音处理装置,其特征在于,包括:
转换单元,用于响应于检测到针对第一面试题目的开始提问指令,将实时接收到的语音信号转换为文本信息;
获得单元,用于响应于接收到针对第一面试题目的结束答复指令,根据所述第一面试题目开始提问至结束答复期间转换获得的文本信息,获得与所述第一面试题目对应的第一对话记录。
19.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-17中任一所述的方法。
20.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-17中任一所述的方法。
CN202110519888.XA 2021-05-12 2021-05-12 语音处理方法、装置和电子设备 Pending CN113241076A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110519888.XA CN113241076A (zh) 2021-05-12 2021-05-12 语音处理方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110519888.XA CN113241076A (zh) 2021-05-12 2021-05-12 语音处理方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN113241076A true CN113241076A (zh) 2021-08-10

Family

ID=77133929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110519888.XA Pending CN113241076A (zh) 2021-05-12 2021-05-12 语音处理方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN113241076A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114022124A (zh) * 2021-11-10 2022-02-08 广东省通信产业服务有限公司广州分公司 辅助面试的方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347787A (zh) * 2019-06-12 2019-10-18 平安科技(深圳)有限公司 一种基于ai辅助面试场景的面试方法、装置及终端设备
CN110400119A (zh) * 2019-06-18 2019-11-01 平安科技(深圳)有限公司 基于人工智能的面试方法、装置、计算机设备和存储介质
CN110457432A (zh) * 2019-07-04 2019-11-15 平安科技(深圳)有限公司 面试评分方法、装置、设备及存储介质
CN111126553A (zh) * 2019-12-25 2020-05-08 平安银行股份有限公司 智能机器人面试方法、设备、存储介质及装置
CN112686642A (zh) * 2021-01-08 2021-04-20 贝朗医疗(上海)国际贸易有限公司 一种视频面试方法及装置
US20210350329A1 (en) * 2003-02-04 2021-11-11 Nozomu Sahashi Remote interview exam system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210350329A1 (en) * 2003-02-04 2021-11-11 Nozomu Sahashi Remote interview exam system
CN110347787A (zh) * 2019-06-12 2019-10-18 平安科技(深圳)有限公司 一种基于ai辅助面试场景的面试方法、装置及终端设备
CN110400119A (zh) * 2019-06-18 2019-11-01 平安科技(深圳)有限公司 基于人工智能的面试方法、装置、计算机设备和存储介质
CN110457432A (zh) * 2019-07-04 2019-11-15 平安科技(深圳)有限公司 面试评分方法、装置、设备及存储介质
CN111126553A (zh) * 2019-12-25 2020-05-08 平安银行股份有限公司 智能机器人面试方法、设备、存储介质及装置
CN112686642A (zh) * 2021-01-08 2021-04-20 贝朗医疗(上海)国际贸易有限公司 一种视频面试方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114022124A (zh) * 2021-11-10 2022-02-08 广东省通信产业服务有限公司广州分公司 辅助面试的方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
WO2022068533A1 (zh) 互动信息处理方法、装置、设备及介质
CN111970577A (zh) 字幕编辑方法、装置和电子设备
WO2023083142A1 (zh) 分句方法、装置、存储介质及电子设备
US20170359393A1 (en) System and Method for Building Contextual Highlights for Conferencing Systems
CN111883107A (zh) 语音合成、特征提取模型训练方法、装置、介质及设备
JP2023522092A (ja) インタラクション記録生成方法、装置、デバイス及び媒体
US20240079002A1 (en) Minutes of meeting processing method and apparatus, device, and medium
EP4276827A1 (en) Speech similarity determination method, device and program product
CN111897976A (zh) 一种虚拟形象合成方法、装置、电子设备及存储介质
US12314541B2 (en) Interaction information processing method and apparatus, electronic device and storage medium
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
CN113223496A (zh) 一种语音技能测试方法、装置及设备
CN110379406B (zh) 语音评论转换方法、系统、介质和电子设备
CN110460798B (zh) 视频访谈服务处理方法、装置、终端与存储介质
WO2023005729A1 (zh) 语音信息处理方法、装置和电子设备
CN115052188B (zh) 一种视频剪辑方法、装置、设备及介质
CN113241076A (zh) 语音处理方法、装置和电子设备
CN110659387A (zh) 用于提供视频的方法和设备
US20240403562A1 (en) Method and apparatus for extracting to-do item, device, and storage medium
CN114495941A (zh) 单通道音频转文本的方法、装置、电子设备及存储介质
CN115547330A (zh) 基于语音交互的信息展示方法、装置和电子设备
CN111292766B (zh) 用于生成语音样本的方法、装置、电子设备和介质
CN115171122A (zh) 一种点读处理方法、装置、设备及介质
CN113132789A (zh) 一种多媒体的交互方法、装置、设备及介质
US10657202B2 (en) Cognitive presentation system and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination