[go: up one dir, main page]

CN111667831B - 基于管制员指令语义识别的飞机地面引导系统及方法 - Google Patents

基于管制员指令语义识别的飞机地面引导系统及方法 Download PDF

Info

Publication number
CN111667831B
CN111667831B CN202010511326.6A CN202010511326A CN111667831B CN 111667831 B CN111667831 B CN 111667831B CN 202010511326 A CN202010511326 A CN 202010511326A CN 111667831 B CN111667831 B CN 111667831B
Authority
CN
China
Prior art keywords
voice
airport
airplane
aircraft
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010511326.6A
Other languages
English (en)
Other versions
CN111667831A (zh
Inventor
诸葛晶昌
邢志伟
杨新宇
丁宁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Civil Aviation University of China
Original Assignee
Civil Aviation University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Civil Aviation University of China filed Critical Civil Aviation University of China
Priority to CN202010511326.6A priority Critical patent/CN111667831B/zh
Publication of CN111667831A publication Critical patent/CN111667831A/zh
Priority to PCT/CN2021/098174 priority patent/WO2021249285A1/zh
Application granted granted Critical
Publication of CN111667831B publication Critical patent/CN111667831B/zh
Priority to US18/059,967 priority patent/US20230085781A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft
    • G08G5/20Arrangements for acquiring, generating, sharing or displaying traffic information
    • G08G5/22Arrangements for acquiring, generating, sharing or displaying traffic information located on the ground
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft
    • G08G5/20Arrangements for acquiring, generating, sharing or displaying traffic information
    • G08G5/21Arrangements for acquiring, generating, sharing or displaying traffic information located onboard the aircraft
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft
    • G08G5/20Arrangements for acquiring, generating, sharing or displaying traffic information
    • G08G5/26Transmission of traffic-related information between aircraft and ground stations
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft
    • G08G5/50Navigation or guidance aids
    • G08G5/51Navigation or guidance aids for control when on the ground, e.g. taxiing or rolling
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft
    • G08G5/50Navigation or guidance aids
    • G08G5/56Navigation or guidance aids for two or more aircraft
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Remote Sensing (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)
  • Radar, Positioning & Navigation (AREA)

Abstract

一种基于管制员指令语义识别的飞机地面引导系统及方法。系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;本发明优点:可有效杜绝在管制调度过程中因人为因素而造成的事故及其事故征候,大大提高飞机地面运行安全。无需人工操作航空器引导车,可大幅度降低建设成本、改造成本、维护成本和运营成本。适用于机场管制需求,形成高可靠、低故障、经济实用的机场管制决策支持系统和机场飞行区内飞机地面引导系统,实现飞机地面运行安全性的提升。

Description

基于管制员指令语义识别的飞机地面引导系统及方法
技术领域
本发明属于机场管理技术领域,尤其涉及一种基于管制员指令语义识别的飞机地面引导系统及方法。
背景技术
目前,全球民航正处于高速发展阶段,近20年来,最繁忙的国际机场航班数已经翻了一倍,而机场跑道和滑行道数量却没有相应增加,因此各个国家的大型机场特别是枢纽机场将长期处于高负荷的运行状态,这将产生机场运行的众多问题,尤其增加了机场对飞机地面滑行引导的压力。飞机在机场滑行区和跑道行驶时,一般采用航空器引导车或者是高级场面活动引导控制系统对飞机进行地面引导,前者为在飞机起飞前和降落后利用航空器引导车对飞机在机场地面滑行进行引导,规定引导车和航空器之间的间隔不应该超过50米;而后者的高级场面活动引导控制系统是一个通过监视、路由计划和引导功能实现对场面飞机管制或控制的综合集成系统。但这两种方法的缺点是人力物力投入大,前者受人为因素及天气因素影响很大;后者建设或者改造时,资金投入太大,尤其是在现有机场,需要对助航灯进行改造,施工难度较大。所以,这两种引导方法在实用性和经济性方面都有欠缺。另外,机场越繁忙,对管制员和航空器调度的要求也愈大,所以管制员和特种车辆驾驶员也愈加地忙碌,相应地也增加了管制员以及相关调度人员的出错率。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于管制员指令语义识别的飞机地面引导系统及方法。
为了达到上述目的,本发明提供的基于管制员指令语义识别的飞机地面引导系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;其中语义识别模块用于采集机场管制席位上的管制员指令和飞行员语音并进行要素信息提取;路径生成及GIS映射模块依据语义识别结果,将管制员指令转换成飞机滑行路径并映射到机场地理信息系统上,进行管制员指令安全性验证后生成与飞机地面运行相关的飞机地面滑行路径图;飞机引导终端模块将飞机的实时位置与既定的滑行路径图展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导。
本发明提供的基于管制员指令语义识别的飞机地面引导方法包括按顺序进行的下列步骤:
(1)构建面向机场安全运行的管制员专用语音库;
基于机场管制工作流程、飞行区相关运行管理标准、管制员指令信息内容、管制员标准用语手册《空中交通无线电通话用语》,并通过采用机场中管制员与飞行员陆空通话记录备份、使用甚高频通信设备或塔台语音接入设备收集管制员与飞行员语音对话信息和《空中交通无线电通话用语》语音文件三种方式获得语音数据和发音文本,再对上述管制员和飞行员的发音文本进行切分并对语音数据进行音段标注和韵律标注,形成符合机场管制标准用语的标注语音文件构成的数据集,最终构建成面向机场安全运行的管制员专用语音库;
(2)利用语义识别模块基于上述管制员专用语音库对管制员和飞行员双方的语音对话进行采集;
基于管制员专用语音库,分别对放行席、地面席、塔台席在内的席位的管制员指令以及飞行员语音进行采集,然后基于智能学习方法对上述语音进行训练,以实现对不同席位的专用术语语音的精准识别;
(3)对上述采集的语音对话进行噪声处理和语音识别;
对上述采集的语音对话中的甚高频通讯噪声和机场背景高噪声进行滤波,并加入放大器来提高信噪比;方法是提取出噪声的频谱,然后将含噪语音根据噪声的频谱做一个反向的补偿运算,从而得到降噪后的语音对话;
然后对上述降噪后的语音对话进行语音识别,并得到识别后的文本;
(4)对上述语音识别后的语音对话进行语义识别;
在对管制员和飞行员语音识别的基础上,从管制员指令中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证;
(5)依据上述语义识别信息,利用路径生成及GIS映射模块验证管制员指令的安全性,并生成飞机地面滑行路径图;
将上述语义识别信息映射到机场地理信息系统中,仿真推演飞机按照管制员指令在机场地面滑行的路径和过程,接收基于管制员指令语义识别的飞机地面滑行路径信息,验证管制员指令的安全性,并将该信息以出现飞机冲突事件的概率反馈给管制员,并生成与飞机地面运行相关的飞机地面滑行路径图;
(6)由飞机引导终端模块将GPS、机场基站、机场飞行区特定位置标志物信息相结合而获得飞机实时位置;
由飞机引导终端模块将基站定位、GPS、机场飞行区特定位置标志物信息结合在一起,进一步提高定位精度,达到实时定位的要求;
(7)实时采集飞机前端视角图像并识别机场飞行区特定位置标志物:
实时采集飞机前端视角图像,对机场飞行区特定位置标志物进行识别,当上述飞机前端视角图像与飞机引导终端模块中的模版匹配成功时,根据模版与飞机前端视角图像之间的变换矩阵计算出飞机与机场飞行区特定位置标志物之间的距离,辅助飞机定位并形成载有飞机地面引导信息的虚拟图像;
(8)在获得飞机实时位置和机场飞行区特定位置标志物识别的基础上进行AR导航:
在形成虚拟图像的同时,接收实时采集的飞机前端视角图像;将虚拟图像渲染,并增强显示在实时采集的飞机前端视角图像上,构成AR的现实图像;通过实时采集的飞机前端视角图像和载有飞机地面引导信息的虚拟图像的叠加,构成供飞行员观察的飞机地面引导显示图像,达到在机场飞行区道面实景进行导航的目的;最后将飞机的实时位置与上述飞机地面滑行路径图展示给飞机驾驶舱内的飞行员,并提供语音提示,以更加形象的方式进行飞机地面滑行引导。
所述语义识别模块工作步骤具体为:
首先对降噪后的语音对话信号进行预处理并基于神经网络提取出其中的特征参数,然后利用上述特征参数对声学模型、语言模型和字典进行训练和识别,将特征参数与已经训练好的声学模型、语言模型和字典进行比较,通过规则计算出相应概率,选择与特征参数最大概率匹配的结果,得到语音识别的文本,最后从语音识别的文本中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证。
所述训练是指获得模型参数,并对语音识别模型中的机场管制标准用语识别能力进行评估,与管制员专用语音库进行匹配,对与机场管制标准用语拟合能力和泛化能力进行优化;
所述识别是一个遍历管制员专用语音库的过程;
所述声学模型表示基于神经网络搭建的一种语言的发音,能够通过训练来识别管制员的语音模型和所处塔台环境的特征;
所述语言模型是对管制员专用语音库单词规则化的概率模型;
所述字典中含有大量的民航业管制领域中特有的专业名词及发音规则。
本发明与现有方法相比的优点在于:
1.本发明针对空中交通管制过程中管制员以及相关调度人员的“错、忘、漏”人为因素隐患,对管制员指令进行安全性验证,可有效杜绝在管制调度过程中因人为因素而造成的事故及其事故征候,大大提高飞机地面运行安全。
2.此引导系统无需人工操作航空器引导车,不会出现人为因素引发的引导飞机停错机位或漏引导的情况。此引导系统无需借助助航灯进行引导,不会受助航灯故障影响。本发明不需要对现有机场飞行区尤其是跑道进行大规模改造,且不涉及到航空器引导车和助航灯,可大幅度降低建设成本、改造成本、维护成本和运营成本。
3.本发明利用机场地理信息系统生成的飞机地面滑行路径,通过GPS、机场基站、机场飞行区特定位置标志物识别相结合的方式来保证飞机导航系统的精度。通过显示终端,将飞机的实时位置与既定的滑行路径展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导,保证了系统的实用性的同时提高了飞机引导的效率。
4.本发明适用于机场管制需求,形成高可靠、低故障、经济实用的机场管制决策支持系统和机场飞行区内飞机地面引导系统,实现飞机地面运行安全性的提升。
附图说明
图1为本发明提供的基于管制员指令语义识别的飞机地面引导方法流程图
具体实施方式
下面对本发明进行进一步详细说明:
本发明提供的基于管制员指令语义识别的飞机地面引导系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;其中语义识别模块用于采集机场管制席位上的管制员指令和飞行员语音并进行要素信息提取;路径生成及GIS映射模块依据语义识别结果,将管制员指令转换成飞机滑行路径并映射到机场地理信息系统上,进行管制员指令安全性验证后生成与飞机地面运行相关的飞机地面滑行路径图;飞机引导终端模块将飞机的实时位置与既定的滑行路径图展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导。
如图1所示,本发明提供的采用上述基于管制员指令语义识别的飞机地面引导系统的飞机地面引导方法包括按顺序进行的下列步骤:
(1)构建面向机场安全运行的管制员专用语音库;
构建面向机场安全运行的管制员专用语音库是为了全面反映出民航管制领域特有的声学特性和为建立语音模型提供完备的数据集。基于机场管制工作流程、飞行区相关运行管理标准、管制员指令信息内容、管制员标准用语手册《空中交通无线电通话用语》,并通过采用机场中管制员与飞行员陆空通话记录备份、使用甚高频通信设备或塔台语音接入设备收集管制员与飞行员语音对话信息和《空中交通无线电通话用语》语音文件三种方式获得语音数据和发音文本,再对上述管制员和飞行员的发音文本进行切分并对语音数据进行音段标注和韵律标注,形成符合机场管制标准用语的标注语音文件构成的数据集,最终构建成面向机场安全运行的管制员专用语音库。
(2)利用语义识别模块基于上述管制员专用语音库对管制员和飞行员双方的语音对话进行采集;
基于由《空中交通无线电通话用语》中管制员和飞行员语音对话信息作为基本语素而构建的面向机场安全运行的管制员专用语音库,分别对放行席、地面席、塔台席在内的席位的管制员指令以及飞行员语音进行采集,然后基于智能学习方法对上述语音进行训练,以实现对不同席位的专用术语语音的精准识别。
(3)对上述采集的语音对话进行噪声处理和语音识别;
由于在机场采集到的语音通常会夹杂一定强度的背景音,这些背景音一般是甚高频通讯噪声和机场背景高噪声噪音,当背景噪音强度较大时,会对后续的语音识别效果产生明显的影响。因此对上述采集的语音对话中的甚高频通讯噪声和机场背景高噪声进行滤波,以减少噪声干扰,并加入放大器来提高信噪比。方法是提取出噪声的频谱,然后将含噪语音根据噪声的频谱做一个反向的补偿运算,从而得到降噪后的语音对话。
然后对上述降噪后的语音对话进行语音识别,并得到识别后的文本。所述语义识别模块工作步骤具体为:
首先对降噪后的语音对话信号进行预处理并基于神经网络提取出其中的特征参数,然后利用上述特征参数对声学模型、语言模型和字典进行训练和识别,最后将特征参数与已经训练好的声学模型、语言模型和字典进行比较,通过规则计算出相应概率,选择与特征参数最大概率匹配的结果,得到语音识别的文本。
所述训练是指获得模型参数,并对语义识别模型中的机场管制标准用语识别能力进行评估,与管制员专用语音库进行匹配,对与机场管制标准用语拟合能力和泛化能力进行优化;
所述识别是一个遍历管制员专用语音库的过程;
所述声学模型表示基于神经网络搭建的一种语言的发音,能够通过训练来识别管制员的语音模型和所处塔台环境的特征;
所述语言模型是对管制员专用语音库单词规则化的概率模型;
所述字典中含有大量的民航业管制领域中特有的专业名词及发音规则。
(4)对上述语音识别后的语音对话进行语义识别;
在对管制员和飞行员语音识别的基础上,从管制员指令中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行语义识别而获得语义识别信息,为飞机地面滑行引导提供保证。为了提高语义识别的准确度,需要对语音识别后的语音对话进行多次语义识别并获取大量的语音数据,用这些数据不断训练语义识别模块中的模型;
(5)依据上述语义识别信息,利用路径生成及GIS映射模块验证管制员指令的安全性,并生成飞机地面滑行路径图;
将上述语义识别信息映射到机场地理信息系统中,仿真推演飞机按照管制员指令在机场地面滑行的路径和过程,接收基于管制员指令语义识别的飞机地面滑行路径信息,验证管制员指令的安全性,并将该信息以出现飞机冲突事件的概率反馈给管制员,并生成与飞机地面运行相关的飞机地面滑行路径图;
(6)由飞机引导终端模块将GPS、机场基站、机场飞行区特定位置标志物信息相结合而获得飞机实时位置;
由于全球定位系统对卫星的依赖较强,导致盲区很多。而基站定位的方法可通过基站直接采集数据,在网络的覆盖区均无盲区。所以由飞机引导终端模块将基站定位、GPS、机场飞行区特定位置标志物信息结合在一起,可进一步提高定位精度,达到实时定位的要求。
(7)实时采集飞机前端视角图像并识别机场飞行区特定位置标志物:
实时采集飞机前端视角图像,对机场飞行区特定位置标志物进行识别,当上述飞机前端视角图像与飞机引导终端模块中的模版匹配成功时,根据模版与飞机前端视角图像之间的变换矩阵计算出飞机与机场飞行区特定位置标志物之间的距离,辅助飞机定位并形成载有飞机地面引导信息的虚拟图像。
(8)在获得的飞机实时位置和机场飞行区特定位置标志物识别的基础上进行AR导航:
在形成虚拟图像的同时,接收实时采集的飞机前端视角图像;将虚拟图像渲染,并增强显示在实时采集的飞机前端视角图像上,构成AR的现实图像;通过实时采集的飞机前端视角图像和载有飞机地面引导信息的虚拟图像的叠加,构成供飞行员观察的飞机地面引导显示图像,达到在机场飞行区道面实景进行导航的目的;最后将飞机的实时位置与上述飞机地面滑行路径图展示给飞机驾驶舱内的飞行员,并提供语音提示,以更加形象的方式进行飞机地面滑行引导。
本发明针对航空管制特有的语音发音,构建符合机场管制标准用语的专门语音库,实现对管制员的专用术语的语音识别,在语音识别的基础上,从管制员指令中提取航班号、推出信息、路径信息、关键位置点、起始点、时序等要素信息,关联分析多要素并结合机场飞行区构型,进行语义识别,将其映射到机场地理信息系统系统上,生成与飞机地面运行相关的飞机地面滑行路径图,通过显示终端,将飞机的实时位置与既定的飞机地面滑行路径图展示给飞行员,并提供语音提示,在机场飞行区道面实景的基础上进行AR导航。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (3)

1.一种基于管制员指令语义识别的飞机地面引导系统的飞机地面引导方法,所述的飞机地面引导系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;其中语义识别模块用于采集机场管制席位上的管制员指令和飞行员语音并进行要素信息提取;路径生成及GIS映射模块依据语义识别结果,将管制员指令转换成飞机滑行路径并映射到机场地理信息系统上,进行管制员指令安全性验证后生成与飞机地面运行相关的飞机地面滑行路径图;飞机引导终端模块将飞机的实时位置与既定的滑行路径图展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导;
其特征在于:所述的飞机地面引导方法包括按顺序进行的下列步骤:
(1)构建面向机场安全运行的管制员专用语音库;
基于机场管制工作流程、飞行区相关运行管理标准、管制员指令信息内容、管制员标准用语手册《空中交通无线电通话用语》,并通过采用机场中管制员与飞行员陆空通话记录备份、使用甚高频通信设备或塔台语音接入设备收集管制员与飞行员语音对话信息和《空中交通无线电通话用语》语音文件三种方式获得语音数据和发音文本,再对上述管制员和飞行员的发音文本进行切分并对语音数据进行音段标注和韵律标注,形成符合机场管制标准用语的标注语音文件构成的数据集,最终构建成面向机场安全运行的管制员专用语音库;
(2)利用语义识别模块基于上述管制员专用语音库对管制员和飞行员双方的语音对话进行采集;
基于管制员专用语音库,分别对放行席、地面席、塔台席在内的席位的管制员指令以及飞行员语音进行采集,然后基于智能学习方法对上述语音进行训练,以实现对不同席位的专用术语语音的精准识别;
(3)对上述采集的语音对话进行噪声处理和语音识别;
对上述采集的语音对话中的甚高频通讯噪声和机场背景高噪声进行滤波,并加入放大器来提高信噪比;方法是提取出噪声的频谱,然后将含噪语音根据噪声的频谱做一个反向的补偿运算,从而得到降噪后的语音对话;
然后对上述降噪后的语音对话进行语音识别,并得到识别后的文本;
(4)对上述语音识别后的语音对话进行语义识别;
在对管制员和飞行员语音识别的基础上,从管制员指令中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证;
(5)依据上述语义识别信息,利用路径生成及GIS映射模块验证管制员指令的安全性,并生成飞机地面滑行路径图;
将上述语义识别信息映射到机场地理信息系统中,仿真推演飞机按照管制员指令在机场地面滑行的路径和过程,接收基于管制员指令语义识别的飞机地面滑行路径信息,验证管制员指令的安全性,并将该信息以出现飞机冲突事件的概率反馈给管制员,并生成与飞机地面运行相关的飞机地面滑行路径图;
(6)由飞机引导终端模块将GPS、机场基站、机场飞行区特定位置标志物信息相结合而获得飞机实时位置;
由飞机引导终端模块将基站定位、GPS、机场飞行区特定位置标志物信息结合在一起,进一步提高定位精度,达到实时定位的要求;
(7)实时采集飞机前端视角图像并识别机场飞行区特定位置标志物:
实时采集飞机前端视角图像,对机场飞行区特定位置标志物进行识别,当上述飞机前端视角图像与飞机引导终端模块中的模版匹配成功时,根据模版与飞机前端视角图像之间的变换矩阵计算出飞机与机场飞行区特定位置标志物之间的距离,辅助飞机定位并形成载有飞机地面引导信息的虚拟图像;
(8)在获得飞机实时位置和机场飞行区特定位置标志物识别的基础上进行AR导航:
在形成虚拟图像的同时,接收实时采集的飞机前端视角图像;将虚拟图像渲染,并增强显示在实时采集的飞机前端视角图像上,构成AR的现实图像;通过实时采集的飞机前端视角图像和载有飞机地面引导信息的虚拟图像的叠加,构成供飞行员观察的飞机地面引导显示图像,达到在机场飞行区道面实景进行导航的目的;最后将飞机的实时位置与上述飞机地面滑行路径图展示给飞机驾驶舱内的飞行员,并提供语音提示,以更加形象的方式进行飞机地面滑行引导。
2.根据权利要求1所述的飞机地面引导方法,其特征在于:在步骤(3)中,所述语义识别模块工作步骤具体为:
首先对降噪后的语音对话信号进行预处理并基于神经网络提取出其中的特征参数,然后利用上述特征参数对声学模型、语言模型和字典进行训练和识别,将特征参数与已经训练好的声学模型、语言模型和字典进行比较,通过规则计算出相应概率,选择与特征参数最大概率匹配的结果,得到语音识别的文本,最后从语音识别的文本中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证。
3.根据权利要求2所述的飞机地面引导方法,其特征在于:所述训练是指获得模型参数,并对语音识别模型中的机场管制标准用语识别能力进行评估,与管制员专用语音库进行匹配,对与机场管制标准用语拟合能力和泛化能力进行优化;
所述识别是一个遍历管制员专用语音库的过程;
所述声学模型表示基于神经网络搭建的一种语言的发音,能够通过训练来识别管制员的语音模型和所处塔台环境的特征;
所述语言模型是对管制员专用语音库单词规则化的概率模型;
所述字典中含有大量的民航业管制领域中特有的专业名词及发音规则。
CN202010511326.6A 2020-06-08 2020-06-08 基于管制员指令语义识别的飞机地面引导系统及方法 Active CN111667831B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010511326.6A CN111667831B (zh) 2020-06-08 2020-06-08 基于管制员指令语义识别的飞机地面引导系统及方法
PCT/CN2021/098174 WO2021249285A1 (zh) 2020-06-08 2021-06-03 基于管制员指令语义识别的飞机地面引导系统及方法
US18/059,967 US20230085781A1 (en) 2020-06-08 2022-11-29 Aircraft ground guidance system and method based on semantic recognition of controller instruction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010511326.6A CN111667831B (zh) 2020-06-08 2020-06-08 基于管制员指令语义识别的飞机地面引导系统及方法

Publications (2)

Publication Number Publication Date
CN111667831A CN111667831A (zh) 2020-09-15
CN111667831B true CN111667831B (zh) 2022-04-26

Family

ID=72385782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010511326.6A Active CN111667831B (zh) 2020-06-08 2020-06-08 基于管制员指令语义识别的飞机地面引导系统及方法

Country Status (3)

Country Link
US (1) US20230085781A1 (zh)
CN (1) CN111667831B (zh)
WO (1) WO2021249285A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667831B (zh) * 2020-06-08 2022-04-26 中国民航大学 基于管制员指令语义识别的飞机地面引导系统及方法
CN112185390B (zh) * 2020-09-27 2023-10-03 中国商用飞机有限责任公司北京民用飞机技术研究中心 机上信息辅助方法及装置
WO2022063288A1 (zh) * 2020-09-27 2022-03-31 中国商用飞机有限责任公司北京民用飞机技术研究中心 一种机上信息辅助系统和方法
CN112992144B (zh) * 2021-04-21 2021-07-27 国网浙江省电力有限公司金华供电公司 应用于电力领域的智能语音调控方法
CN113821053A (zh) * 2021-09-28 2021-12-21 中国民航大学 一种基于语音识别和关系抽取技术的飞行辅助方法和系统
CN114860862B (zh) * 2022-06-01 2024-08-27 上海麦图信息科技有限公司 一种基于管制指令意图的机场地面飞机滑行路径生成方法
CN114743562B (zh) * 2022-06-09 2022-11-01 成都凯天电子股份有限公司 一种飞机声纹识别方法、系统、电子设备及存储介质
US20240029570A1 (en) * 2022-07-25 2024-01-25 Rockwell Collins, Inc. Outcome assessment model for artificial intelligence decision makers
CN116089593B (zh) * 2023-03-24 2023-06-13 齐鲁工业大学(山东省科学院) 基于时序特征筛选编码模块的多回合人机对话方法和装置
CN118279930B (zh) * 2024-04-01 2024-10-29 淘点链(广州)信息科技有限公司 高精度无人机视觉分析警示系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610127A (zh) * 2012-03-02 2012-07-25 南京航空航天大学 一种机场飞行区场面运行综合监视系统
CN104952285A (zh) * 2014-03-25 2015-09-30 霍尼韦尔国际公司 用于飞机场表面移动模型的自动生成的系统和方法
CN106251879A (zh) * 2016-07-28 2016-12-21 中国民航大学 一种民航地空对话校验系统
CN106356063A (zh) * 2016-08-28 2017-01-25 桂林市晶准测控技术有限公司 一种对管控语音进行文字识别的方法和系统
CA2989880A1 (en) * 2017-03-17 2018-09-17 Honeywell International Inc. Systems and methods for graphical visualization of communication transmissions received onboard an aircraft

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1654728A1 (en) * 2003-08-01 2006-05-10 Philips Intellectual Property & Standards GmbH Method for driving a dialog system
FR2915611B1 (fr) * 2007-04-25 2010-06-11 Thales Sa Systeme d'aide au roulage d'un aeronef
US8417526B2 (en) * 2009-03-13 2013-04-09 Adacel, Inc. Speech recognition learning system and method
US9305559B2 (en) * 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9396727B2 (en) * 2013-07-10 2016-07-19 GM Global Technology Operations LLC Systems and methods for spoken dialog service arbitration
US9715878B2 (en) * 2013-07-12 2017-07-25 GM Global Technology Operations LLC Systems and methods for result arbitration in spoken dialog systems
US20150039316A1 (en) * 2013-07-31 2015-02-05 GM Global Technology Operations LLC Systems and methods for managing dialog context in speech systems
US20150310853A1 (en) * 2014-04-25 2015-10-29 GM Global Technology Operations LLC Systems and methods for speech artifact compensation in speech recognition systems
US9715877B2 (en) * 2014-06-25 2017-07-25 GM Global Technology Operations LLC Systems and methods for a navigation system utilizing dictation and partial match search
US9430949B1 (en) * 2015-03-25 2016-08-30 Honeywell International Inc. Verbal taxi clearance system
US10769189B2 (en) * 2015-11-13 2020-09-08 Microsoft Technology Licensing, Llc Computer speech recognition and semantic understanding from activity patterns
US20170140750A1 (en) * 2015-11-17 2017-05-18 Le Holdings (Beijing) Co., Ltd. Method and device for speech recognition
DE102018200088B3 (de) * 2018-01-04 2019-06-13 Volkswagen Aktiengesellschaft Verfahren, Vorrichtung und computerlesbares Speichermedium mit Instruktionen zum Verarbeiten einer Spracheingabe, Kraftfahrzeug und Nutzerendgerät mit einer Sprachverarbeitung
WO2019214798A1 (en) * 2018-05-07 2019-11-14 Bayerische Motoren Werke Aktiengesellschaft Dialog system capable of semantic-understanding mapping between user intents and machine services
EP3800633B1 (en) * 2018-06-27 2023-10-11 Google LLC Rendering responses to a spoken utterance of a user utilizing a local text-response map
CN109606384B (zh) * 2018-12-29 2021-04-20 百度在线网络技术(北京)有限公司 车辆控制方法、装置、设备和存储介质
CN111629156A (zh) * 2019-02-28 2020-09-04 北京字节跳动网络技术有限公司 图像特效的触发方法、装置和硬件装置
JP7280066B2 (ja) * 2019-03-07 2023-05-23 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
JP7280074B2 (ja) * 2019-03-19 2023-05-23 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
EP3935628B1 (en) * 2019-05-06 2023-09-20 Google LLC Proactive caching of assistant action content at a client device to enable on-device resolution of spoken or typed utterances
CN119296533A (zh) * 2019-08-15 2025-01-10 深圳引望智能技术有限公司 语音交互方法、装置、终端及存储介质
CN113362828B (zh) * 2020-03-04 2022-07-05 阿波罗智联(北京)科技有限公司 用于识别语音的方法和装置
CN114072875A (zh) * 2020-05-29 2022-02-18 华为技术有限公司 一种语音信号处理方法及其相关设备
CN111667831B (zh) * 2020-06-08 2022-04-26 中国民航大学 基于管制员指令语义识别的飞机地面引导系统及方法
CN111667830B (zh) * 2020-06-08 2022-04-29 中国民航大学 基于管制员指令语义识别的机场管制决策支持系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610127A (zh) * 2012-03-02 2012-07-25 南京航空航天大学 一种机场飞行区场面运行综合监视系统
CN104952285A (zh) * 2014-03-25 2015-09-30 霍尼韦尔国际公司 用于飞机场表面移动模型的自动生成的系统和方法
CN106251879A (zh) * 2016-07-28 2016-12-21 中国民航大学 一种民航地空对话校验系统
CN106356063A (zh) * 2016-08-28 2017-01-25 桂林市晶准测控技术有限公司 一种对管控语音进行文字识别的方法和系统
CA2989880A1 (en) * 2017-03-17 2018-09-17 Honeywell International Inc. Systems and methods for graphical visualization of communication transmissions received onboard an aircraft

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
空管模拟训练中指令的语音识别与合成技术研究;袁伟伟 等;《电子设计工程》;20130331;第21卷(第6期);第8-11页 *

Also Published As

Publication number Publication date
CN111667831A (zh) 2020-09-15
US20230085781A1 (en) 2023-03-23
WO2021249285A1 (zh) 2021-12-16

Similar Documents

Publication Publication Date Title
CN111667831B (zh) 基于管制员指令语义识别的飞机地面引导系统及方法
CN111667830B (zh) 基于管制员指令语义识别的机场管制决策支持系统及方法
US11900817B2 (en) Aircraft speech recognition systems and methods
Delpech et al. A real-life, french-accented corpus of air traffic control communications
CN109448493A (zh) 塔台管制模拟训练系统、语音管制指令识别及报读方法
CN106910376B (zh) 一种空中交通运行管制指令监控方法与系统
CN110111792B (zh) 空中交通管制自动指挥系统
CN110648405B (zh) 一种基于增强现实的飞行操作辅助方法和系统
Helmke et al. Readback error detection by automatic speech recognition to increase ATM safety
CN114648893A (zh) 用于自主飞行器的对话系统
CN106846920A (zh) 一种基于自然语义提取的空管辅助决策方法
CN114155861A (zh) 空管语音智能监控系统
CN111581780A (zh) 复杂空域场景下机场群空域仿真建模与验证方法及装置
CN113948091A (zh) 民航客机陆空通话语音识别引擎及其应用方法
CN111627257B (zh) 基于航空器运动趋势预判的管制指令安全预演与校验方法
CN115440191B (zh) 一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备
CN106448272B (zh) 一种驾驶员执行管制指令情况的监控方法及装置
EP3855428B1 (en) Aircraft speech recognition systems and methods
CN114187893B (zh) 空管语音智能监控方法和系统
CN115148209B (zh) 基于座舱语音识别的自动报告生成方法和系统
CN109300466A (zh) 一种基于语音技术的复杂设备智能虚拟训练方法和系统
WO2022063288A1 (zh) 一种机上信息辅助系统和方法
CN113821053A (zh) 一种基于语音识别和关系抽取技术的飞行辅助方法和系统
CN115691274A (zh) 一种飞行程序验证和运行处理方法及装置
CN115392011A (zh) 基于vr的单轨高架区间疏散救援试验系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant