CN111667831B - 基于管制员指令语义识别的飞机地面引导系统及方法 - Google Patents
基于管制员指令语义识别的飞机地面引导系统及方法 Download PDFInfo
- Publication number
- CN111667831B CN111667831B CN202010511326.6A CN202010511326A CN111667831B CN 111667831 B CN111667831 B CN 111667831B CN 202010511326 A CN202010511326 A CN 202010511326A CN 111667831 B CN111667831 B CN 111667831B
- Authority
- CN
- China
- Prior art keywords
- voice
- airport
- airplane
- aircraft
- controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013507 mapping Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000004891 communication Methods 0.000 claims description 17
- 239000003550 marker Substances 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims 4
- 238000010219 correlation analysis Methods 0.000 claims 2
- 230000000694 effects Effects 0.000 claims 2
- 230000008451 emotion Effects 0.000 claims 2
- 230000014509 gene expression Effects 0.000 claims 2
- 238000002372 labelling Methods 0.000 claims 2
- 230000000007 visual effect Effects 0.000 claims 2
- 238000001914 filtration Methods 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 claims 1
- 238000009877 rendering Methods 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 3
- 238000012423 maintenance Methods 0.000 abstract description 2
- 238000009418 renovation Methods 0.000 abstract 1
- 230000002996 emotional effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010006 flight Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft
- G08G5/20—Arrangements for acquiring, generating, sharing or displaying traffic information
- G08G5/22—Arrangements for acquiring, generating, sharing or displaying traffic information located on the ground
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft
- G08G5/20—Arrangements for acquiring, generating, sharing or displaying traffic information
- G08G5/21—Arrangements for acquiring, generating, sharing or displaying traffic information located onboard the aircraft
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft
- G08G5/20—Arrangements for acquiring, generating, sharing or displaying traffic information
- G08G5/26—Transmission of traffic-related information between aircraft and ground stations
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft
- G08G5/50—Navigation or guidance aids
- G08G5/51—Navigation or guidance aids for control when on the ground, e.g. taxiing or rolling
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G5/00—Traffic control systems for aircraft
- G08G5/50—Navigation or guidance aids
- G08G5/56—Navigation or guidance aids for two or more aircraft
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Aviation & Aerospace Engineering (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Remote Sensing (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Computer Graphics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Traffic Control Systems (AREA)
- Radar, Positioning & Navigation (AREA)
Abstract
一种基于管制员指令语义识别的飞机地面引导系统及方法。系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;本发明优点:可有效杜绝在管制调度过程中因人为因素而造成的事故及其事故征候,大大提高飞机地面运行安全。无需人工操作航空器引导车,可大幅度降低建设成本、改造成本、维护成本和运营成本。适用于机场管制需求,形成高可靠、低故障、经济实用的机场管制决策支持系统和机场飞行区内飞机地面引导系统,实现飞机地面运行安全性的提升。
Description
技术领域
本发明属于机场管理技术领域,尤其涉及一种基于管制员指令语义识别的飞机地面引导系统及方法。
背景技术
目前,全球民航正处于高速发展阶段,近20年来,最繁忙的国际机场航班数已经翻了一倍,而机场跑道和滑行道数量却没有相应增加,因此各个国家的大型机场特别是枢纽机场将长期处于高负荷的运行状态,这将产生机场运行的众多问题,尤其增加了机场对飞机地面滑行引导的压力。飞机在机场滑行区和跑道行驶时,一般采用航空器引导车或者是高级场面活动引导控制系统对飞机进行地面引导,前者为在飞机起飞前和降落后利用航空器引导车对飞机在机场地面滑行进行引导,规定引导车和航空器之间的间隔不应该超过50米;而后者的高级场面活动引导控制系统是一个通过监视、路由计划和引导功能实现对场面飞机管制或控制的综合集成系统。但这两种方法的缺点是人力物力投入大,前者受人为因素及天气因素影响很大;后者建设或者改造时,资金投入太大,尤其是在现有机场,需要对助航灯进行改造,施工难度较大。所以,这两种引导方法在实用性和经济性方面都有欠缺。另外,机场越繁忙,对管制员和航空器调度的要求也愈大,所以管制员和特种车辆驾驶员也愈加地忙碌,相应地也增加了管制员以及相关调度人员的出错率。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于管制员指令语义识别的飞机地面引导系统及方法。
为了达到上述目的,本发明提供的基于管制员指令语义识别的飞机地面引导系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;其中语义识别模块用于采集机场管制席位上的管制员指令和飞行员语音并进行要素信息提取;路径生成及GIS映射模块依据语义识别结果,将管制员指令转换成飞机滑行路径并映射到机场地理信息系统上,进行管制员指令安全性验证后生成与飞机地面运行相关的飞机地面滑行路径图;飞机引导终端模块将飞机的实时位置与既定的滑行路径图展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导。
本发明提供的基于管制员指令语义识别的飞机地面引导方法包括按顺序进行的下列步骤:
(1)构建面向机场安全运行的管制员专用语音库;
基于机场管制工作流程、飞行区相关运行管理标准、管制员指令信息内容、管制员标准用语手册《空中交通无线电通话用语》,并通过采用机场中管制员与飞行员陆空通话记录备份、使用甚高频通信设备或塔台语音接入设备收集管制员与飞行员语音对话信息和《空中交通无线电通话用语》语音文件三种方式获得语音数据和发音文本,再对上述管制员和飞行员的发音文本进行切分并对语音数据进行音段标注和韵律标注,形成符合机场管制标准用语的标注语音文件构成的数据集,最终构建成面向机场安全运行的管制员专用语音库;
(2)利用语义识别模块基于上述管制员专用语音库对管制员和飞行员双方的语音对话进行采集;
基于管制员专用语音库,分别对放行席、地面席、塔台席在内的席位的管制员指令以及飞行员语音进行采集,然后基于智能学习方法对上述语音进行训练,以实现对不同席位的专用术语语音的精准识别;
(3)对上述采集的语音对话进行噪声处理和语音识别;
对上述采集的语音对话中的甚高频通讯噪声和机场背景高噪声进行滤波,并加入放大器来提高信噪比;方法是提取出噪声的频谱,然后将含噪语音根据噪声的频谱做一个反向的补偿运算,从而得到降噪后的语音对话;
然后对上述降噪后的语音对话进行语音识别,并得到识别后的文本;
(4)对上述语音识别后的语音对话进行语义识别;
在对管制员和飞行员语音识别的基础上,从管制员指令中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证;
(5)依据上述语义识别信息,利用路径生成及GIS映射模块验证管制员指令的安全性,并生成飞机地面滑行路径图;
将上述语义识别信息映射到机场地理信息系统中,仿真推演飞机按照管制员指令在机场地面滑行的路径和过程,接收基于管制员指令语义识别的飞机地面滑行路径信息,验证管制员指令的安全性,并将该信息以出现飞机冲突事件的概率反馈给管制员,并生成与飞机地面运行相关的飞机地面滑行路径图;
(6)由飞机引导终端模块将GPS、机场基站、机场飞行区特定位置标志物信息相结合而获得飞机实时位置;
由飞机引导终端模块将基站定位、GPS、机场飞行区特定位置标志物信息结合在一起,进一步提高定位精度,达到实时定位的要求;
(7)实时采集飞机前端视角图像并识别机场飞行区特定位置标志物:
实时采集飞机前端视角图像,对机场飞行区特定位置标志物进行识别,当上述飞机前端视角图像与飞机引导终端模块中的模版匹配成功时,根据模版与飞机前端视角图像之间的变换矩阵计算出飞机与机场飞行区特定位置标志物之间的距离,辅助飞机定位并形成载有飞机地面引导信息的虚拟图像;
(8)在获得飞机实时位置和机场飞行区特定位置标志物识别的基础上进行AR导航:
在形成虚拟图像的同时,接收实时采集的飞机前端视角图像;将虚拟图像渲染,并增强显示在实时采集的飞机前端视角图像上,构成AR的现实图像;通过实时采集的飞机前端视角图像和载有飞机地面引导信息的虚拟图像的叠加,构成供飞行员观察的飞机地面引导显示图像,达到在机场飞行区道面实景进行导航的目的;最后将飞机的实时位置与上述飞机地面滑行路径图展示给飞机驾驶舱内的飞行员,并提供语音提示,以更加形象的方式进行飞机地面滑行引导。
所述语义识别模块工作步骤具体为:
首先对降噪后的语音对话信号进行预处理并基于神经网络提取出其中的特征参数,然后利用上述特征参数对声学模型、语言模型和字典进行训练和识别,将特征参数与已经训练好的声学模型、语言模型和字典进行比较,通过规则计算出相应概率,选择与特征参数最大概率匹配的结果,得到语音识别的文本,最后从语音识别的文本中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证。
所述训练是指获得模型参数,并对语音识别模型中的机场管制标准用语识别能力进行评估,与管制员专用语音库进行匹配,对与机场管制标准用语拟合能力和泛化能力进行优化;
所述识别是一个遍历管制员专用语音库的过程;
所述声学模型表示基于神经网络搭建的一种语言的发音,能够通过训练来识别管制员的语音模型和所处塔台环境的特征;
所述语言模型是对管制员专用语音库单词规则化的概率模型;
所述字典中含有大量的民航业管制领域中特有的专业名词及发音规则。
本发明与现有方法相比的优点在于:
1.本发明针对空中交通管制过程中管制员以及相关调度人员的“错、忘、漏”人为因素隐患,对管制员指令进行安全性验证,可有效杜绝在管制调度过程中因人为因素而造成的事故及其事故征候,大大提高飞机地面运行安全。
2.此引导系统无需人工操作航空器引导车,不会出现人为因素引发的引导飞机停错机位或漏引导的情况。此引导系统无需借助助航灯进行引导,不会受助航灯故障影响。本发明不需要对现有机场飞行区尤其是跑道进行大规模改造,且不涉及到航空器引导车和助航灯,可大幅度降低建设成本、改造成本、维护成本和运营成本。
3.本发明利用机场地理信息系统生成的飞机地面滑行路径,通过GPS、机场基站、机场飞行区特定位置标志物识别相结合的方式来保证飞机导航系统的精度。通过显示终端,将飞机的实时位置与既定的滑行路径展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导,保证了系统的实用性的同时提高了飞机引导的效率。
4.本发明适用于机场管制需求,形成高可靠、低故障、经济实用的机场管制决策支持系统和机场飞行区内飞机地面引导系统,实现飞机地面运行安全性的提升。
附图说明
图1为本发明提供的基于管制员指令语义识别的飞机地面引导方法流程图
具体实施方式
下面对本发明进行进一步详细说明:
本发明提供的基于管制员指令语义识别的飞机地面引导系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;其中语义识别模块用于采集机场管制席位上的管制员指令和飞行员语音并进行要素信息提取;路径生成及GIS映射模块依据语义识别结果,将管制员指令转换成飞机滑行路径并映射到机场地理信息系统上,进行管制员指令安全性验证后生成与飞机地面运行相关的飞机地面滑行路径图;飞机引导终端模块将飞机的实时位置与既定的滑行路径图展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导。
如图1所示,本发明提供的采用上述基于管制员指令语义识别的飞机地面引导系统的飞机地面引导方法包括按顺序进行的下列步骤:
(1)构建面向机场安全运行的管制员专用语音库;
构建面向机场安全运行的管制员专用语音库是为了全面反映出民航管制领域特有的声学特性和为建立语音模型提供完备的数据集。基于机场管制工作流程、飞行区相关运行管理标准、管制员指令信息内容、管制员标准用语手册《空中交通无线电通话用语》,并通过采用机场中管制员与飞行员陆空通话记录备份、使用甚高频通信设备或塔台语音接入设备收集管制员与飞行员语音对话信息和《空中交通无线电通话用语》语音文件三种方式获得语音数据和发音文本,再对上述管制员和飞行员的发音文本进行切分并对语音数据进行音段标注和韵律标注,形成符合机场管制标准用语的标注语音文件构成的数据集,最终构建成面向机场安全运行的管制员专用语音库。
(2)利用语义识别模块基于上述管制员专用语音库对管制员和飞行员双方的语音对话进行采集;
基于由《空中交通无线电通话用语》中管制员和飞行员语音对话信息作为基本语素而构建的面向机场安全运行的管制员专用语音库,分别对放行席、地面席、塔台席在内的席位的管制员指令以及飞行员语音进行采集,然后基于智能学习方法对上述语音进行训练,以实现对不同席位的专用术语语音的精准识别。
(3)对上述采集的语音对话进行噪声处理和语音识别;
由于在机场采集到的语音通常会夹杂一定强度的背景音,这些背景音一般是甚高频通讯噪声和机场背景高噪声噪音,当背景噪音强度较大时,会对后续的语音识别效果产生明显的影响。因此对上述采集的语音对话中的甚高频通讯噪声和机场背景高噪声进行滤波,以减少噪声干扰,并加入放大器来提高信噪比。方法是提取出噪声的频谱,然后将含噪语音根据噪声的频谱做一个反向的补偿运算,从而得到降噪后的语音对话。
然后对上述降噪后的语音对话进行语音识别,并得到识别后的文本。所述语义识别模块工作步骤具体为:
首先对降噪后的语音对话信号进行预处理并基于神经网络提取出其中的特征参数,然后利用上述特征参数对声学模型、语言模型和字典进行训练和识别,最后将特征参数与已经训练好的声学模型、语言模型和字典进行比较,通过规则计算出相应概率,选择与特征参数最大概率匹配的结果,得到语音识别的文本。
所述训练是指获得模型参数,并对语义识别模型中的机场管制标准用语识别能力进行评估,与管制员专用语音库进行匹配,对与机场管制标准用语拟合能力和泛化能力进行优化;
所述识别是一个遍历管制员专用语音库的过程;
所述声学模型表示基于神经网络搭建的一种语言的发音,能够通过训练来识别管制员的语音模型和所处塔台环境的特征;
所述语言模型是对管制员专用语音库单词规则化的概率模型;
所述字典中含有大量的民航业管制领域中特有的专业名词及发音规则。
(4)对上述语音识别后的语音对话进行语义识别;
在对管制员和飞行员语音识别的基础上,从管制员指令中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行语义识别而获得语义识别信息,为飞机地面滑行引导提供保证。为了提高语义识别的准确度,需要对语音识别后的语音对话进行多次语义识别并获取大量的语音数据,用这些数据不断训练语义识别模块中的模型;
(5)依据上述语义识别信息,利用路径生成及GIS映射模块验证管制员指令的安全性,并生成飞机地面滑行路径图;
将上述语义识别信息映射到机场地理信息系统中,仿真推演飞机按照管制员指令在机场地面滑行的路径和过程,接收基于管制员指令语义识别的飞机地面滑行路径信息,验证管制员指令的安全性,并将该信息以出现飞机冲突事件的概率反馈给管制员,并生成与飞机地面运行相关的飞机地面滑行路径图;
(6)由飞机引导终端模块将GPS、机场基站、机场飞行区特定位置标志物信息相结合而获得飞机实时位置;
由于全球定位系统对卫星的依赖较强,导致盲区很多。而基站定位的方法可通过基站直接采集数据,在网络的覆盖区均无盲区。所以由飞机引导终端模块将基站定位、GPS、机场飞行区特定位置标志物信息结合在一起,可进一步提高定位精度,达到实时定位的要求。
(7)实时采集飞机前端视角图像并识别机场飞行区特定位置标志物:
实时采集飞机前端视角图像,对机场飞行区特定位置标志物进行识别,当上述飞机前端视角图像与飞机引导终端模块中的模版匹配成功时,根据模版与飞机前端视角图像之间的变换矩阵计算出飞机与机场飞行区特定位置标志物之间的距离,辅助飞机定位并形成载有飞机地面引导信息的虚拟图像。
(8)在获得的飞机实时位置和机场飞行区特定位置标志物识别的基础上进行AR导航:
在形成虚拟图像的同时,接收实时采集的飞机前端视角图像;将虚拟图像渲染,并增强显示在实时采集的飞机前端视角图像上,构成AR的现实图像;通过实时采集的飞机前端视角图像和载有飞机地面引导信息的虚拟图像的叠加,构成供飞行员观察的飞机地面引导显示图像,达到在机场飞行区道面实景进行导航的目的;最后将飞机的实时位置与上述飞机地面滑行路径图展示给飞机驾驶舱内的飞行员,并提供语音提示,以更加形象的方式进行飞机地面滑行引导。
本发明针对航空管制特有的语音发音,构建符合机场管制标准用语的专门语音库,实现对管制员的专用术语的语音识别,在语音识别的基础上,从管制员指令中提取航班号、推出信息、路径信息、关键位置点、起始点、时序等要素信息,关联分析多要素并结合机场飞行区构型,进行语义识别,将其映射到机场地理信息系统系统上,生成与飞机地面运行相关的飞机地面滑行路径图,通过显示终端,将飞机的实时位置与既定的飞机地面滑行路径图展示给飞行员,并提供语音提示,在机场飞行区道面实景的基础上进行AR导航。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (3)
1.一种基于管制员指令语义识别的飞机地面引导系统的飞机地面引导方法,所述的飞机地面引导系统包括语义识别模块、路径生成及GIS映射模块和飞机引导终端模块;其中语义识别模块用于采集机场管制席位上的管制员指令和飞行员语音并进行要素信息提取;路径生成及GIS映射模块依据语义识别结果,将管制员指令转换成飞机滑行路径并映射到机场地理信息系统上,进行管制员指令安全性验证后生成与飞机地面运行相关的飞机地面滑行路径图;飞机引导终端模块将飞机的实时位置与既定的滑行路径图展示给飞行员,并提供机场飞行区道面实景基础上的AR飞机引导;
其特征在于:所述的飞机地面引导方法包括按顺序进行的下列步骤:
(1)构建面向机场安全运行的管制员专用语音库;
基于机场管制工作流程、飞行区相关运行管理标准、管制员指令信息内容、管制员标准用语手册《空中交通无线电通话用语》,并通过采用机场中管制员与飞行员陆空通话记录备份、使用甚高频通信设备或塔台语音接入设备收集管制员与飞行员语音对话信息和《空中交通无线电通话用语》语音文件三种方式获得语音数据和发音文本,再对上述管制员和飞行员的发音文本进行切分并对语音数据进行音段标注和韵律标注,形成符合机场管制标准用语的标注语音文件构成的数据集,最终构建成面向机场安全运行的管制员专用语音库;
(2)利用语义识别模块基于上述管制员专用语音库对管制员和飞行员双方的语音对话进行采集;
基于管制员专用语音库,分别对放行席、地面席、塔台席在内的席位的管制员指令以及飞行员语音进行采集,然后基于智能学习方法对上述语音进行训练,以实现对不同席位的专用术语语音的精准识别;
(3)对上述采集的语音对话进行噪声处理和语音识别;
对上述采集的语音对话中的甚高频通讯噪声和机场背景高噪声进行滤波,并加入放大器来提高信噪比;方法是提取出噪声的频谱,然后将含噪语音根据噪声的频谱做一个反向的补偿运算,从而得到降噪后的语音对话;
然后对上述降噪后的语音对话进行语音识别,并得到识别后的文本;
(4)对上述语音识别后的语音对话进行语义识别;
在对管制员和飞行员语音识别的基础上,从管制员指令中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证;
(5)依据上述语义识别信息,利用路径生成及GIS映射模块验证管制员指令的安全性,并生成飞机地面滑行路径图;
将上述语义识别信息映射到机场地理信息系统中,仿真推演飞机按照管制员指令在机场地面滑行的路径和过程,接收基于管制员指令语义识别的飞机地面滑行路径信息,验证管制员指令的安全性,并将该信息以出现飞机冲突事件的概率反馈给管制员,并生成与飞机地面运行相关的飞机地面滑行路径图;
(6)由飞机引导终端模块将GPS、机场基站、机场飞行区特定位置标志物信息相结合而获得飞机实时位置;
由飞机引导终端模块将基站定位、GPS、机场飞行区特定位置标志物信息结合在一起,进一步提高定位精度,达到实时定位的要求;
(7)实时采集飞机前端视角图像并识别机场飞行区特定位置标志物:
实时采集飞机前端视角图像,对机场飞行区特定位置标志物进行识别,当上述飞机前端视角图像与飞机引导终端模块中的模版匹配成功时,根据模版与飞机前端视角图像之间的变换矩阵计算出飞机与机场飞行区特定位置标志物之间的距离,辅助飞机定位并形成载有飞机地面引导信息的虚拟图像;
(8)在获得飞机实时位置和机场飞行区特定位置标志物识别的基础上进行AR导航:
在形成虚拟图像的同时,接收实时采集的飞机前端视角图像;将虚拟图像渲染,并增强显示在实时采集的飞机前端视角图像上,构成AR的现实图像;通过实时采集的飞机前端视角图像和载有飞机地面引导信息的虚拟图像的叠加,构成供飞行员观察的飞机地面引导显示图像,达到在机场飞行区道面实景进行导航的目的;最后将飞机的实时位置与上述飞机地面滑行路径图展示给飞机驾驶舱内的飞行员,并提供语音提示,以更加形象的方式进行飞机地面滑行引导。
2.根据权利要求1所述的飞机地面引导方法,其特征在于:在步骤(3)中,所述语义识别模块工作步骤具体为:
首先对降噪后的语音对话信号进行预处理并基于神经网络提取出其中的特征参数,然后利用上述特征参数对声学模型、语言模型和字典进行训练和识别,将特征参数与已经训练好的声学模型、语言模型和字典进行比较,通过规则计算出相应概率,选择与特征参数最大概率匹配的结果,得到语音识别的文本,最后从语音识别的文本中提取出航班号、推出信息、路径信息、关键位置点、起始点、时序在内的要素信息,关联分析多要素并结合机场飞行区构型,利用词语解析、信息抽取、时间因果、情绪判断在内的技术手段对上述语音识别后的语音对话进行多次语义识别而获得语义识别信息,为飞机地面滑行引导提供保证。
3.根据权利要求2所述的飞机地面引导方法,其特征在于:所述训练是指获得模型参数,并对语音识别模型中的机场管制标准用语识别能力进行评估,与管制员专用语音库进行匹配,对与机场管制标准用语拟合能力和泛化能力进行优化;
所述识别是一个遍历管制员专用语音库的过程;
所述声学模型表示基于神经网络搭建的一种语言的发音,能够通过训练来识别管制员的语音模型和所处塔台环境的特征;
所述语言模型是对管制员专用语音库单词规则化的概率模型;
所述字典中含有大量的民航业管制领域中特有的专业名词及发音规则。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010511326.6A CN111667831B (zh) | 2020-06-08 | 2020-06-08 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
PCT/CN2021/098174 WO2021249285A1 (zh) | 2020-06-08 | 2021-06-03 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
US18/059,967 US20230085781A1 (en) | 2020-06-08 | 2022-11-29 | Aircraft ground guidance system and method based on semantic recognition of controller instruction |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010511326.6A CN111667831B (zh) | 2020-06-08 | 2020-06-08 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111667831A CN111667831A (zh) | 2020-09-15 |
CN111667831B true CN111667831B (zh) | 2022-04-26 |
Family
ID=72385782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010511326.6A Active CN111667831B (zh) | 2020-06-08 | 2020-06-08 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230085781A1 (zh) |
CN (1) | CN111667831B (zh) |
WO (1) | WO2021249285A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111667831B (zh) * | 2020-06-08 | 2022-04-26 | 中国民航大学 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
CN112185390B (zh) * | 2020-09-27 | 2023-10-03 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 机上信息辅助方法及装置 |
WO2022063288A1 (zh) * | 2020-09-27 | 2022-03-31 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 一种机上信息辅助系统和方法 |
CN112992144B (zh) * | 2021-04-21 | 2021-07-27 | 国网浙江省电力有限公司金华供电公司 | 应用于电力领域的智能语音调控方法 |
CN113821053A (zh) * | 2021-09-28 | 2021-12-21 | 中国民航大学 | 一种基于语音识别和关系抽取技术的飞行辅助方法和系统 |
CN114860862B (zh) * | 2022-06-01 | 2024-08-27 | 上海麦图信息科技有限公司 | 一种基于管制指令意图的机场地面飞机滑行路径生成方法 |
CN114743562B (zh) * | 2022-06-09 | 2022-11-01 | 成都凯天电子股份有限公司 | 一种飞机声纹识别方法、系统、电子设备及存储介质 |
US20240029570A1 (en) * | 2022-07-25 | 2024-01-25 | Rockwell Collins, Inc. | Outcome assessment model for artificial intelligence decision makers |
CN116089593B (zh) * | 2023-03-24 | 2023-06-13 | 齐鲁工业大学(山东省科学院) | 基于时序特征筛选编码模块的多回合人机对话方法和装置 |
CN118279930B (zh) * | 2024-04-01 | 2024-10-29 | 淘点链(广州)信息科技有限公司 | 高精度无人机视觉分析警示系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102610127A (zh) * | 2012-03-02 | 2012-07-25 | 南京航空航天大学 | 一种机场飞行区场面运行综合监视系统 |
CN104952285A (zh) * | 2014-03-25 | 2015-09-30 | 霍尼韦尔国际公司 | 用于飞机场表面移动模型的自动生成的系统和方法 |
CN106251879A (zh) * | 2016-07-28 | 2016-12-21 | 中国民航大学 | 一种民航地空对话校验系统 |
CN106356063A (zh) * | 2016-08-28 | 2017-01-25 | 桂林市晶准测控技术有限公司 | 一种对管控语音进行文字识别的方法和系统 |
CA2989880A1 (en) * | 2017-03-17 | 2018-09-17 | Honeywell International Inc. | Systems and methods for graphical visualization of communication transmissions received onboard an aircraft |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1654728A1 (en) * | 2003-08-01 | 2006-05-10 | Philips Intellectual Property & Standards GmbH | Method for driving a dialog system |
FR2915611B1 (fr) * | 2007-04-25 | 2010-06-11 | Thales Sa | Systeme d'aide au roulage d'un aeronef |
US8417526B2 (en) * | 2009-03-13 | 2013-04-09 | Adacel, Inc. | Speech recognition learning system and method |
US9305559B2 (en) * | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
US9401153B2 (en) * | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9396727B2 (en) * | 2013-07-10 | 2016-07-19 | GM Global Technology Operations LLC | Systems and methods for spoken dialog service arbitration |
US9715878B2 (en) * | 2013-07-12 | 2017-07-25 | GM Global Technology Operations LLC | Systems and methods for result arbitration in spoken dialog systems |
US20150039316A1 (en) * | 2013-07-31 | 2015-02-05 | GM Global Technology Operations LLC | Systems and methods for managing dialog context in speech systems |
US20150310853A1 (en) * | 2014-04-25 | 2015-10-29 | GM Global Technology Operations LLC | Systems and methods for speech artifact compensation in speech recognition systems |
US9715877B2 (en) * | 2014-06-25 | 2017-07-25 | GM Global Technology Operations LLC | Systems and methods for a navigation system utilizing dictation and partial match search |
US9430949B1 (en) * | 2015-03-25 | 2016-08-30 | Honeywell International Inc. | Verbal taxi clearance system |
US10769189B2 (en) * | 2015-11-13 | 2020-09-08 | Microsoft Technology Licensing, Llc | Computer speech recognition and semantic understanding from activity patterns |
US20170140750A1 (en) * | 2015-11-17 | 2017-05-18 | Le Holdings (Beijing) Co., Ltd. | Method and device for speech recognition |
DE102018200088B3 (de) * | 2018-01-04 | 2019-06-13 | Volkswagen Aktiengesellschaft | Verfahren, Vorrichtung und computerlesbares Speichermedium mit Instruktionen zum Verarbeiten einer Spracheingabe, Kraftfahrzeug und Nutzerendgerät mit einer Sprachverarbeitung |
WO2019214798A1 (en) * | 2018-05-07 | 2019-11-14 | Bayerische Motoren Werke Aktiengesellschaft | Dialog system capable of semantic-understanding mapping between user intents and machine services |
EP3800633B1 (en) * | 2018-06-27 | 2023-10-11 | Google LLC | Rendering responses to a spoken utterance of a user utilizing a local text-response map |
CN109606384B (zh) * | 2018-12-29 | 2021-04-20 | 百度在线网络技术(北京)有限公司 | 车辆控制方法、装置、设备和存储介质 |
CN111629156A (zh) * | 2019-02-28 | 2020-09-04 | 北京字节跳动网络技术有限公司 | 图像特效的触发方法、装置和硬件装置 |
JP7280066B2 (ja) * | 2019-03-07 | 2023-05-23 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP7280074B2 (ja) * | 2019-03-19 | 2023-05-23 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
EP3935628B1 (en) * | 2019-05-06 | 2023-09-20 | Google LLC | Proactive caching of assistant action content at a client device to enable on-device resolution of spoken or typed utterances |
CN119296533A (zh) * | 2019-08-15 | 2025-01-10 | 深圳引望智能技术有限公司 | 语音交互方法、装置、终端及存储介质 |
CN113362828B (zh) * | 2020-03-04 | 2022-07-05 | 阿波罗智联(北京)科技有限公司 | 用于识别语音的方法和装置 |
CN114072875A (zh) * | 2020-05-29 | 2022-02-18 | 华为技术有限公司 | 一种语音信号处理方法及其相关设备 |
CN111667831B (zh) * | 2020-06-08 | 2022-04-26 | 中国民航大学 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
CN111667830B (zh) * | 2020-06-08 | 2022-04-29 | 中国民航大学 | 基于管制员指令语义识别的机场管制决策支持系统及方法 |
-
2020
- 2020-06-08 CN CN202010511326.6A patent/CN111667831B/zh active Active
-
2021
- 2021-06-03 WO PCT/CN2021/098174 patent/WO2021249285A1/zh active Application Filing
-
2022
- 2022-11-29 US US18/059,967 patent/US20230085781A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102610127A (zh) * | 2012-03-02 | 2012-07-25 | 南京航空航天大学 | 一种机场飞行区场面运行综合监视系统 |
CN104952285A (zh) * | 2014-03-25 | 2015-09-30 | 霍尼韦尔国际公司 | 用于飞机场表面移动模型的自动生成的系统和方法 |
CN106251879A (zh) * | 2016-07-28 | 2016-12-21 | 中国民航大学 | 一种民航地空对话校验系统 |
CN106356063A (zh) * | 2016-08-28 | 2017-01-25 | 桂林市晶准测控技术有限公司 | 一种对管控语音进行文字识别的方法和系统 |
CA2989880A1 (en) * | 2017-03-17 | 2018-09-17 | Honeywell International Inc. | Systems and methods for graphical visualization of communication transmissions received onboard an aircraft |
Non-Patent Citations (1)
Title |
---|
空管模拟训练中指令的语音识别与合成技术研究;袁伟伟 等;《电子设计工程》;20130331;第21卷(第6期);第8-11页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111667831A (zh) | 2020-09-15 |
US20230085781A1 (en) | 2023-03-23 |
WO2021249285A1 (zh) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111667831B (zh) | 基于管制员指令语义识别的飞机地面引导系统及方法 | |
CN111667830B (zh) | 基于管制员指令语义识别的机场管制决策支持系统及方法 | |
US11900817B2 (en) | Aircraft speech recognition systems and methods | |
Delpech et al. | A real-life, french-accented corpus of air traffic control communications | |
CN109448493A (zh) | 塔台管制模拟训练系统、语音管制指令识别及报读方法 | |
CN106910376B (zh) | 一种空中交通运行管制指令监控方法与系统 | |
CN110111792B (zh) | 空中交通管制自动指挥系统 | |
CN110648405B (zh) | 一种基于增强现实的飞行操作辅助方法和系统 | |
Helmke et al. | Readback error detection by automatic speech recognition to increase ATM safety | |
CN114648893A (zh) | 用于自主飞行器的对话系统 | |
CN106846920A (zh) | 一种基于自然语义提取的空管辅助决策方法 | |
CN114155861A (zh) | 空管语音智能监控系统 | |
CN111581780A (zh) | 复杂空域场景下机场群空域仿真建模与验证方法及装置 | |
CN113948091A (zh) | 民航客机陆空通话语音识别引擎及其应用方法 | |
CN111627257B (zh) | 基于航空器运动趋势预判的管制指令安全预演与校验方法 | |
CN115440191B (zh) | 一种基于深度学习的飞机驾驶舱安全辅助方法及电子设备 | |
CN106448272B (zh) | 一种驾驶员执行管制指令情况的监控方法及装置 | |
EP3855428B1 (en) | Aircraft speech recognition systems and methods | |
CN114187893B (zh) | 空管语音智能监控方法和系统 | |
CN115148209B (zh) | 基于座舱语音识别的自动报告生成方法和系统 | |
CN109300466A (zh) | 一种基于语音技术的复杂设备智能虚拟训练方法和系统 | |
WO2022063288A1 (zh) | 一种机上信息辅助系统和方法 | |
CN113821053A (zh) | 一种基于语音识别和关系抽取技术的飞行辅助方法和系统 | |
CN115691274A (zh) | 一种飞行程序验证和运行处理方法及装置 | |
CN115392011A (zh) | 基于vr的单轨高架区间疏散救援试验系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |