中国民航科学技术研究院科技处副处长乔东虓 演讲
 
中国民航科学技术研究院科技处副处长 乔东虓(张哈斯巴根/摄)
 
航科院AI技术行业应用情况

中国民航科学技术研究院科技处副处长 乔东虓:我今天汇报一下航科院在AI技术应用方面的一些工作,以及我个人的思考。

这个是EASA在2023年发布的一个人工路线图2.0,这个图里头讨论了广义的AI方法,包括符号逻辑统计和机器学习等技术,范围非常广,而我们现在通常说的AI,比如各种语言模型,图像识别技术,其实主要还是这个图里头的深度学习这一块,更多的指的是深度神经网络技术。

我们现在天天说的Deepseek、千问,什么ChatGPT这种大语言模型,还有常用的图像识别模型,用的都是深度神经网络技术。当大家都在关注语言模型的时候,在很多民航的业务场景,其实传统的机器学习等AI技术也有很多很大的应用潜力。正如EASA的路线图所说的,我今天分享的航科院的AI研究工作,也不局限于大语言模型,希望能给同行带来一些启发。

我今天汇报分为大概三块,也是院里头主要业务。第一块是智慧监管这一块,航科院是中国民用航空局的安全技术中心,给局方提供安全方面的全面技术支持。

其中一项重要任务就是建设和运行飞行品质监控基站,飞行品质监控基站航司的同志都可能比较熟悉,它汇聚了全行业的QR数据,搭建了中国民航安全分析系统这一国家级的数据分析平台,平台以数据为核心,将飞行的大数据资源有效融合,实现了航班监控,核心风险分析、专题风险分析,航迹分析以及运行风险预警等功能,满足全民航的运行风险分析监控和预警的需求。

我们院基于这个平台也定期的给航班提供一些报告,这里头的绝大多数数据都是定量的数字,来自于飞机上的传感器。这个平台利用AI技术主要是传统的机器学习模型和统计分析,为用户提供按需模型构建的功能,比如说擦机尾风险预预测,冲出跑道预测模型等。

这些模型只用主要分类了采用了分类聚类回归等传统算法,实现了海量数据的自动挖掘,更重要的是平台还给用户提供了自己创建分析模型的功能,用户可以在自己在这个平台上通过创建算法,分析处理授权的数据和同行的数据进行比较。我们也是希望把这个行业的力量都集中起来,共同使用AI技术,充分挖掘QR数据的价值。

给一个小例子,基于行业的数据,我们可以进行一些非常规操控风险的统计分析。比如说我们通过对数据进行简单的自动统计,通过判断离群点,可以发现一些潜在的运行风险。目前我们用到的算法主要是K均值、算法等一类传统的聚类算法。可以说传统的机器学习算法在处理定量数据方面还是比较好用的。我了解到也有不少航司的同行在利用AI技术来分析QR数据,希望可以通过QR数据,预测发动机、空中停车等重大安全风险,精细化预防维修。有些航司在这方面也是做得非常好的,当然我们也在积极探索使用transformer架构的时间序列模型来处理QR数据。以后有机会再向同行汇报成果。

第二块是品质出行。航科院还有一项重要的任务是有一个局方局设机构叫消费者事务分中心,受理行业的消费者投诉。与飞行品质监控不同的消费者事务,主要处理的是文字、语言等文本信息,在这些场景下,NLP技术也就是自然语言技术广泛采用。航科院建立了全域多模态,旅客投诉官方采集平台,来解决消费者投诉和受理的问题处理的处理问题,包括12326民航服务质量监督平台,12326智能呼叫系统,以及集成在航旅纵横APP上的消费者评价模块,一些模块入口总体上都是采集文本和语音数据,进行自动分析和处理。

这个是12326民航服务监督平台的一个实时监测大屏,实时监控民航服务诉求的数据。而消费者事务另外一块是应对媒社交媒体的舆情问题。2023年,我们在平台上开拓展了民航旅客舆情监控模块,聚合了新闻、微博、微信、自媒体论坛、短视频、境外媒体等多渠道海量的多模态数据,监测民航服务网络舆情信息,该系统已经执行过,例如票价浮动、超行李管控等情景下的舆情监测任务。

为了解决旅客出行中的困难和问题,进一步提高12326呼叫中心日常和节假日投诉的接通率。2023年,我们中心还增加了AI智能机器人接电话功能,可以在节假日突发应急时刻及时发挥作用,避免旅客长时间在线等待,通过电话填写表格,即可享受到更加便捷、人性化的服务体验,让机器人客服成为人工客服的助手,服务更多的旅客,我们还在陆续开发上线基于大语言模型和智能体技术的线上投诉咨询功能。

前两项都是局方的任务,另外在运行保障领域,航科院也在陆空通话技术识别等方面开展了深入研究。

比如说在AI语音识别领域,我们建立了中英文ATC语音识别数据集模型和产品的研发体系,实现了通用中文、英文和带口音英文的在线识别,不能下游应用。这个系统首先它能够在线实时接收与管制通话,接着进行降噪人声,人声切检测切分、身份识别、指令解析等,从ASR下输出的文本格式的管制指令中,解析出管制员给出的是爬升还是下降,是调整航向还是进行编制?参数是多少?到了终端区以后,管制员发布了进场的程序跑道号,预落地之后它也可以提取华星信息,这些信息对下游特别是地面服务来说,它都是非常有数据的,非常有价值的数据,但是这些数据它都在管制的系统里头,传统上它和地面的服务和航司的地服公司,它都是不通的。

所以我们也是打通了这个环节,通过这些第一时间的数据赋能下游的应用,总体上语音识别这块通过ASR的研究,ASR技术还在这些场景都有可能会有一些潜在的应用,根据ASR的研究,欧洲使用了数字管制系统以后,通过使用自动语音识别技术,能够帮助管制员提高效率,帮助航司节能降耗。

在鸟击防范领域也是我们院里头研究的一块特色,在鸟击防范领域,我们医院针对鸟类活动带来的飞行隐患,深入开展了基于雷达光电设备的鸟类探测及联动驱赶技术。我们的特色就是团队依据AI算法,不仅能够快速锁定空中的鸟类目标,还能凭借鸟类的体型飞行姿态等特征识别鸟种。工作的基础是因为航科院多年以来在这个领域积累了大量的鸟类的红外和可见光的标注数据,这个数据也是非常稀缺的,可以用于各种图像识别模型的训练。

另外一块工作是在安保方面,航科院还承担了相当于民航安保技术审定中心的一个角色,我们院建有2000多平米的民航安保实验室,设计建立的实验系统覆盖了机场手提行李托运行李货物和人身安检的各类设备,以及AI技术应用机场安保工程的为界,视频监控、通行管制、人脸识别智能判图等场景。在这个领域我们做的工作其实主要可以分为两块,一块是我们也建立一个安检设备智能判图的数据集,实现对更多种类近现代物品的自动识别,提高判读精度,以进一步减轻人工判图的工作量,降低漏判率,提升安检速度。随着技术的进步,这种近现代物品不允许带这种物品,其实也是它在不断发生变化的。我们院里头维护了这样一个快速更新的数据库,利用院里头工作的优势,所以这里应该是行业里头比较大的一个数据集,能够不停的去迭代这个数据,迭代数据,跟上时代的发展。

另外一方面,作为局方的支持机构,前面说的是矛,我们研究怎么样去判断。后面我们还要研究盾,我们也在建立和完善人脸识别安检判图的测试数据集,这个作用是什么?可以为业界的其他供应商提供独立的权威的检验检测服务,促进行业AI应用水平的提高。举个例子就是我们在研究中我们发现,某一个供应商的自动判图产品,它标称对打火机的识别率能达到95%以上,但是经过数据集上测发现远远达不到95%,只有60%多。我们分析为什么?因为打火机这种它也层出不穷,如果你不及时更新你的训练集的话,你的训练的所能识别打火机的品类就会非常有限,随着时间的演化,你的识别率它就会不断的降低。

所以航科院建立这样的一个独立的测试基准,可以为行业提供统一的标准。以上就是航科院目前在 AI应用这块的一些典型例子。

最后关于对后续AI应用研究的一些想法:

第一块是我觉得应该推动AI技术的大规模普及,而在实际的业务中,其实特别是在数据分析的场景,有很多简单的AI算法,能够大幅度提升工作效率,挖掘数据的价值。现在大语言模型已经非常厉害了,他的编程能力非常高了。如果这让以前需要专业人员才能完成的机器学习算法,去分析数据的门槛就大幅度降低,通过使用AI辅助生成的代码,稍微有点编程经验或者数学基础的人都可以学会使用传统的机器学习算法,对大量的数据进行自动分析,发挥企业各类数据的价值。在QR数据分析的过程中,我们也鼓励基站的人员能够人人都通过AI辅助,尝试将各种机器学习的模型用于日常的业务,远期是向希望让每个人都能够通过自然语言进行编程,来分析处理大规模的数据,不断创新分析的模型。

第二个领域,我的想法是强化学习的应用和研究。而这三年来,特别ChatGPT发布以来,人工智能非常火,但是我们日常见到的人工智能大部分还是基于监督学习这种范式,这种方式特别依赖于高质量的标注数据集。上午也有不少其他同行的领导提到了这一点,但是实际上我们在工作中发现,目前能够方便拿到的高质量数据集大部分都已经拿到了,都用上了。

而民航大部分非常高价值的场景,比如说机坪管制的优化,比如说空中那种冲突的解脱,比如说流量的空中流量的管理,这种高质量的标注数据是非常稀缺的。另外一方面就是说我们现在用的这些模型,所谓的监督学习模型大部分都是离线模型,一旦训练好之后上线了,这个模型并不会自动的优化,每次要优化都要重新去标注数据,重新去训练模型,这和理想中的人工智能还是有差距的,我们非常希望的人工智能是他能够像人一样,通过工作不断总结提高。

所以如果要实现这种模型的在线训练,强化学习就是这样一种学习方式。这种学习方式它不依赖大量的标注数据,而是通过模拟或者在实际中使用,不断的自我总结提高。这种特性在一些场合,比如说停机位的优化,空中交通管制等具有非常大的应用潜力。上午西南空管局的苏总介绍了未来信息共享的一个新的体系,SWIM这个体系打通了信息的共传输或者共享的问题。但是如何使用好这些TBO运行的数据,如何实现基于实时数据的科学协同,而不是人工去读了数据去协同。我认为强化学习是一个非常重要的基础技术。这些问题其实也都是很难用现在这种基于监督学习大语言模型来解决的。

我看到泰雷兹公司在2025年也发布了一些基于强化学习的产品,来解决管制领域的冲突解脱问题。航科院也正在组建强化学习的团队,希望推过是以点带面,推动强化学习范式在民航领域的应用。

 
中国民航报社 版权所有 京ICP备05024158
如有意见和建议,请惠赐E-mail至 news@caacnews.com.cn
./t20251014_1390476_sj.html