
技术摘要:
本发明实施例公开了一种基于深度强化学习的燃料电池系统的燃料供给方法,涉及燃料电池技术领域,能够改善燃料电池的使用效率和寿命。本发明包括:获取燃料电池系统的工况数据的样本集合,根据工况数据的样本集合得到功率需求,DDPG控制器的目标为:在燃料电池系统输出 全部
背景技术:
在能源逐渐枯竭的今天,传统的化石燃料载具也在尝试变革,新能源汽车、电驱动 飞行器、新能源船舶等应运而生,而氢燃料电池混合动力系统,则是其中的一种能源解决方 案。 而目前燃料电池系统的燃料供给方法,大多是各种智能算法来控制空气压缩机的 电压,目的是为了跟随最佳的过氧比。该种控制方法可以较为优秀的保证燃料电池的工作 效率和使用寿命。 但是,这种燃料电池系统的燃料供给方法也存在一些问题:由于燃料电池系统的 目的只是跟随最佳过氧比,而由于附件损耗的问题,氢气的供给只是简单的按照一定的比 例过量通入,不能够准确及时的满足由能量控制策略分配的燃料电池系统的功率需求。因 此,需要突破传统方案的桎梏,进一步现多控制量、多目标的控制。
技术实现要素:
本发明的实施例提供一种基于深度强化学习的燃料电池系统的燃料供给方法,能 够及时准确的满足能量控制策略分配的燃料电池功率需求,且燃料电池系统的过氧比能很 好的跟随最佳过氧比,改善燃料电池的使用效率和寿命。 为达到上述目的,本发明的实施例采用如下技术方案: 获取燃料电池系统的工况数据的样本集合,根据所述工况数据的样本集合得到功 率需求,其中,所述工况数据至少包括:速度信息;利用DDPG控制器和所述功率需求,训练工 况预测模型,其中,所述DDPG控制器的目标为:在燃料电池系统输出功率,满足能量控制策 略需求功率的同时,保持过氧比在预设范围内,所述工况预测模型包括:氢气流量控制阀模 型、空气压缩机模型和燃料电池系统模型;将实际的工况数据输入所述工况预测模型,得到 速度预测序列;利用所述速度预测序列,得到所述燃料电池系统的实际功率需求,并根据所 述实际功率需求控制所述燃料电池系统的氢气流量阀和空气压缩机。 本发明实施例,属于燃料电池系统燃料供给控制领域,其主要的设计思路包括:建 立氢气流量控制阀模型、空气压缩机模型以及燃料电池系统模型,建立DDPG控制器,确定 DDPG控制器观测量、动作量、程序提前终止条件还有回报函数的参数,并训练基于DDPG的燃 料电池系统燃料供给模型,通过车速预测神经网络得到未来车速,通过DDPG控制器控制汽 车行驶。燃料电池系统可以有效的在考虑了附件损耗的前提下,及时准确的满足能量控制 策略分配的燃料电池功率需求,且燃料电池系统的过氧比能很好的跟随最佳过氧比,改善 燃料电池的使用效率和寿命。 6 CN 111584906 A 说 明 书 2/13 页 附图说明 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的 附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领 域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附 图。 图1为本发明实施例提供的基于DDPG的燃料电池系统燃料供给流程图; 图2为本发明实施例提供的氢气供给、空气供给以及燃料电池系统模型图; 图3为本发明实施例提供的DDPG控制器参数设置图; 图4为本发明实施例提供的基于DDPG算法的燃料电池系统燃料供给模型训练流程 图; 图5为本发明实施例提供的DDPG算法更新流程图。