全场景服务的核心关键技术. 卫星网络的高动态性及有限的卫星容量, 导致面临以异构网络管理, 动态资源分配为代表的一系列管控挑战. 由于机器学习技术在网络设计等方面具有显著优势, 因此提出软件定义的卫星互联网智能化架构. 针对卫星互联网的智能路由问题, 利用基于双延迟深度确定性策略梯度的深度强化学习算法, 解决网络的实时路由优化问题. 实验结果表明, TD3 算法相较于DDPG 算法, 平均网络时延降低了19.19%.