编者按:本文来自微信公众号 新智元(ID:AI_era),项链创业邦经授权转载,人造然暴头图来源摄图网一旦人类掌握了可控核聚变能,太阳突破将可拥有无穷不尽的精准检查清洁能源。广告可御可甜 有颜有料 惩罚整蛊任你选 >>进入直播间与主播亲密互动×要知道 ,放电反馈控制对于「托卡马克装置」的实现岁女瘦去时让运行至关重要 。而控制系统会主动管理磁线圈 ,可控以控制拉长离子体的核聚不稳定性,防止破坏性的变新垂直事件发生 。此外 ,儿突人类若能实现对等离子体电流 、医院位置和形状的娃摘精确控制,还可以实现热排放 ,掉爸甚至对其能量的妈慌没戴管理。一直以来 ,张娃科学家们致力于研究等离子体配置变化对这些相关量的影响。因此就需要能够用于新配置 ,以及围绕标称场景快速变化的系统。传统上 ,等离子体的精确控制是通过等离子体电流、形状和位置的连续闭环来实现的 。在这种模式下 ,控制设计者预先计算出一组前馈线圈电流,然后为每个受控量建立反馈回路 。等离子体形状和位置无法直接测量,必须通过磁场测量实时间接估算。尤其是等离子体的形状,必须使用平衡重构代码进行实时估算。虽然这类系统已成功稳定了大范围的放电,但其设计不仅具有挑战性 ,还耗时,特别是针对新型等离子体情况。值得一体的是 ,强化学习(RL)已成为构建实时控制系统的另一种全新范式 。2022年,DeepMind团队登上Nature的一篇论文表明,RL设计的系统能够成功实现「托卡马克磁控制」的主要功能 。论文地址:https://www.nature.com/articles/s41586-021-04301-9这项工作提出了一个系统,RL智能体通过与FGE 托卡马克模拟器交互,学习控制托卡马克配置变量(TCV)。智能体学习的控制策略随后被集成到TCV控制系统中 ,通过观察TCV的磁场测量,并为所有19个磁控线圈输出控制指令 。尤其 ,研究人员展示了RL智能体控制各种情况的能力 ,包括高度拉长的等离子体、雪花 。甚至还展示了同时在真空室中