RL

RL is a unknown in our research taxonomy.

Related papers

Output-Space Search: Targeting LLM Generations in a Frozen Encoder-Defined Output Space
Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models
IB-GRPO: Aligning LLM-based Learning Path Recommendation with Educational Objectives via Indicator-Based Group Relative Policy Optimization
M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints
UCPO: Uncertainty-Aware Policy Optimization
Advancing General-Purpose Reasoning Models with Modular Gradient Surgery
SimuAgent: An LLM-Based Simulink Modeling Assistant Enhanced with Reinforcement Learning
The Hierarchy of Agentic Capabilities: Evaluating Frontier Models on Realistic RL Environments
MemCtrl: Using MLLMs as Active Memory Controllers on Embodied Agents
Report for NSF Workshop on AI for Electronic Design Automation