Reward function optimization

Inherent AI Alignment vs Learned AI Alignment (Prompt Engineering Secrets)
Reinforcement Learning: AI (Brace For These Hidden GPT Dangers)