State-Action Value Function (Q-function)

Markov Decision Processes: AI (Brace For These Hidden GPT Dangers)
Bellman Equation: AI (Brace For These Hidden GPT Dangers)
Deterministic Policy Gradient: AI (Brace For These Hidden GPT Dangers)
Q-Learning: AI (Brace For These Hidden GPT Dangers)
Deep Reinforcement Learning: AI (Brace For These Hidden GPT Dangers)
Temporal Difference Learning: AI (Brace For These Hidden GPT Dangers)
Policy Iteration: AI (Brace For These Hidden GPT Dangers)