October 24, 2024

Researchers discover ‘Deceptive Delight’ to jailbreak LLM

October 24, 2024

Cybersecurity researchers have discovered a new technique that could allow attackers to jailbreak large language models during conversations. The method, called Deceptive Delight, has an average success rate of 64.6%