演講時間: 114年4月23日(三) 14:00~16:00
演講地點: E6-A203教室
演講者: 周彥儒 Director of Security Engineering(Coupang)
演講主題: 大型語言模型驗測革命:LLM-as-a-Judge 的實踐與挑戰
演講大網: 隨著大型語言模型(LLM)推理模型(reasoning model)與人工智慧代理(AI Agent)的快速迭代,LLM 已成為各行各業推動效率與創新的重要技術組件。然而,複雜的應用場景與 AI 風險使企業在導入 LLM 時面臨極高的挑戰。本次演講將探討 LLM 在風險驗測上的困境,並提出 LLM-as-a-Judge 的創新驗測方法,以協助企業有效應對這些挑戰。講者將深入分析 LLM-as-a-Judge 的架構與關鍵成功因素,讓聽眾了解如何透過創新的 LLM 驗測方法,強化 AI 系統的安全性與可信度,為組織在 AI 風險驗測與管理奠定堅實之基礎。