2024年7月17日下午,信息学院邀请香港城市大学宋林琦教授作了题为“基于大语言模型的推理研究”的学术报告。报告由信息学院的刘杰教授主持,信息学院三十余名师生聆听了此次报告。
宋林琦教授在清华大学获得电子工程学士和硕士学位,在加州大学洛杉矶分校获得电气工程博士学位,他的研究兴趣包括信息理论和编码理论、通信、机器学习和大数据等。
报告中,宋林琦教授详细介绍了大语言模型在数学推理中的应用,特别是GPT-4代码解释器在解决复杂数学问题中的表现。他提出了Explicit Code-based Self-Verification(CSV)方法,通过自动生成和执行代码、自我调试等手段,显著提高了模型的推理准确性。宋教授还介绍了他的最新研究成果—MUSTARD框架,这一框架通过结合LLMs的口头表达和形式定理证明器的数据验证优势,生成高质量的数学数据,并在多个实际应用中展示了其有效性。
报告结束后,宋林琦教授回答了与会老师和同学们的提问,与大家展开了热烈的讨论。他分享了自己在研究过程中的经验和心得,并对未来LLMs在数学推理及其他复杂任务中的应用前景进行了展望。与会老师和同学纷纷表示受益匪浅,对未来的研究工作充满了新的思考和灵感。
此次讲座不仅加深了信息学院师生对大语言模型在推理研究中的理解,也为大家今后的科研工作提供了新的思路和方向。