杨敏博士:基于法律大模型的智能法律系统
9月26日,杨敏博士受邀参加人工智能助力法治化营商环境发展论坛暨得理法律大模型发布会并发表了“基于法律大模型的智能法律系统”主题演讲。杨博士是香港大学计算机博士,担任中科院深圳先进院高性能数据挖掘实验室主任,是深圳市海外高层次人才,入选斯坦福大学发布的2021/2022全球前2%顶尖科学家。在演讲中,杨博士系统介绍了人工智能在法律行业发展的背景、现状和进程,并且详细解读了得理法律大模型的构建和优化过程。
杨博士表示,人工智能在法律领域兴起的主要原因在于法律数据的爆炸式增长使得法律领域面临了诸多挑战。首先是法律资源的匮乏;其次是法律服务市场信息不对称;最后,法律服务的成本略高。
杨博士梳理了国内外法律智能发展的进程,并指出无论国内外,法律智能都在逐渐发展壮大。当事人、律师和公检法机关是法律事件的三个主要参与主体。法律智能可以在不同的应用场景,面对不同的主体,提供不同的产品服务。针对当事人,法律智能能够提供法律咨询、律师匹配、合同起草及审查等服务;针对律师或律所,法律智能可以帮助进行法律文书和法规、案例的检索、案情预测与分析等;针对法院或检察院,法律智能可以发挥法律文书处理、证据分析、量刑辅助和类案推荐等作用。
杨博士在系统介绍法律智能的现状和进程后,针对法律知识图谱、智能法律咨询、智能案例检索、智能类案推荐,以及得理法律大模型展开了详细解读。
在法律知识图谱构建上,结合法律知识图谱,引入法律专业知识,可以使得法律问答更专业。
在智能法律咨询方面,自动化法律问答系统可以大大简化法律服务提供者与需求者的咨询交流过程。
在智能案例检索方面,传统的文本检索方法需要事先厘清案件事实,分析法律关系,确定检索关键词才能进行检索。对此得理法律大模型深入研究,创新采用语义检索方法来解决传统文本检索方法的不足。
在智能类案推荐方面,传统方法无法进行模糊检索、准确率低;确定搜索关键字的过程繁琐、低效。智能类案缓解了预训练语言模型对输入文本长度的限制,提高了模型的运行速度和性能;自监督学习减少了模型对标注数据的依赖,提升模型的准确性和泛化性。
杨博士指出,ChatGPT的出现使得多轮对话系统进入大众视野,越来越多的人开始使用大语言模型来辅助工作。然而,通用大语言模型通常难以生成准确且专业的答案,难以适用于专业性要求高的法律行业。因此,研究针对法律领域的大模型尤为重要。
杨博士提出,法律领域大模型的研究面临着两个挑战:一是法律领域专业性强;二是标注数据难以获取。为此,杨老师与得理法律人工智能联合实验室从以下三个方面钻研提升法律大模型的效果:
首先,数据方面,邀请法律从业人员标注了大量的高质量数据。
其次,专业知识方面,构造了法律知识图谱,在大模型中融入知识图谱信息。
最后,模型算法方面,研究知识增强文本生成、大模型知识对齐、大模型高效推理等。
在以上研究方案基础上,通过模拟性能和检验,得理法律大模型在法律领域的实际应用效果远远超过了通用大模型。
未来,相信在杨博士的指导下,在与用户的交流反馈和支持下,得理法律大模型也会不断完善进步,以越来越好的面貌与各位相见。
喜欢的朋友记得点赞、收藏、关注哦!!!