《财经》记者 刘甦 张瑶/文 李恩树/编辑
世界上最顶尖的律师们,在最新一场和人工智能的对决中输了。
2月26日,名为LawGeeX的以色列科技创业公司发布报告称,其法律AI平台与20位来自斯坦福大学等背景的律师比赛审阅法律合同。结果显示,其AI系统和人类律师平均准确率分别为94%和85%。时间差别更为显著——律师平均花费92分钟,AI耗时则仅26秒。
伴随着大数据、人工智能和区块链等技术热潮,大量创业科技公司正涌入法律服务行业,试图为法官、检察官和律师提供系统的智能服务,从智能速记员、智能量刑到断案辅助功能,其野心是实现从“助理”到“决策者”的替代。
不断增长的案件数量和结案压力使得司法系统对此充满期待;此外,商业活动中企业的大量法律服务需求,也催生出科技公司的大量细分机会。然而,对于这一需要大量经验和知识积累的行业来说,技术事实上仍在被用于解决行业初级痛点——提高效率减少重复工作。
关于“机器人法官”和变革行业的畅想,都处在前夜。
AI助力司法尝试
“即便加班加点,平均每个法官手中仍有211.43件案件无法审结,我们深感愧疚!”2018年伊始,广西南宁市青秀区法院门前便张贴出一份倡议书,称因工作压力太大,该区已有15%法官辞职、调离和提前退休,并有多人积劳成疾;而2018年预计收案超过4万件,压力将不减反增,因此呼吁当事人尽可能选择其他调解纠纷的手段。
大量法院都面临着类似的压力。江苏省一位基层法官告诉《财经》记者,其2017年全年审结案件近300件,尽管涉及疑难案件不多,但简单重复地审理也让加班和过劳成为他的生活日常。
最高法院和最高检察院数据显示,本轮司法改革实行员额制以来,法官和检察官人数已从20万和17万人分别缩减至12万和8.4万人。与此相对,案件数量则由于立案登记制度的实行猛增。全国法院审结、执结的案件,已从2013年的1200多万件增至2016年的1900多万件。
巨大审结压力下,通过引入大数据和AI等技术,推广“智慧法院”系统提高效率,让机器取代一部分简单和重复劳作,于司法系统从业者而言是刚需,于法律科技公司则是商机。
1月29日,京都律师事务所与中国政法大学法学院大数据与人工智能法律研究中心联合发布的《2017年度互联网法律服务行业调研报告》称,2016年和2017年中国新上线共131家互联网法律服务机构,占到业内互联网法律机构总量的50%以上,并已进入不同细分领域建立商业模式。
对基层检察官而言,对案件证据情况进行摘录、归纳以及分析,最终形成审查报告往往占用绝大部分工作时间。梅哲宾是浙江省杭州市余杭区检察院的检察官,其所在部门刚开始试用杭州“智慧公诉”办案辅助系统。他向《财经》记者介绍,这一系统有证据录入、事实归纳和风险提示等功能,对以往费时费力的工作带来改善,实用性很强。
另一个正在落地的是人工智能语音速录技术,旨在成为“智能书记员”。例如,改变当前庭审笔录记录模式,将各方对话自动实时识别成文字,包括合议庭法官的评议过程也实时记录,提升审判效率,减轻法官和书记员的办案负荷。
不过,法院要求生成的司法文书准确度极高,而庭审过程受方言、口音以及法律专业术语等的影响较大。因此,尽管诸如科大讯飞等公司已为许多办案机构定制输入系统,浙江省高级法院法官程闯的体会是,智能速录系统对许多同事工作效率提高影响不大。
北京华宇元典信息服务有限公司总经理邹劭坤告诉《财经》记者,目前技术界公认语音识别在AI领域已经取得明显突破,不过接下来很大的困难是如何打造专业团队对标准数据集进行标注,以方便机器学习,从而更加精准识别。
此外,对新技术有极大需求的另一商机在电子存证领域。互联网经济使大量行为发生在线上,稍纵即逝的信息、线索和证据不加以及时固定和公证,已在实践中给当事人维权和司法鉴定带来高成本、不便利等问题。许多公司亦称正在应用区块链技术不可篡改和同步性的特征进行电子存证,极富潜力。
另一家法律科技服务公司联合信任时间戳的商业模式为向法院提供诸如诉前证据保全、电子卷宗、留置送达认证等方面服务,检察机关则主要应用其电子卷宗、电子证据固化、勘验等功能。其创始人张昌利告诉《财经》记者,其公司在司法诉讼领域有20多个地区的150多家法院有采信的司法判例。
不过,对于这些公司而言,如何向相对保守和被动的司法机关证明其可信度是一大难点。
中国政法大学证据科学研究院工程师、电子数据司法鉴定人许晓冬告诉《财经》记者,能在司法鉴定中被采用的证据,一方面需要符合国家相应部门的法律规定,其次需要其在技术上得到认证和确信,保证所采用的电子签章系统产生的数据都是无污染而不可被篡改。而由于缺乏相应国家标准,如何解决这些公司的可信任度问题,他持审慎和保留态度。
大数据痛点
AI技术依赖于大数据,法律行业不无例外,司法数据的深度挖掘成为必然。
通过挖掘利用海量司法案件资源,提供面向各类诉讼需求的相似案例推送、诉讼结果预判等服务,为减少不必要诉讼提供有力支持,这是目前应用较多的能够辅助办案的类案系统。
最高法院先后在2010年、2013年、2016年三次发布了《关于人民法院在互联网公布裁判文书的规定》,截至2017年上半年,裁判文书公开总量超过3200余万篇,这为司法数据深度挖掘提供了较好的资源基础。
2017年2月起,上海高级法院研发团队运用大数据技术对上海原有3万余份刑事法律文书、9012件典型案例、1695万条司法信息资源进行比对、分析,通过人工智能的深度研究,针对司法实践中取证环节的易发、多发、常见问题,制定证据标准、证据规则,并把这些标准镶嵌进数据化的办案程序中,推出了“上海刑事案件智能辅助办案系统”。
在这个系统的倒逼下,“侦查人员从接受案件开始就必须按照规定来收集固定证据,确保侦查移送起诉案件符合法律规定的标准和程序”,上海市高级法院院长崔亚东接受《经济日报》采访时称,系统还具有证据校验、审查判断等功能,及时发现、提示证据中的瑕疵和证据之间的矛盾,防止“一步错、步步错、错到底”的现象发生。
此类尝试无独有偶。此前一年,广州市中级法院对历史上300多万件同类案件进行大数据分析,形成“智审辅助量刑裁决系统”。该系统对影响盗窃案判决的20多种情形、每种情形占多大权重作出分析。当法官输入案件要素后,系统会在传统推送相似案例的基础上自动进行比对和运算,并对量刑幅度给出图形分析和数据参照。
对于这类大数据系统的使用情况,司法人员反映不一。
有检察官说,他们正在试用的“智慧公诉”系统有量刑参考功能,但是因为录入的生效案件还比较少,无法对部分罪名的量刑提供参考。
北京市海淀区检察院检察官白磊也有同样感受,负责新科技领域犯罪公诉的他少有使用该类软件的经验,原因在于高科技类犯罪形式太新无例可循,他的日常工作更多需要进行大量人工判断和逻辑分析。
不过他告诉《财经》记者,这类软件对于从事普通刑事案件,如盗窃、危险驾驶罪等案件公诉的同事较有帮助。该类案件发案率高、情节相似,在提起公诉前使用类案系统查询同类案件的判案情况,可以参考比对提出更为合理的量刑建议,以确保司法稳定性和破解“同案不同判”的问题,更为公平。
然而,利用断案辅助系统来提高裁判的一致性和可预期性,其实操性一直在业内受到质疑。
程闯的担忧是,如同世界上没有完全相同的两片树叶,也不会有两个完全相同的案件,如何利用类案系统进行参照?很难说清楚不同的影响因子、不同情节对量刑的影响比重;另外,判案时信访风险、考核指标等隐性因素也难以通过类案系统分析。
北京仲裁委员会副秘书长陈福勇亦表示,断案辅助系统的“一致性”能做到什么程度,有讨论余地。特别是对于仲裁这种要求一裁终局、裁决保密的裁判系统而言,无法公开数据,因此只能在一个机构内部应用,实用性有待检验。
除此之外,人文关怀也是类案软件无法解决的一大痛点。
“只有人类法官,才能切实考虑到案件的具体情况,灵活采用附条件不起诉、主持刑事和解、民事调解等来化解社会矛盾;也才能考虑到当事人的困境,给予司法救助,联系相关部门,予以法外关怀。”在程闯看来,目前的技术无法企及,宽严相济的刑事政策将难以实现。
“按照算法推送相应的案件,很难全面、客观。而自己寻找,可能更有针对性。”程闯认为。
AI如何兼容司法
让大数据辅助量刑之外,更具野心的目标是培养真正的机器人“律师”和“法官”,在机器学习和训练的基础上,直接作出法律判断。而技术不仅需要自身突破,还需解决伦理问题。
2016年底,无讼网络科技(北京)有限公司推出法律机器人产品“法小淘”,功能在于一方面帮助中小企业精准匹配相应的律师,另一方面它本身便可以回答简单法律问题。目前,无讼科技已获得两轮1.47亿元投资。
无讼科技副总裁庄大衞告诉《财经》记者,“法小淘”目前通过对中国裁判文书网大量案例的机器学习,以及对已有法规、工商系统、法院执行信息公开系统等的数据学习,来获取不同行业法律知识。其目标是,企业客户通过自然语言描述自己遇到的法律问题,法小淘可以对问题自行分析并生成相应的专业法律答案,而如果遇到复杂或疑难问题,再精准匹配平台上专业律师去解决。
尽管已经有较为成熟的数据库并进行长期开发,庄大衞称,目前法小淘就法律问题生成的答案均需人工审核,相当大比例的答案需要经过人工修改以后才能被公布。能够生成具备可操作性的答案也因此成为法小淘今年的工作目标。
“机器人法官”则显得更加遥远,邹劭坤称,一些人认为,法律逻辑是一个封闭的规则体系,容易被AI学会——系统只要给出具有法律规定的大前提,输入发生的案件事实,就会得出相应裁判结果。但实际上,无论是民商事领域,还是刑法、行政法领域,某一法律问题的解决可能会存在多种学说、理论和处理结果,在直面具体的实务问题时,会存在千变万化的事实要素,存在数不清的争议点和模糊地带,绝非像围棋和德州扑克的规则那样透明、清晰。
更何况,人工智能在法律领域的应用,仍需解决大量实际问题。人工智能行业从业者廖一桥向《财经》记者介绍,传统的算法基于决策树或者概率图模型,本质上是对人的观念提炼,具有可解释性。然而,随着人工智能技术的发展,一批以深度学习和神经网络为首的黑箱模型逐渐占据算法主导地位。其特点是有强大的学习和拟合能力,通常情况下效果比传统算法更好,但同时也是个黑箱——任何人、包括算法的设计者本身,都无法理解它为何作出这样的决策。
对音乐推荐或者信用评价来说,这些算法或许不无不妥,但是涉及量刑断案、法庭保释等司法决定,现有许多“让AI断案”的口号无疑充满风险。
“这相当于人类主动放弃做出判断的权利,让充满随机性、偶尔会出错、并对自己的决策过程缄默不言的人工智能,去决定一个人是否有罪。”廖一桥说。
尽管技术上存在数据量不足、深度学习模型难以达到等难点,但各类基于AI的系统正在走进司法现实,忧虑也因此出现。美国威斯康星州诉卢米斯一案(Wisconsin v. Loomis)中,卢米斯因回答一系列问题被风险评估工具评级为“高风险”等级,法官判罚其更长的刑期。尽管卢米斯提出上诉,但由于需要保持算法隐匿性,法院最终未对这一工具的算法进行核查,并驳回上诉。
AI作出的黑箱决策也可能给司法鉴定带来难点。许晓东的建议是,在决策层面要求决策的数据都进行长期备份,以便日后发生纠纷后,鉴定人员可以通过溯源数据解决争议。
而即便能够对决策机制和原始数据进行溯源,能否得出司法鉴定结论并基于此作出法律判断,也极大考验着未来的法律从业者。
“突破法律智能研发的困难需要大量的法律行业专家和计算机算法专家,甚至非常可能是需要培养法律—算法的跨学科专家。”邹劭坤说。