Top
首页 > 正文

用先进技术解决传统问题 华宇携十大创新技术深耕法律科技

作为法律科技的倡导者和推动者,华宇近年来持续发力技术领域,重点突破了面向法律行业的多项技术瓶颈,通过法律AI平台将数据、知识和通用AI能力转化法律应用场景上的智能服务,为法律行业提供技术能力支撑,形成了专属的法律科技十大核心技术
发布时间:2020-09-17 14:59        来源:赛迪网        作者:

【赛迪网讯】从做法院信息化开始,做审判管理系统起步的华宇,如今已经把相关业务转到互联网上,在手机上就可以办案,可以查询案件的情况,交换证据、联系法官。特别是有了人工智能的辅助、区块链的存证,让智能诉讼、线上审判能力逐步增强。

在法律科技领域已深耕20年的华宇,一直致力于利用科技创新,推动法律行业各个环节的效率提升,并推动法律科技生态的建设。北京华宇软件股份有限公司CTO、北京华宇信息技术有限公司副总经理孙明东,在以"创新法律科技、助力法治中国"为主题的2020法律科技大会上,接受赛迪网采访时表示:"法律科技,就是用最先进的技术在解决最传统的问题。20年的发展从未停止过创新,不管是产品创新、服务创新,还是技术创新,都是推动华宇不断在法律科技领域前行的动力。"

北京华宇软件股份有限公司CTO、北京华宇信息技术有限公司副总经理孙明东

华宇十大创新技术,为法律科技注入智慧动力

作为法律科技的倡导者和推动者,华宇近年来持续发力技术领域,重点突破了面向法律行业的多项技术瓶颈,通过法律AI平台将数据、知识和通用AI能力转化法律应用场景上的智能服务,为法律行业提供技术能力支撑,形成了专属的法律科技十大核心技术。

法律知识图谱技术:基于中国裁判文书网实时更新的文本,针对高达9000多万篇文书,华宇利用自然语言处理、知识图谱等技术将法律知识点构建成完整的法律知识中心,使机器认知法律概念、模拟法律推理,知识中心涵盖法律要素(知识)数量超过1.9万项,实现了对公、检、法、司、仲裁等多个行业100多类文书进行信息项提取。

为读懂文书,防止冤案错案,华宇将过往几千万的文书做了解构,把新的案情与历史案情进行参考分析,判断当前案件与历史审判的案件情况是否相关,针对常见案由的刑事罪名和民事的案由,还有刑事的案件里面一些定罪量刑的关键要素,都是华宇做过的知识图谱。

基于法律行业的OCR文字识别技术:华宇基于AI深度学习算法,利用图像分析、字符识别等技术,对材料中的图片内容分析处理。通用印刷体文字、手写文字、卡证表格特殊格式的文字识别,支持识别的材料种类6700余类;ICR技术可有效地对材料中红章、手印、二维码、头像等20余类关键目标进行检测提取;边缘检测法、虚拟化检测法、图像增强等技术可优化处理材料的黑边、空白页、像素低、噪点等问题,综合识别准确率不低于98%。

基于特征的图像视频识别技术:华宇视频行为分析技术,基于改进后的人体姿态检测网络(OpenPose)与改进后的时空图卷积神经网络,对人体的18或25个关节点信息运作进行识别;并结合目标检测策略(基于改进后的Yolo v3架构)完成特定目标的检测、特定场景异常行为检测与预警等12类行为检测。实现了庭审视频巡查、讯问行为监控、监所视频行为监控等功能,对未穿法袍、迟到、离席、人数不足等20-30种庭审违规内容巡查,识别准确率在97%以上;能够对下蹲、坐着、站立、举手、打电话、抽烟、冲突、摔倒等监所、讯问危险动作和异常行为的识别预警,准确率达到85%以上。

多场景多语种司法语音识别技术:华宇基于NLP技术,加强对法律行业相关语音识别,重点解决了热词问题,攻克了人名、地名的准确识别,1小时音频在10分钟左右转写完成,在司法特定普通话场景识别上准确率高达98%以上;同时支持四川、河南等20多个省的方言口音,对藏语、维语等少数民族语音识别率为85%以上。

面向行业的多元审判虚拟现实技术:华宇利用虚拟现实技术,将线下法庭搬到线上,基于深度学习的轻量级分割模型,让线上虚拟法庭可以完成庭审视频中人体图像与背景的分割,人像准确识别达97%,并虚拟化呈现国徽、法庭、席位人员名称,构建出严肃、认真的线上庭审环境,同时结合远程视频会议加入多方当事人,满足多种环境下虚拟法庭的需求。

海量多元异构法律数据深度融合与管理技术:该技术可自动化数据资源的采、存、管、通,实现了从数据集成调度、存储监控,到数据资源目标管理、元数据管理、主数据管理、再到数据质量管理、数据安全管理、平台运维管理的数据全生命周期管理。并基于融合规则的自动化数据融合技术,提升了适应复杂数据融合场景的融合规则准确性,以及增量数据融合技术和亿级以上数据量级的融合性能。在司法领域实现了多源数据中人-案-物主数据实体的深度关联融合与关联关系构建,提升了数据利用价值。

PB级数据高性能高可靠存储计算技术:基于MPP+Hadoop混合技术架构,华宇实现了结构化数据、文件数据、日志数据、互联网数据、音视频等各类型数据的高性能、高可靠存储和计算;实时的数据存储计算组件,可支撑高并发流式数据实时存储和计算;支持从GB到PB级数据量快速查询与分析;高可扩展性,可灵活增加集群节点数量,线性提高系统处理能力;并支持存储计算组件的统一可视化运维管理。

潜在与隐形法律实体关系智能发现技术:基于法律知识图谱,华宇在海量的数据中逐步挖掘潜在的与隐形的法律实体关系,包括全量的"人-案-律师-企业-法官-法院……"等的关联关系,逐步构建完整的证据链条、实体画像等,让虚假诉讼智能发现、证据智能审查等机器智能变成可能。通过机器智能辅助审查,自动拆分待审事实,提取待审证据,法官审查时间降低60%。

面向司法审判闭环的个性化知识智能辅助技术:基于法律知识图谱,实现面向用户的基于案情的个性化司法知识辅助推荐(法律智库),覆盖案件审理全过程,包括案例推荐、法条推荐等10多个辅助应用。基于该技术,在刑事案件办理中根据案情进行智能化量刑分析,实现了对400多万公开刑事裁判文书全面挖掘分析,推送具有类似量刑情节的量刑结果和真实案例,并提供分析报告。目前,华宇基于知识图谱的量刑建议在最常见的10种刑事案件量刑分析准确率高达90%。孙明东在接受采访时强调,做量刑分析最终的初衷,一是辅助年轻法官,二是让自由裁量不要那么宽泛。

基于跨专业语言表达的法律思维智能交互技术:司法领域不同的人员和群体的表达方式不同,可能会造成表达措辞不一致。基于法律知识图谱的司法语言自动理解解决了该问题,为文书智能生成、智能问答、诉讼材料智能生成等智能应用逐步专业化提供了支撑。

截至目前,华宇2018年推出的法律人工智能平台,已经为法律行业提供110+业务应用场景的203个智能点支持,应用于全国24个省、自治区、直辖市的1000余家客户单位。2020年的疫情期间,华宇推出的云间互联网视频一体化法律服务平台,已助力全国法院累计开庭次数超过36W+,开庭时长超过35W+小时,开通服务的包括最高人民法院及31个省(自治区、直辖市)2517家法院13844间法庭(数据截止到9月)。

法律与科技深度融合:产品的广度与深度要兼具

法律与科技的融合需要相当长时间的积累,不可能一蹴而就。真正有价值的法律科技解决方案,不仅需要有针对法律行业的创新技术作为支撑,还需要在法律场景的广度与深度上深入钻研,才能让科技与法律更适配。

产品覆盖面广

在立法、守法、执法、司法四大体系中,每一个环节的业务场景都涉及多区域、多部门、多角色,以及不同阶段、不同状态等,需要法律科技产品全方位考虑,才能满足各部门的诉求。以司法环节为例,华宇深入了解上下游相关部门的特殊需求,形成了不同场景的个性化方案。

针对法院行业,华宇打造了"人民法院大数据管理和服务平台",全面覆盖了全国3500多家的法院,服务全国12万名法官。针对地方级法院,华宇联合北京法院打造了"睿法官",利用人工智能模拟真正的法官思考,代替法官完成一系列伴随式、精准式司法审判事务性工作,让法官将更多的时间精力投入到司法审判工作。同时,华宇还以信息技术助力北京互联网法院,将互联网、云计算、大数据、人工智能与司法审判、诉讼服务体系深度融合,为当事人带来智能高效的诉讼体验。

针对检务工作,华宇基于大数据和AI技术研发了智能办案辅助系统,在北京、贵州、浙江、湖北、广东等地得到了很好的应用;其自主研发的智能证据审查技术,可有效辅助检察官通过技术手段审查证据。针对司法行政,华宇深度参与司法部"数字法治、智慧司法"信息化新体系的研究与制定,以智慧调解大数据应用率先打造"数字法治、智慧司法"的第一个示范性业务升级模板。

除此之外,华宇还与北大英华,以及百度、阿里、腾讯等公司合作,将在司法领域打造的产品和解决方案,向立法、执法、守法、监察等法律相关领域延伸。希望可以打造一个贯通和连接立法、司法、执法和守法各个机关、人员和活动的法律科技网络,为新一代法律服务提供基础技术支撑。

产品深耕精研

法律相关科技产品不仅需要全覆盖应用场景,更需要持续迭代产品性能,相关产品需要随着法律业务与场景不断变化而更新。例如,作为智慧法院核心产品的华宇审判系统,目前已更新至基于AI的第三代智慧审判系统,产品功能与技术架构得到全面升级。

功能上,华宇新一代智慧审判系统从信息填写驱动转变为卷宗驱动,通过电子卷宗的自动信息提取和回填,实现无纸化办案。同时,系统的一站式文书中心,实现文书全流程集中管理,加入了区块链技术,从源头保障案件信息更加安全。针对不同案件领域,该系统提供了专业化办案平台及专门的辅助工具,为案件办理提质增效贡献科技力量。

架构上,系统以前台+中台+后台的分层架构模式建设,前台构建各角色专属业务平台,中台采用微服务架构设计,满足法院案件增长需求,后台集成法律人工智能平台,提供智能分析运算,用科技助力审判各个环节提升审理效率。

面向未来的多样化审判场景,孙明东希望在技术层面上,通过新一代的大数据平台,汇聚更多的数据做融合,做成知识图谱,对上层提供更有业务价值的数据服务。充分运用人工智能,不限于OCR,语音识别,人脸识别等偏向于感知的技术,还要在认知技术的研发投入上更多一些,计算机能够辅助法官判案,帮助编写文书,做量刑决策,这是华宇未来发展重点,但是确实还会有很多挑战。

华宇产品的深耕在华宇输入法上也有体现,一方面积极响应国家信息技术应用创新,另一方面华宇拼音输入法持续打磨,经过二十年的发展历程于2020年8月全新改版,新版的华宇输入法更加符合用户使用习惯,大大提升输入速度,完美适配Windows系统,贴合发法律机关、政务办公等应用场景。

法律科技健康发展,需要加强生态建设

法律科技是新基建的重要组成部分,其健康稳健发展离不开生态的建设。华宇认为法律科技生态建设,首先需要搭建一个一体化法律服务平台,然后围绕该平台从"产学研用"展开创新,加强法律科技人才培养,进而形成开放、合作共赢的生态。

华宇的一体化法律服务平台,深度融合5G、AI、大数据、互联网、区块链等技术,连接立法、司法、执法、守法全领域、全场景的法律科技网络。其核心的法律人工智能平台由华宇智链(华宇区块链平台)与睿元(华宇大数据管理平台)、睿核(华宇人工智能认知平台)、智核(华宇人工智能感知平台)所构成。同时,基于区块链的可信数据及可信计算环境,连通了公检法司、政法委及外部协作权威机构,形成了连接2G、2B、2C的各个场景、覆盖全行业的司法高可信业务协同生态体系,为法律科技生态建设奠定基础。

华宇一体化法律服务平台

在加强人才培养方面,华宇通过一系列新的人才机制和培养计划,形成了以CTO孙明东、副总经理米坤、华宇元典总经理邹劭坤、研究院副院长沈来信等为代表的法律科技专家团队,发展至今华宇已经拥有超7000名具备法律知识背景的员工。华宇还与各大高校合作扩大人才培养,例如华宇与清华大学、北京大学、中国政法大学等全国十几所高校进行了深度合作,例如与清华大学合作成立法律大数据研究中心,与北京大学合作成立法律人工智能实验室,以及与政法大学、人民大学、四川大学、东南大学、大连理工和北京交通大学开展课题研究等。(文/ 徐培炎)

每日必读

专题访谈

合作站点