我们在做什么?

本项目试结合现今高速发展的自然语言处理技术,构建法律领域知识图谱。

- 快速实体、关系抽取 ,将非结构化数据转化为结构化数据。

- 句法分析,基于统计的文本处理。

- 图数据库 ,为海量数据提供高效查询。

一起出发...

我们的队伍

易忠沈

计算机与信息技术学院

殷盛宗

计算机与信息技术学院

景诗思

交通运输学院

NoSQL

开源图数据库——Neo4j

针对多关系数据优化,更适合存储知识图谱。

Connect to Neo4j

凡规则必有反例...

上级人民法院监督下级人民法院的审判工作。    论元模棱两可:被监督的是下级法院还是审判工作?

《草原防火条例》:铁路、交通和民航等部门应当优先提供交通运输工具; 邮电部门应当保证通信畅通; 民政部门应当妥善安置灾民……        这些规定脱离了上下文将毫无意义。

编造、传播虚假收购信息,操纵证券市场或者进行欺诈活动的,比照《证券法》第二百零三条、二百零七条予以处罚;                                      跨文本联系

 

下一步,神经网络

单纯基于规则和统计(浅层学习)的句法分析难以把握语言的复杂,尤其难以理解语境。

计划利用Word2Vec,将段落作为向量输入神经网络处理,提高算法对上下文依赖情况的适应力。