技术微信:375279829 欢迎来到【毕业设计资料-计算机毕业设计源码网】官网!
您的位置:您的位置:主页 > 作品中心 > Java毕业设计

实体指代链标注平台的设计与实现

技术微信:375279829

本课题包括源程序、数据库、论文、运行软件、运行教程

毕业设计资料-计算机毕业设计源码网:我们提供的源码通过邮箱或者QQ微信传送,如果有啥问题直接联系客服

包在您电脑上运行成功

语言:Java

数据库:MySQL

框架:ssm、springboot、mvc

课题相关技术、功能详情请联系技术

作品描述


1.前言

随着计算机技术、网络技术和信息技术的发展,国内各研究机构面临着技术、存储和信息日益增长的知识需求困境,而机构要摆脱这种困境,必须打破原有的时空限制,使传统知识服务得以延伸,但同时知识管理对知识服务的延续性、个性化、多样性和时效性的要求日益提升,要求机构提供更好的知识实体标注服务。而目前主流IT界提出的实体指代链标注模型,是一种具备处理规模化、集中化、功能开放化、海量化和客户端轻量化等特点的新型管理系统。使用Stanford CoreNLP集合工具处理中文语句,生成mention表述链,研究人员对mention实体进行添加属性,标注语义,为实际研究工作提供便利[1]

2.课题研究的意义

计算机网络技术和多媒体技术的快速发展,在现代社会得到了广泛运用,促进了研究机构对知识管理的进程。实体指代链标注平台作为现代知识服务的一个重要手段,受到人们的普遍关注[2]。然而,实体指代链的发展也带来了新的问题。由于知识表述链内容越来越丰富以及规模越来越大,相应的对知识表述链管理的要求也是越来越高。实体指代链标注平台为各种mention表述提供标注,是为配合研究机构而设计的,对管理知识实体指代链的服务有着重要意义。

本课题对实体指代链标注平台设计过程中对标注效率低等问题进行研究,生成mention表述链的标注列表,通过网页界面显示出来,提高了研究人员的工作效率和和准确度。

本文在了解现有Stanford CoreNLP集合工具的基础上[3],选择市场占有较大优势、开发技术娴熟的JAVA语言作为实体指代链标注系统的开发平台。

3.开发技术分析

实体指代链标注平台通过调用Stanford CoreNLP的接口,生成实体指代链,使用JAVA编程语言结合Mysql数据库对实体进行标注,并把标注结果保存到数据库中,通过列表显示到网页[4]

Stanford CoreNLP由Java语言开发,是斯坦福大学自然语言处理小组的研究成果。包含自然语言处理的基本任务:分词、词性标注、依存句法分析、命名实体识别等等,支持多语言。

MyEclipse是开源免费的软件,对应开发JAVA程序来说,更加方便快捷,通过各类插件开源管理开发工具,如安装报表工具就可以快速开发出报表。

在目前主流程序语言开发工具中,包括微软的Microsoft Visual Studio和Eclipse以及MyEclipse都被广泛运用[5],而MyEclipse工具是开发JAVA企业级项目必不可少的平台之一,深受程序员青睐。MyEclipse支持多种语言的编译,对JAVA Script、HTML5、DIV、CSS3等进行预编译,提示出错误,方便程序员快速定位错误,发现问题。另外,MyEclipse同时支持代码的自动生成,如数据库Model层的自动创建,SSH架构的生成,这些功能,为快速开发提供了保证。

MySQL数据库是典型的关系型数据库,因其小又免费被广泛运用,无论是JAVA语言、PHP还是JAVA语言,都可以通过MySql驱动很好的链接操作[6]

MySQL有许多新特性,如AlwaysOn、Indirect CheckPoint、Throw语句、Contained Database、内置函数、SequenceNumber方法、分页增强、基于行的ColumnStoreIndex。MySql提供了处理字符串的函数Concat,可以直接把多个字符串连接一起而不需要再使用类型转换,提高了代码便捷性。CHOOSE作为逻辑类判断字符串是否越界。日期类EOMONTH函数可以方便的进行日期计算,如获取给出日期的月最后一天、上个月最后一天等。函数Parse能够指定多一个的本地化参数,从而按照本地化语言被转换。

4.国内外研究情况及其发展

在对实体指代链标注平台调研中发现,国内的研究主要集中在理论和系统结构上,并不能真正应用到实际工程中。设计知识实体管理的最终目的就是实现研究人员对实体指代链的快速标注和检索以及重用,需要和研究机构的实际应用紧密结合,而目前,虽然部分大型企业已实施了知识管理系统,实现对产品数据和工作流程的管理,但由于没有站在知识实体管理的角度,因此并不能满足知识标注设计过程中对设计知识实体的快速、正确的获取[7]

在国外,许多知名企业实体知识管理中的应用模式大多都是从知识管理技术入手,形成自己的实体指代链管理系统,应用在产品研发的某个阶段,为企业带来了利益。这些研究对于实体指代链管理应用模式的研究奠定了重要的理论基础。

其中Stanford CoreNLP工具就是为实体指代链标注平台提供接口的关键程序。Stanford CoreNLP由Java语言开发,是斯坦福大学自然语言处理小组的研究成果。Stanford CoreNLP 提供了一系列自然语言的分析工具,对于用户提供的一段文字,无论是公司名,人名还是时间日期、数量,它都能提供出每个词语的组成与语法,并且用短语、词汇间的依赖关系来标记出语句的组成结构,比如那些名词指代同一个事物,比如根据上下文的描述来分析观点与开放式的事物关系等[8]。Stanford CoreNLP 有以下特性:一个完整独立的,且拥有一系列强大的语法分析功能的工具集。对任意文章段落都能快速分析,并且效果稳定可信赖。对文本整体化的分析保持高质量表现。支持多国语言。API支持当下多种流行通用的开发语言。Stanford CoreNLP不仅是一个一体化的完备的框架,更有良好的灵活性与可扩展性,你可以很方便你的选择你需要使用或不使用的语言分析工具模块。Stanford CoreNLP整合了大量Stanford的自然语言处理工具[9]

5.总结

以上我们可以认识到实体指代链标注平台是个非常实用的系统,而基于JAVA技术和MYSQL数据库开发,也迎合了市场主流技术的需求。鉴于以上分析,为更好的支持研究人员快速、准确地获取知识实体指代链,有必要根据现有理论基础,结合具体实践,建立起实体指代链标注平台。

参考文献

[1]杨春立. 产品知识管理系统研究[D]: 大连理工大学,2014

[2]刘柏嵩,高济,李飞. 知识管理中基于本体的扩展检索方法[J]. 计算机辅助设计与图形学学报. 2016. 184: 556-562

[3]史忠植. 知识发现[M]: 清华大学出版社,2014

[4]许蔷. 基于知识的产品设计关键技术研究与开发[D]: 南京航空航天大学,2015

[5]王珂,廖文和,郭宇等. 基于任务结构的产品设计知识模型研究[J]. 中国机械工程. 2010. 193: 308-313

[6]齐峰. 产品设计信息可重用性及产品设计资源管理关键技术研究[D]: 浙江大学,2014

[7]何勇征. PDM中的用户管理和文档管理的研究与开发[D]: 西南交通大学,2014

[8]梁勇著,李娜译.java语言设计(基础篇)[M].北京:机械工业出版社,2013.

[9]梁勇著,李娜译.java语言设计(进阶篇)[M].北京:机械工业出版社,2013.

[10]张峋,杨三成.关键技术 jspjdbc应用详解[M].北京:中国铁道出版社,2010.

[11](美)迈克道威尔著,王晓光译.java解析教程[M].北京:清华大学出版社,2013.

[12]Gir Design.photoshop cs4平面设计案例[M].北京:中国铁道出版社,2010.

[13]郑人杰,马素霞,殷人昆.软件工程概论[M].北京:机械工业出版社,2010.

[14]Andreas Scherer. Reuse of CAD designs by a neural-network approach[J]. Engineering Applications of Artificial Intelligence. 2010. 94: 413-421

[15]Ed Miller. PDM today[J]. Computer Aided Design, 2013,142:32-41


基于上述国内外研究现状,本系统中拟解决的关键问题有以下三个:

(1)研究Stanford CoreNLP工具,处理自然语言,生成实体。本实体指代链标注平台通告JAVA技术调用该工具接口,通过相应的方法实现mention表述链的生成。

(2)开发一个面向网络,基于MYSQL数据库的标注平台。所以平台的数据就都要存放在服务器,那么数据库设计就是本软件设计中非常重要的一个环节。

(3)对实体进行多个类型的标注,形成实体和标注属性一对多的关系,并通过网页展示出来。

完成“实体指代链标注平台”的设计,实体指代链标注平台是一个适应于研究机构的工作人员对实体进行标注的工作软件,本软件初步拟定由以下五个模块组成:

(1)权限管理模块

实体指代链标注平台包括两种用户,管理员和研究人员,不同的用户具有不同的权限。管理员登录系统后管理信息,研究人员登录系统后对实体表述链进行标注,生成标注列表。

(2)用户管理模块

管理员具有用户管理权限,对用户进行添加、修改、删除和查询操作。并管理用户的登录用户名和密码。

(3)生成实体表述链模块

引入Stanford CoreNLP的程序包,调用程序接口,对段落或者语句进行处理,生成实体表述链。并把实体信息保存到数据库中。

(4)标注模块

研究人员查看实体表述链,选择某一个实体,对实体进行标注,一个实体可以进行多次多角度的标注。标注信息保存到数据库中,并显示到实体下方的列表中,标注信息也可以进行编辑和删除。

(5)通告管理模块

管理员添加通告信息,修改、删除和查询通告。研究人员可以查看某一个的通告信息,但是无法进行操作。







如需定做或者获取更多资料,请联系QQ:375279829
在线客服
联系方式

技术微信

375279829

在线时间

周一到周日

客服QQ

375279829

二维码
线