欢迎来到天天文库
浏览记录
ID:53614496
大小:62.60 KB
页数:15页
时间:2020-04-20
《思考关于开放域的知识获取与集成.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、思考-关于开放域的知识获取与集成高志强2015年06月07日主要内容确定方案的内容与时机方案的测试与评价标准方案的内容1确定方案的内容与时机方案的内容(1)地理?(2)地理和历史?(3)地理或历史?方案的时机(1)863项目启动会之后,看看相关课题组的思路。(2)研究日本国立情报学研究所新井纪子课题组的工作。(3)研究其他相关课题组的工作。2方案的测试与评价标准知识表示的格式有XML、NT、Json、关系数据库、图数据库等,需要明确?知识库对社会是开放的。知识库的测试可以通过查询数据集进行。该查询数据集可以测试知识库的正确性、完备性和查询速度。知
2、识库的查询数据集由其他组提供。知识库的查询API由我们提供。2方案的测试与评价标准知识库的广度要覆盖相关科目的知识,包括:教材、思维导图、Wikipedia、教师用书、互动百科等。知识库的深度或粒度要能够支持答题,即原子化。知识库的查询响应要快,要具有一定的健壮性(例如针对Abox的不一致)。2方案的测试与评价标准构建过程中的测试包括:教材中的思考题、教材中节后的题目。方法:人工将题目转换成查询语句,检查我们的API能否给出正确回答?2方案的测试与评价标准构建完成之后的测试:(1)查询集(静态、大约1000个)(2)其他组在解题中需要用到的知识点
3、(动态、随时在Web界面上进行SQL或SPARQL查询)。如果发现有遗漏或错误,我们组可以随时完善。3方案的内容知识点教材:已经完成第一本思维导图:和教材类似。已经做了第一本的一部分。Wikipedia:未做语法三元组,可以转换为NT等标准格式。但是转换程序未做。想法为了保证标注的便利,可以自己定义格式。但是在使用时必须采用标准格式。3方案的内容本体采用RDFS或类似语言表示,主要是描述性知识。是否需要支持不确定性?如果需要,则需要对本体表示语言进行概率扩展。想法必须构建地理本体。该项工作尚未开始。3方案的内容规则Horn逻辑?无量词?无变量?带
4、概率的Horn逻辑?想法需要针对规则集进行划分,例如根据内容或章节?3方案的内容过程性知识和集合知识相同,根据不同的符号,例如()和集合区分。过程性知识中的判断、循环如何表示?3方案的内容语言学词典语义词典和语义表示方法有关?3方案的内容单位换算表已经构建一部分。拟统一映射到国际单位制,并提供映射API。3方案的内容表分哪些类型?图分不同类型?谢谢!
此文档下载收益归作者所有