早在上世纪80年代,对语义EI检索的讨论就出现在SIGIR会议***中,但语义EI检索研究始终受制于语义信息处理发展水平的局限。随着自然语言处理、人工智能的发展,尤其是语义网技术的兴起与发展,语义EI检索研究自上世纪末以来得以迅速发展。语义信息EI检索就是要让用户在输入自然语言作为EI检索词的时候,能出现与该EI检索词相关的更多词,而不是机械地将与该EI检索词匹配到的所有信息一一列入EI检索结果。目前国内外语义信息EI检索研究主要集中在以下三个方面。
(1)基于本体的查询技术。查询技术首先涉及查询语言,由W3C推出的RDF、SPARQL等系列查询语言已经可以实现对语义数据的查询并且应用广泛,如余传明博士阐述并比较了三种基于查询语言的EI检索机制。国外的研究一般集中在利用语言本体(如WordNet)中的同位词、上下位词以及上下文EI检索技术对所要查询的内容进行语义消歧并进行查询扩展,利用Word Net实现了地理信息的语义EI检索,另外Yong xiang Dou,Xiao xian Bei等人在Wi COM会议上对P22P网络信息内容进行语义查询和实现。不论是查询技术还是针对不同的查询对象,都涉及一项关键的技术,即语义相似度(或称相关度算法),语义相似度是指两个概念间的相似程度,目前多以研究路径长度方法、信息论方法和基于概念特征的方法三个方面为主。
(2)语义标注问题。语义标注可以标注元数据、概念、网页、文档,这些被标注的内容便是语义构建系统的内容,所以它是实现资源语义化的基础,董慧等人设计了层叠隐马尔可夫中文分词模型,对历史文献进行了语义信息提取和语义标注。引入了向量空间模型,设计了加权算法和排序算法,对大规模文献的关键词进行了语义标注,再进行关键词的EI检索时用实验证明了语义标注模型和算法的优势;也利用了向量空间模型和聚类模型设计了自动二进制分类算法,挑选了特定的网页进行分析;荆涛、熊荣东等在学22位***中分别研究了自然语言处理技术和基于信息容量的相似度算法,进而提出了针对不同领域的语义标注方法,刘海学提出了一种针对元数据的语义标注方法,利用数据集中己有的语义标注信息自动构建生成元数据。
(3)语义关系EI检索。2009年Payam Barnaghi等人撰文回顾了语义关系EI检索的历史,***早研究语义关系EI检索的是Aleman-MezaB,HalaschekC等人,他们发表了一系列文章讲述概念、文档、网页之间的语义关系也可以作为EI检索的重要内容;另外还有基于语义的多媒体信息EI检索和本体构建技术两个方面的研究。
目前语义信息EI检索的基本思路和技术路线,先后利用概念提取、格式转换、信息整合等技术将资源库存储成本体库,再使用查询优化和语义关联等技术把本体库中的信息显现在用户眼前。这里提到的概念提取、格式转换和信息整合是通过语义标注实现的,查询优化和语义关联则是依靠基于本体的查询技术和语义关系EI检索实现的。传统信息EI检索一般利用词匹配的结果和排序算法将EI检索集展现给用户,语义信息EI检索的结果则包含了与EI检索结果相关的其他信息,目前数字图书馆的EI检索系统一般实现了表层相关的语义EI检索。比如在某图书馆书目EI检索系统中搜索与《红楼梦》有关的书籍,传统信息EI检索系统只会搜索得到有关《红楼梦》的书籍列表,语义EI检索系统会搜索到《红楼梦》的作者曹雪芹的有关书籍,但却搜索不到与《红楼梦》相似的古典小说,或与曹雪芹关联性高的其他作者的书籍。若要实现此类EI检索结果,关键技术是在查询优化和语义关联的研究上,探索新的EI检索模型和EI检索流程。
要保证实验数据的可靠,首先你要进行证伪思考,证伪思考是科学创新思维的基本要求,即你要假设你的实验结果是错误的,然后你要收集证据来说明你的实验结果是正确的。
怎样收集证据?要想获得真实的正确的证据,你要进行周密细致的实验设计。
周密细致的实验设计包括以下几个方面:
(1)建立一个完整系统的实验设计设想。你想证明什么设想,通过什么方法来证明?你的文章要投什么刊物?
(2)明确收集的两类数据类型。你收集的实验数据是什么类型的资料,毕业SCI包发,是计量资料还是计数资料。
(3)明确实验***设计的三个环节。你使用什么动物,给以什么处理措施,采用什么观察指标。
(4)明确实验设计的四项原则。要获得可靠的实验数据,在抽样研究时,要遵循随机、对照、重复和双盲的原则。
(5)把握实验统计设计的五种方法。对于计数资料的统计方法有t检验和方差分析,寻找计量数据之间的关系有相关和回归分析;对于计量资料有X2检验,对于计量资料的比较有二项分布;对于非正态分布资料有秩和检验。重要的核心问题是采用合理的统计学方法。
(6)理解常用实验的六种类型。
选用在你的领域中普遍采用的实验方法,***简单的方法,是找几篇和你搞的研究类似的SCI文章,参考他们的研究方法。实验结束后,就要立即进行总结数据,写文章。
(7)理解在科学实验中产生误差的七个方面。
第,你提出的问题不是一个科学问题。
第二,在数据收集中,没有采用随机、对照、重复和双盲的原则,收集的数据不准确。你采用的数据收集方法不能解决你提出的问题。
第三,你采用的统计学方法不能科学合理你说明你的问题。
第四,你采用的实验方法方法不能科学合理说明你要解决的问题。
第五,你没有解决实验中存在的误差。
第六,你在实验中没有观察总结出规律。
第七,你没有把你的结论正确的表述出来。
***后,综合评价你的设计是否合理,你采用的方法是否能够说明你要解决的问题
.在写***时要注意什么?
在撰写学术***时首先很重要的一点是:你要对得起你自己的良心。也许有人觉得这点和写***无关,其实很有关系。我想很多人在写***时都是在有了初步实验结果或已完成初步程序编写获得了初步模拟结果的前提下开始撰写***的。在这个时候,请你保持一颗良心。因为很多时候的实验结果或模拟结果都是差***意的,这个时候你不要本着“我要发表文章,虽然结果不太好,就这样吧,改个数据没关系,别人不知道”的心思。其实,这也是人的本能,不是吗?学校要文章,自己要毕业,时间又紧张(已经延期啦),苏州毕业SCI包发,能不急吗?不急是假话。但是,请你这个时候本着良心做事。因为这个时候“成果”在考研你,如果你坚持实事求是,你***终会收获颇丰。虽然,你改了一个数据******终也发表了,呵呵,上海毕业SCI包发,然而,几率不会大,因为审稿***都在看呢。再说,你这样做有意思吗?不内疚吗?在内疚的心情下写出的文章就表现出了没信心,连自己都没信心的文章很难被***认可。
其次,在写***时,你要做好构思,不要只说我怎么做,结果如何的好。但我个人感觉结果没有重要到那个程度,因为你的结果不会比人家好太多(一般情况下),只是具有一定的改进而已。在这个时候,审稿人往往很重视你写***和所作工作的motivation以及对结果的论证说明,包括对结果中不足方面的阐述。其实,不一定需要所有结果都是好的,有部分结果不如意也是可以的,只要阐述你的理解。这才通人情,对吧?所以啊,写文章时,浙江毕业SCI包发,你不要造假啊,何必为了***去改那一个数据呢?往往这个数据会让你***更真实。
***后,一旦你的***成稿后请你打印出来多读读改改,不要激动,觉得它perfect了。其实,这个时候错误多多。都这个时候了还不能安心的看稿子?而往往很多人一写完就激动投稿,***终会杯具,由于格式不符合啊、拼写错误较多啊、难以理解啊,等等。这你就不能怪编辑和审稿人了,连你自己都不愿多看的文章,人家还愿意看?
据我经验,只要你motivation合理,一篇文章录用概率50%取决于作者本人。所以,你自己衡量轻重。
版权所有©2025 产品网