论文相似度是指该论文与其他论文的重复程度。目前有两项指标,一个是全文库相似度,另一个是自建库相似度。
全文库是指全部已公开发表的论文,那么,全文库相似度就是该论文与全部已发表论文的重复程度。
自建库是指竞赛后由全部参赛学生论文构建起来的库,那么,自建库相似度就是该论文与其他参赛学生论文的重复程度。
在通常情况下,全文库相似度一般不会太高,只要学生不大段大段地拷贝现有的参考文献;而自建库相似度会高一些,这是由于大家共同完成一个题目,有很多内容可能会重复,另外,很多同学会原封不动地拷贝竞赛题目,这也是自建库相似度高的原因之一。
但自建库相似度过高则说明该论文有问题,例如,自建库相似度在50%以上,说明该论文有一半以上的内容与其他同学的论文重复。