各个检测系统的算法区别并不大,只是数据库有多有少;除了万方以外,知网、维普、PaperPass都检测互联网及英文资料;软件界定抄袭的阈值设置不同,这些都会影响检测结果。
下面以知网(CNKI)的对比算法为例进行讲解。
1、知网检测采用模糊算法,整篇上传检测,格式对检测结果的影响几乎为0。
2、如果该论文有自动生成的目录,系统会将按论文章节分段检测,否则自动分段进行检测。
3、CNKI对界定抄袭的灵敏度阀值设为5%,以段落计,低于5%的抄袭或引用会被忽略。例如:某段有1000个字,单篇引用文献在50字以下是不会被检测出来的。
4、连续13个字相似或抄袭都会被红字标注,但是必须满足第3点里面的前提条件:即你所引用或抄袭的某篇文献总字数在检测段落中要超过5%。
维普通达的复写率算法(红色字体)和CNKI类似,但引用率的内嵌算法不合理,系统默认凡是参考文献上标所在的两个句号之间的文字都算是引用,会用蓝色字体标示出来,用来计算引用率。
PaperPass和知网检测系统比对算法相似,以句子为最小检测单位,也采用模糊算法(类似于杀毒软件的云查杀),加上PaperPass的数据库集万方、维普于一身,检测算法比知网还要严格,检测准确率达到了99%以上,检测结果往往偏高于知网7%左右。
(温馨提示:如果关于"江苏省自学考试报名及考试"问题不是很了解,还有什么疑问,请及时联系咨询老师:15755063059或者咨询在线老师
。)