首页学术百科为什么知网查重的字数比上传的字数多--一场积淀已久的“字数游戏”

为什么知网查重的字数比上传的字数多--一场积淀已久的“字数游戏”

时间2023-05-03 21:54:58发布paperpass分类学术百科浏览676
导读:知网(CNKI)作为国内学术界最大的数字图书馆,一直是学术研究者必经之路。在初次接触知网时,很多人都会注意到一个问题--上传的文件字数与查重后的字数数字不一致,且经常是查重后的字数大于上传的字数。为什么会出现这种不一致的情况呢?这篇文章就来为大家揭秘。1.了解知网查重原理首先,我们...

知网(CNKI)作为国内学术界最大的数字图书馆,一直是学术研究者必经之路。在初次接触知网时,很多人都会注意到一个问题--上传的文件字数与查重后的字数数字不一致,且经常是查重后的字数大于上传的字数。为什么会出现这种不一致的情况呢?这篇文章就来为大家揭秘。

1. 了解知网查重原理

首先,我们需要了解知网查重的原理。知网查重的基本原理是将上传的文件与其内部已经收录的论文/期刊等进行比对,检测出页面相似的部分,进而计算出文献查重率,以此来判断一篇论文是否存在学术不诚信的行为。

知网作为国内最大的数字图书馆之一,其收录内容远远不止于论文,其中还包括专利、标准、法规等多种文献。因此,为了更加准确地计算出检测文献的查重率,知网在进行查重时不仅仅匹配纯文本,还会将文献中的其它元数据(例如中文摘要、英文摘要、关键词等)与数据库中的相关内容进行比对。

为什么知网查重的字数比上传的字数多--一场积淀已久的“字数游戏”

从这里我们可以看到,原始文档中纯文本的字数往往是无法准确计算检测文献的查重率的,因此知网查重的结果字数一般都会比上传的字数多出一些。

2. 上传格式的影响

对于知网查重的字数多于上传字数的问题,还存在一个与上传文件格式有关的影响因素。在上传文件时,除了常见的Word、PDF等文档格式外,还有一种叫"TXT纯文本"的格式。与Word、PDF等格式不同,TXT纯文本文件不含有格式信息,而只是保存了纯文本的内容。这使得TXT纯文本文件在上传后,其字数往往和查重后的字数相差不大,甚至在一些情况下,查重字数会略小于上传字数。

3. 是否会影响论文查重结果?

对于这个问题,官方的回答是不会影响查重结果的。相对于纯文本的字数,知网查重的比对其它元数据的工作量要大得多,因此文件字数与查重字数的不一致并不会对查重结果造成任何影响。因此,并不建议为了让查重字数与上传字数一致而去采取一些无用的手段(例如采用TXT格式或者故意添加一些多余的空格等)。

4. 总结

从本文中,我们可以知道:知网查重的字数比上传的字数多,是因为知网在进行查重时不仅仅匹配纯文本,还会将文献中的其它元数据与数据库中的相关内容进行比对。此外,上传文件的格式也会对查重结果产生一定的影响。

因此,当我们上传论文或者稿件至知网查重时,不要将注意力过多地放在字数的统计上,而是应该更加关注论文的学术价值和质量。只有通过严谨的学术态度,才能够获得更高的学术赞誉。

paperpass问答网版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

如何提高大学生毕业论文查重率是多少? 论文查重率怎么算的:彻底了解论文查重率计算方法

游客 回复需填写必要信息