收起左侧
发新帖

北理工研究生被爆公然抄袭?旷视研究员列出「实锤」,相似度近100%

时间:2021-9-20 15:12 0 737 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x
DSC0000.jpg



新智元报道
来源:zhihu
编辑:yaxin
【新智元导读】学术圈再添新瓜!昨日,旷视研究员揭露北理工研究生公然抄袭其在NeurIPS 2020的投稿。最新抄袭文章已于9月16日在arxiv上发表。原作者指出,抄袭文章与自己投稿在标题、摘要、图片数据几乎完全一致。然而,这篇NeurIPS投稿究竟是如何流出,引起网友的广泛猜测。
北理工硕士被指抄袭论文?
几乎一字不差!
DSC0001.jpg



「北京理工大学某硕士生被指几乎一字不差地抄袭论文?」这一话题引起大家的热议。
DSC0002.jpg



原作者发文「在arxiv上看到自己的投稿署了别人的名字是什么体验?」,在文中对比并指出高度一致的内容。
网友表示,「我看不懂,但我大为震撼」。
DSC0003.jpg



怎样高度一致?
原作者为旷视的一位研究人员,被抄袭的文章是其在 NeurIPS 2020 的投稿。
DSC0004.jpg



用原作者的标题搜索发现,就在9月16日刚刚提交的论文标题一样,论文作者却成了北理工和河海大学学生的名字Minghao Gao, Hailun Zhang和Yige Yan。
DSC0005.jpg



旷视研究员表示,「这篇文章厉害在哪里呢?厉害在文章内容与我们 NeurIPS 2020 的投稿高度一致。我们的投稿,被泄露并被抄袭挪用了。」
标题100%完全一致就不说了。
那么,这篇最新发表的文章究竟和原文重合度有多少呢?
为了方便查阅,原作者整理了一个对比图库。
DSC0006.jpg



第一,摘要几乎完全一致。(第一张为旷视研究员摘要,第二张为北理工硕士)
这是需要有多大的机遇巧合,才能让这两篇文章的摘要如此一致?
DSC0007.jpg



DSC0008.jpg



第二,图片完全一致。
DSC0009.jpg



第三,数据完全一致。
难道刚好才想到一起去了吗?还是做的实验只有这一种数据?
万千变化,只有这一种可能?
DSC00010.jpg



关于这些截图,原作者表示自己只截取了「一部分」雷同之处。
「因为如果要把所有雷同之处都截图,需要截图整整 8 页(论文共 8 页)。」
DSC00011.jpg



「作者们主要修改了部分措辞,并采用了 CVPR 2021 的 latex 模板,这一过程完全是主观刻意的。我们要强调一点,arxiv 文章中没有任何一个配图、表格、公式是新的,完全没有做额外的实验。」
作者自证 NeurIPS 2020 文章投稿
通过旷视研究员邮件截图可以看出,这篇文章 Label Assignment Distillation for Object Detection 确实是NeurIPS 2020的投稿文章。
DSC00012.jpg



还包括实验数据记录,overleaf 历史记录,带时间的聊天记录旁证,带时间的专利申请记录等等。
DSC00013.jpg



原作者表示,「我们在公司内部还形成了白皮书文档,并对其他组展示过这个工作(有 ppt 和视频为证),证人也非常多。」
他表示,这篇文章质量确实一般, 连投NeurIPS 2020 和 AAAI 2021 没有成功后,就没有在这篇文章上耗费精力了。
但是,不管怎么说,这篇文章还依旧属于旷视的学术研究成果。原作者依旧拥有对其的著作权。
原作者表示,「从学术上讲,做这篇文章的过程直接孵化了我们中稿 CVPR 2021 的工作对我们来讲是有很大价值的。」
DSC00014.jpg



审稿人泄露?
话说,既然是没有投中的文章,是怎么泄露出去并被剽窃挪用呢?
旷视研究员文中指出,最可疑的当然是我们的审稿人,但「双盲机制」使我们无从知晓审稿人是谁。
目前,最新发表在 arxiv 上文章的作者有 3 位,且没有在论文中放联系方式。
原作者通过英文名检索,几乎检索不到任何信息,可见 3 位作者在学术圈并不知名。
「我们冒昧推测这 3 位中并没有审稿人级别的人,所以泄露给他们的另有其人。」
没有联系方式,连沟通的渠道都没有;幸好 arxiv 本身是可以查到上传者邮箱的。
DSC00015.jpg



网友:只是过度引用而已
一位网友抛出2个问题:
1、这篇论文是怎么得到的?
2、为什么原作者过不了,二遍换个人就能过,是不是有什么操作空间?
DSC00016.jpg



最大的疑问莫过于,北理工硕士是如何得到这篇文章的?
按常理说,抄袭可不是小事,何况抄的一字不差,这个学历的人一定不会不知道这个道理。
有网友看后,第一反应是买论文被忽悠了,有中间人呐!
DSC00017.jpg



网友调侃道,「把论文的购买渠道发出来,防止我们踩坑。」
DSC00018.jpg



「以前看arxiv找idea,现在看arxiv吃瓜」
DSC00019.jpg



「别猜了,只是过度引用而已。」
DSC00020.jpg



归根结底,解释不了被拒论文是怎么流出的。
你怎么看待这件事?
参考资料:

注:本文内容多处引用旷视研究员「在arxiv上看到自己的投稿署了别人的名字是什么体验?」一文。
原文链接:https://zhuanlan.zhihu.com/p/411800486
原作者2020年文章链接:
megvii-my.sharepoint.cn/:b:/g/personal/wangjianfeng_megvii_com/EfweEkKRk4RJvbGdVhqXwawBi54pqzIdYGASOjfNpLSNVA?e=EzT8d5
https://www.zhihu.com/question/487690998
https://zhuanlan.zhihu.com/p/411800486
DSC00021.jpg

DSC00022.gif





您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部