• 回答数

    3

  • 浏览数

    260

仿佛那一天
首页 > 学术期刊 > 基于python的论文查重系统

3个回答 默认排序
  • 默认排序
  • 按时间排序

ybxiong168

已采纳

如果论文题目中没有特殊说明的话,可以使用任何语言来实现

279 评论

晴天小珠717

给定一个或多个搜索词,如“高血压 患者”,从已有的若干篇文本中找出最相关的(n篇)文本。 文本检索(text retrieve)的常用策略是:用一个ranking function根据搜索词对所有文本进行排序,选取前n个,就像百度搜索一样。 结巴分词后的停用词性 [标点符号、连词、助词、副词、介词、时语素、‘的’、数词、方位词、代词] 对一篇文章分词、去停用词 对目录下的所有文本进行预处理,构建字典

120 评论

美丽华华

自动的概念比较宽泛。是指自动查全IEEE站的论文并自动下载,还是提供一个URL然后自动下载页面内的论文PDF并且提取元数据,还是给关键字自动下载搜索结果列表的论文?你需要自己先明确自己的需求,这些“自动”实现的难度是不一样的。听你的意思是,你所在的网络环境应该是能够下载IEEE的PDF格式论文吧,要注意的是如果批量下载大量论文的话,可能会被屏蔽C段地址造成别人也无法访问哦。Python是可以的,可以自己从urllib的基础开始,也可以用模拟浏览器,也有scrapy这样的框架。总之,技术上是可行的。如果只是写论文整理文献,可以学习使用Zotero,可以很方便的自动下载页面内的论文并生成元数据,引用和批注都很方便,除了IEEE的网站也支持其他非常多的网站类型。

124 评论

相关问答

  • python基本结构论文

    Python中的程序基本结构通常包括以下几个组成部分:1. 模块导入:使用`import`语句引入需要使用的外部模块。2. 变量定义:在程序中定义需要使用的变量

    智慧女神美美 4人参与回答 2023-12-06
  • 基于python的网络爬虫论文

    利用python写爬虫程序的方法: 1、先分析网站内容,红色部分即是网站文章内容div。 2、随便打开一个div来看,可以看到,蓝色部分除了一个文章标题以外没有

    yangyang2336903 3人参与回答 2023-12-05
  • python文章查重

    人与人相处多一些真诚,少一些套路,不要把别人当傻子,只是别人不想和你计较罢了。 上一篇: python3比较版本号方法封装 下一篇: configo

    智慧女神美美 2人参与回答 2023-12-08
  • 基于python和爬虫毕业论文

    根据题目描述,"基于python的知识问答社区网络爬虫系统的设计与实现",可以理解为设计并实现一个能够爬取知识问答社区网站上的数据的网络爬虫系统,使用Pytho

    1号女王 3人参与回答 2023-12-10
  • 基于python的论文查重系统

    如果论文题目中没有特殊说明的话,可以使用任何语言来实现

    仿佛那一天 3人参与回答 2023-12-07