CAS OpenIR
化学主题网络爬虫的设计和实现
夏诏杰; 梁春燕; 郭力
2006
Source Publication计算机工程与应用
Issue10Pages:204-205+229
Abstract由于通用搜索引擎检索返回的结果过多、主题相关性不强以及随着人们对提供的各项信息服务的要求越来越高,基于整个Web的信息采集越来越力不从心。同时它无法及时地采集到足够的最新的Web信息,也不能满足人们日益增长的个性化需求。本文通过把Internet化学资源导航系统所积累的化学知识与搜索引擎的自动采集技术相结合展开了对化学主题网络爬虫开发的研究。结果表明,基于Widrow-Hoff分类器的化学主题网络爬虫能有效的采集化学相关的网页。
Keyword主题爬虫 主题搜索引擎 化学主题网络爬虫 Widrow-Hoff分类器
Document Type期刊论文
Identifierhttp://ir.ipe.ac.cn/handle/122111/25165
Collection中国科学院过程工程研究所
Affiliation中国科学院过程工程所多相实验室,中国科学院过程工程所多相实验室,中国科学院过程工程所多相实验室 北京100080,北京100080,北京100080
Recommended Citation
GB/T 7714
夏诏杰,梁春燕,郭力. 化学主题网络爬虫的设计和实现[J]. 计算机工程与应用,2006(10):204-205+229.
APA 夏诏杰,梁春燕,&郭力.(2006).化学主题网络爬虫的设计和实现.计算机工程与应用(10),204-205+229.
MLA 夏诏杰,et al."化学主题网络爬虫的设计和实现".计算机工程与应用 .10(2006):204-205+229.
Files in This Item:
There are no files associated with this item.
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[夏诏杰]'s Articles
[梁春燕]'s Articles
[郭力]'s Articles
Baidu academic
Similar articles in Baidu academic
[夏诏杰]'s Articles
[梁春燕]'s Articles
[郭力]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[夏诏杰]'s Articles
[梁春燕]'s Articles
[郭力]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.