Open Nav

基于.NET技术的并行网络爬虫的实现

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.仅供学习参考之用.
   帮助中心
资料介绍:

基于.NET技术的并行网络爬虫的实现(中文4000字,英文PDF)
摘要:万维网的增长速度非常快,网络上的数据或信息经常发生变化。由于网络是动态的,因此很难获得相关的、新鲜的信息。本文设计并开发了一个基于多个HTTP的网络爬虫程序。这里我们使用多个线程来实现多个HTTP连接。通过多线程的帮助,可以减少整个下载过程。本文介绍了一种基于.NET技术的网络爬虫系统。该方法在VB.NET中实现,多线程并行对网页进行爬行,爬行数据存储在中央数据库(SQL Server)中。记录的重复性是通过预先编译的存储过程来检查的,并且可以很快地检查结果。该结构速度非常快,允许许多爬虫同时对数据进行爬行。
关键词:万维网;网络爬虫;多HTTP连接;多线程;URL;数据库
 

[资料来源:http://Doc163.com]

基于.NET技术的并行网络爬虫的实现


 

[资料来源:http://doc163.com]

  • 关于资料
    提供的资料属本站所有,真实可靠,确保下载的内容与网页资料介绍一致.
  • 如何下载
    提供下载链接或发送至您的邮箱,资料可重复发送,若未收到请联系客服.
  • 疑难帮助
    下载后提供一定的帮助,收到资料后若有疑难问题,可联系客服提供帮助.
  • 关于服务
    确保下载的资料和介绍一致,如核实与资料介绍不符,可申请售后.
  • 资料仅供参考和学习交流之用,请勿做其他非法用途,转载必究,如有侵犯您的权利或有损您的利益,请联系本站,经查实我们会立即进行修正! 版权所有,严禁转载
    doc163.com Copyright © 2012-2024 苏ICP备2021029856号-4