Robots数据库网络蜘蛛爬虫列表大全

Robots,网页爬虫,蜘蛛,蠕虫,网络蚂蚁都是指的同一个东西，但稍微有一些差异：Robots：比较通用的名字，可以参考《什么是互联网Robot机器人蜘蛛爬虫程序？》。蜘蛛：和robots一个意思，但是听起来更酷。蠕虫：蠕虫是和robots以也是一个意思，尽管从技术角度来讲网页爬虫是一个复制程序，而不是robot。网页爬虫：网页爬虫是和robot

标签:

robots

添加新评论
阅读次数：

什么是搜索引擎？

发布:yayan | 发布时间: 2011年6月27日

搜素引擎是指一个计算机程序，它可以通过元信息数据库进行搜索查找。在互联网web的背景下，词语“搜索引擎”特指那些经常使用用来从robot机器人蜘蛛爬虫程序收集的HTML网页文档库查找新的检索方式。

标签:

robots

添加新评论
阅读次数：

哪里用的到robot呢？

发布:yayan | 发布时间: 2011年6月27日

如果你的意思是指搜索服务，那就在遍历访问互联网上各个目录页面的时候，如Netscape的Exploring the Net或者试试像MetaSearch、百度等元信息搜索服务的时候，在技术架构上需要用到robot。

标签:

robots

添加新评论
阅读次数：

什么是agent代理程序？

发布:yayan | 发布时间: 2011年6月23日

词语“agent”（代理）在当今的计算机领域有很多含义，包括：

自治代理：是一种这样的程序，自治代理串行在网站之间，他们自己决定何时移动、做些什么。这类程序一般只串行在特殊的服务器之间，并且目前在互联网上的应用并不广泛。

智能代理：是这样的一种程序，他帮助用户完成一些事情，例如选择一个产品、或者引导用户填写表单、或者帮户用户查找东西等，这些程序通常在互联网做的事情比较有限。

User-agent（用户代理程序）是一个为用户执行网络任务的程序的技术名称，比如网络User-agents像Netscape、和IE浏览器，以及邮件email user-agent像Qualcomm Eudora等。

...

标签:

robots

添加新评论
阅读次数：

什么是互联网Robot机器人蜘蛛爬虫程序？

发布:yayan | 发布时间: 2011年6月23日

一个互联网机器人蜘蛛爬虫程序是一个计算机程序，它可以自动地检索一个文件串行在超文本标记之中，并且可以递归地检索所有涉及到的相关联的文档。需要注意的是这里的递归并不局限于某种特殊遍历算法的定义，即使这个爬虫采用了一些启发式的选择和索引文档查看、发请求持续很长时间，那也是一个爬虫。（Note that "recurs

标签:

robots

添加新评论
阅读次数：

怎么在共享主机上使用robots.txt文件？

发布:yayan | 发布时间: 2011年6月22日

如果你和其他人一起共享一个主机，如你有一个URL网址路径：http://www.****.com/~username/ 或者http://www.****.com/username，这样你就不能有自己的/robots.txt文件了。但如果你想使用/robots.txt，你必须要请求主机管理员帮助你。如果你想要更多的控制权限

标签:

robots

添加新评论
阅读次数：

雅言

人生感悟

[置顶] 踌躇满志造句

[置顶] SEO入门:认识互联网robot

[置顶] “雅言博客”开言

Robots数据库网络蜘蛛爬虫列表大全

WebZinger蜘蛛爬虫——robot观察

怎么知道网站是否被robots蜘蛛爬虫访问过？

搜素引擎蜘蛛如何决定到哪里访问？

什么是Robots,网页爬虫,蜘蛛,蠕虫,网络蚂蚁？

什么是搜索引擎？

哪里用的到robot呢？

什么是agent代理程序？

什么是互联网Robot机器人蜘蛛爬虫程序？

怎么在共享主机上使用robots.txt文件？

搜索内容

最近发表

最新评论及回复

最近留言

站点统计

网站收藏

友情链接