快捷导航
查看: 123|回复: 19

百度蜘蛛图片识别(蜘蛛网图案是什么牌子)

[复制链接]

1万

主题

0

回帖

1万

积分

论坛元老

积分
11635
发表于 2023-9-4 17:45:52 | 显示全部楼层 |阅读模式
<p>
<img image_type="1" img_height="308" img_width="640" src="https://p3-sign.toutiaoimg.com/71f000059e7e91f1489~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=d%2F1%2FjVrB6zCVfTAOAlYEl%2Fc5YHU%3D" web_uri="71f000059e7e91f1489"/>
</p><p>
<strong>
     淘宝放了百度的蜘蛛,这是什么梗?
    </strong>
</p><p>
    昨天看到一条新闻,标题叫:淘宝部分解禁百度蜘蛛。乍一看标题以为是淘宝本来不让卖一种蜘蛛,现在让卖了,但实际上当然不是这么回事儿。今天就来跟您说说什么是百度蜘蛛,淘宝解禁百度蜘蛛,这是个什么梗。
   </p><p>
    我们平时用百度搜索,比如您搜索:“科技富能量”这几个字儿。能够出现腾讯新闻的内容,能出现新浪微博的内容,当然还能出现蜻蜓FM的节目列表。
   </p><p>
<img image_type="1" img_height="1544" img_width="956" src="https://p3-sign.toutiaoimg.com/6d10005b730e2ed843b~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=l1aBxUxPaHO0mflOQ5Yhi8YMy7s%3D" web_uri="6d10005b730e2ed843b"/>
</p><p>
    您有没有想过一个问题:网络上的信息近乎无穷无尽,百度是怎么能在0.0几秒的时间里把我们想要的东西找出来的?有些博客或者网页里相信也有和“科技富能量”有关的内容,比如:我们的群【富能量纠结帮】,明明也存在在网上,但为什么在百度里却搜索不出来呢?
   </p><p>
<strong>
     这就要隆重介绍一下百度蜘蛛了
    </strong>
</p><p>
    百度蜘蛛又号称“网络爬虫”,听起来挺恶心的,就像名字一样,它是一种能够在网络上,到处爬的东西。这种蜘蛛当然不是漫无目的地乱爬,它是按照一定的规则,自动抓取网络信息的一种脚本程序。
   </p><p>
<img image_type="1" img_height="300" img_width="457" src="https://p3-sign.toutiaoimg.com/71e0001cf2ab91e4fff~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=x6ZfTTeP9Ck0z6vvKx1kWWY2L3k%3D" web_uri="71e0001cf2ab91e4fff"/>
</p><p>
    它实际上是一种信息搬运工,当它爬到某一个网页上以后,会抓取相应的内容,然后把它的链接地址,甚至网页的快照(一份完整网页信息)送回给百度的索引库。这样,以后用户在百度搜索关键字的时候,就能搜索到对应网站里的信息,如果用户再点击百度的搜索结果,百度就可以把用户导向对应的网站。
   </p><p>
    这个感觉有点儿像我们在自己电脑里搜索一个文件,第一次搜索会很慢,但是今后搜索的速度就会变快,这就是因为我们第一次搜索的时候,实际上是对整个硬盘的每一个角落进行搜索,这个过程就有点儿像蜘蛛在一个大仓库里到处爬,搜集情报的过程。
   </p><p>
<img image_type="1" img_height="754" img_width="1280" src="https://p26-sign.toutiaoimg.com/72300007ce43c6b280c~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=i5pZkp0Rmap%2FS3dCkeL6Cnbc%2F6U%3D" web_uri="72300007ce43c6b280c"/>
</p><p>
    第一次搜索完成以后,Windows会建立一个索引库,就像一份清单,清楚地写着各种.rm-vb在几号仓库,哪个区域。以后再搜索的时候,先看清单就行了,速度当然会快得多。
   </p><p>
    百度蜘蛛也一样,它的索引库就像一个装满蜘蛛的大盒子,不停放出蜘蛛访问各个网站,收集情报,然后带回来给百度。是不是突然想到《权力的游戏》里那个太监、情报总管、“八爪蜘蛛”瓦里斯和他的“小小鸟”?
   </p><p>
<img image_type="1" img_height="375" img_width="640" src="https://p3-sign.toutiaoimg.com/6d00005b4b892b989d9~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=8zOJzRFnZVHAj%2BVikzIV8Pcwyyg%3D" web_uri="6d00005b4b892b989d9"/>
</p><p>
    ▲ 瓦里斯(Varys),外号「八爪蜘蛛」,在为七国铁王座服务的御前会议中担任一个颇具神秘感的职务——情报总管。瓦里斯通过他的那些“小小鸟”(《权力的游戏》中最不起眼的一群孤儿、流浪儿)编织成的情报网来收集秘密
   </p><p>
<strong>
     为什么网上有的东西搜不出来?
    </strong>
</p><p>
    答案就很明显了,蜘蛛没爬到呗。比如WX群里的内容,百度蜘蛛就爬不到。爬不到的原因又分两种:一种就是没爬到……另一种就是人家把百度蜘蛛给屏蔽了。当然还有一种可能就是,百度蜘蛛爬到了,但是带回来的信息百度一看:哎呀……不符合相关法律法规和政策……。
   </p><p>
<img image_type="1" img_height="208" img_width="770" src="https://p3-sign.toutiaoimg.com/72200007c4f04980ec5~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=7sGGYCI7VHZq5tqtFFh1rPmoQNk%3D" web_uri="72200007c4f04980ec5"/>
</p><p>
    ▲ 你猜小编搜了啥关键词,一击即中
   </p><p>
    对于大多数网站来说,是欢迎百度蜘蛛过来爬的,恨不得想方设法勾引百度蜘蛛“常过来看看”。这样用户就能搜索到自己的网站,能让用户在第一时间看到自己网站更新的内容。有的网站不仅要争取百度蜘蛛来访,还会给百度塞点儿钱,让百度蜘蛛带回去的信息能够在用户搜索列表里的顶部显示,这就是著名的百度推广。
   </p><p>
<strong>
     淘宝为什么要屏蔽百度蜘蛛呢?
    </strong>
</p><p>
    我们在百度搜索的时候,能搜出来淘宝的店铺和商品这不是一件更方便的事情吗?或许是,但是淘宝不这么看。
   </p><p>
    当所有商品只能在淘宝网上搜索到的时候,淘宝不仅是一个购物平台,更是一个巨大的流量入口。用户要买什么东西,都要先进淘宝。淘宝的自营广告、用户数据收集和分析,都可以顺理成章地展开。
   </p><p>
<img image_type="1" img_height="537" img_width="927" src="https://p3-sign.toutiaoimg.com/72300007ce545983d64~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=jMmZF6h5UKylkwJIQr%2FPCgumzhg%3D" web_uri="72300007ce545983d64"/>
</p><p>
    ▲ 淘宝每年发布的消费数据报告,正是基于剁手党们以淘宝为入口的搜索、购买行为
   </p><p>
    那开头新闻说的,淘宝部分解禁百度蜘蛛,解禁的部分大多是和文章资讯相关的信息,而淘宝店铺之类的目录依然是屏蔽状态——以后在百度上还是搜不出来淘宝店铺的。
   </p><p>
<img image_type="1" img_height="330" img_width="465" src="https://p3-sign.toutiaoimg.com/72300007ce627c0f8ee~tplv-tt-origin-asy1:5aS05p2hQOenkeaKgOWvjOiDvemHjw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693833677&amp;x-signature=Hq1BcdzjqeiNi1kL8JmjfD8xG18%3D" web_uri="72300007ce627c0f8ee"/>
</p><p>
    ▲ 淘宝robots协议对百度开放的目录,看不懂不要紧,你需要知道的是这里面不包含淘宝店铺首页、产品详情页,这些重要的页面在百度中依然是被封禁的
   </p><p>
    毕竟竞争对手,阿里怎么可能允许百度的“八爪蜘蛛”在自己的地盘上乱爬呢?
   </p>

1

主题

3392

回帖

5093

积分

论坛元老

积分
5093
发表于 2023-11-25 08:18:17 | 显示全部楼层
谢谢楼主,共同发展

1

主题

3570

回帖

5360

积分

论坛元老

积分
5360
发表于 2023-12-5 21:08:53 | 显示全部楼层
找到好贴不容易,兄弟们,顶起!

1

主题

3370

回帖

5060

积分

论坛元老

积分
5060
发表于 2023-12-9 15:56:56 | 显示全部楼层
不错不错,楼主您辛苦了。。。

1

主题

3348

回帖

5027

积分

论坛元老

积分
5027
发表于 2023-12-18 12:04:47 | 显示全部楼层
小手一抖,积分到手!

1

主题

3522

回帖

5288

积分

论坛元老

积分
5288
发表于 2023-12-26 13:29:39 | 显示全部楼层
看帖回帖是美德!

1

主题

3340

回帖

5015

积分

论坛元老

积分
5015
发表于 2023-12-27 11:11:13 | 显示全部楼层
前排支持下

1

主题

3588

回帖

5387

积分

论坛元老

积分
5387
发表于 2023-12-27 11:11:27 | 显示全部楼层
路过,支持一下啦

1

主题

3386

回帖

5084

积分

论坛元老

积分
5084
发表于 2023-12-27 11:11:36 | 显示全部楼层
这真是不错,顶给需要的人

1

主题

3494

回帖

5246

积分

论坛元老

积分
5246
发表于 2023-12-28 05:10:51 | 显示全部楼层
好好 学习了 确实不错
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|聚云老站长 ( 粤ICP备2023011934号-1 )

GMT+8, 2024-9-22 00:52 , Processed in 1.858843 second(s), 24 queries .

快速回复 返回顶部 返回列表