|
简介说明
1. 站长主动向百度搜索推送数据,可缩短爬虫发现网站链接时间,可加快爬虫抓取速度,但无法解决网站内容是否收录问题。
2. 百度搜索资源平台为站长提供链接提交通道,但不保证一定能够收录提交的链接。
3.通过程序代码方式,将根据自己需要将网站的链接提交给百度蜘蛛。
4.本程序代码是将文章的id提取出来,再和单页页面组合成新的数组,提交的时候按20条进行分割,最终提交给百度蜘蛛。
- <?php
- //豫章小站出品
- include ( "wp-config.php" ) ;
- require_once (ABSPATH.'wp-blog-header.php');
- global $wpdb;
- $qianzui = "https://www.wensuhulian.com/"; //更改为自己的域名
- $houzui = ".html";//URL网址链接后缀
- $sql="SELECT ID FROM wp_posts WHERE post_type = 'post' AND post_status = 'publish' ORDER BY ID DESC limit 0,195";
- $myrows = $wpdb->get_results($sql);
- foreach ($myrows as $b) {
- $id=$b->ID;
- $url=$qianzui.$id.$houzui;
- $ar[] = $url;
- }
- $urls = array(
- 'https://www.wensuhulian.com/topics/pm',
- 'https://www.wensuhulian.com/topics/cloud',
- 'https://www.wensuhulian.com/topics/cloud/domains',
- 'https://www.wensuhulian.com/topics/idcnews',
- 'https://www.wensuhulian.com/topics/btc',
- ); //更改为自己的单页面
- $num=array_merge_recursive($urls,$ar);
- $chunk_result = array_chunk($num, 20);
- foreach ($chunk_result as $a){
- $api = 'http://data.zz.baidu.com/urls?site=https://www.wensuhulian.com/&token=*****'; //这里要替换为自己在百度官方的api地址,如何获取文章有介绍
- $ch = curl_init();
- $options = array(
- CURLOPT_URL => $api,
- CURLOPT_POST => true,
- CURLOPT_RETURNTRANSFER => true,
- CURLOPT_POSTFIELDS => implode("\n", $a),
- CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),
- );
- curl_setopt_array($ch, $options);
- $result = curl_exec($ch);
- echo $result;
- }
- ?>
复制代码
将上述代码保存命名为push.php,上传到网站根目录,然后就可以直接访问https://你的域名地址/push.php这个页面来推送给百度蜘蛛了,可以每隔几天访问一次。
参数说明:
1、$sql语句中,limit 0,195这里是提取最近195篇文章,可以根据自己需要调整。
2、$houzui 网址后缀,有些站长可能没有用.html这种方式,比如是https://你的域名地址/1437/这种链接,那么$url=$qianzui.$id.$houzui这段就要修改为$url=$qianzui.$id
3、$urls变量是自定义需要提取的链接地址,可以根据自己需要添加,如果不需要可以删除这部分代码,删除以后后面$chunk_result = array_chunk($num, 20);就需要修改为$chunk_result = array_chunk($ar, 20);
百度蜘蛛主动推送的api获取方式如下图:
wordpress使用代码向百度蜘蛛主动推送链接 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|