列表页数据自动采集

所属栏目:演示站点一 更新时间:2024-05-23 点击: 文章来源:http://www.sznest.net/jzjc/0001/7573.html

第一步:添加采集规则有两种方式(二选一)

第一种方式:一步到位(仅限采集规则的添加,不包含数据,数据的添加仍然需要执行后面的第二步与第三步)
1:点击caijisql这个文件复制里面的内容
2:点击SQL,点击添加SQL,将复制的内容粘贴进去,然后点击提交

第二种方式:分步添加(点击图片下方蓝色文字可直接复制)

添加行业资迅采集规则
行业资迅采集规则
1:列表页默认页url:http://www.sznest.net/_mfmb/0001/xwzx/hyzx/
2:带参数的详情页url:http://www.sznest.net/_mfmb/0001/xwzx/idvalue.html
3:列表页循环体正则:/<div class="clear"></div></div><ul class="news_list mt20">(.*?)</ul><div class="clear"></div></div><div class="bg_foot" data-am-scrollspy/i
4:列表页循环体内id正则:/<li><span class="date">[0-9]{2}<em>[0-9]{4}-[0-9]{2}</em></span><div><a href="http://www.sznest.net/_mfmb/0001/xwzx/([a-z]{1,}/[0-9]{1,}).html" title="[^"]{1,}">[^<]{1,}</a>[^<]{1,}</div></li>/i
5:列表页循环体内标题正则:/<li><span class="date">[0-9]{2}<em>[0-9]{4}-[0-9]{2}</em></span><div><a href="http://www.sznest.net/_mfmb/0001/xwzx/[a-z]{1,}/[0-9]{1,}.html" title="([^"]{1,})">[^<]{1,}</a>[^<]{1,}</div></li>/i
6:详情页标签循环体正则:/</script>&nbsp;&nbsp;&nbsp;标签:(.*?)</div><div class="intro">/i
7:详情页标签循环体内文本正则:/<a href="[^"]{1,}">([^<]{1,})</a>&nbsp;&nbsp;&nbsp;/i
8:列表页循环体内简介正则:/<li><span class="date">[0-9]{2}<em>[0-9]{4}-[0-9]{2}</em></span><div><a href="http://www.sznest.net/_mfmb/0001/xwzx/[a-z]{1,}/[0-9]{1,}.html" title="[^"]{1,}">[^<]{1,}</a>([^<]{1,})</div></li>/i
9:详情页时间正则:/<div class="info">日期:([0-9-]{1,}) 人气:/i
10:详情页详情正则:/<div class="intro">(.*?)<div class="clear"></div></div><div class="other">/i

添加公司动态采集规则
1:将行业资迅的采集规则复制给公司动态
2:修改公司动态的列表页url默认页:http://www.sznest.net/_mfmb/0001/xwzx/gsdt/

添加生活家电采集规则
生活家电采集规则
1:列表页默认页url:http://www.sznest.net/_mfmb/0001/cpzs/shjd/
2:带参数的详情页url:http://www.sznest.net/_mfmb/0001/cpzs/idvalue.html
3:列表页循环体正则:/<div class="home_pro"><ul id="home_pro_ul">(.*?)</ul><div class="clear"></div></div></div><div class="bg_foot" data-am-scrollspy=/i
4:列表页循环体内id正则:/<li><a href="http://www.sznest.net/_mfmb/0001/cpzs/([a-z]{1,}/[0-9]{1,}).html" title="[^"]{1,}"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="279"></div><p class="title">[^<]{1,}</p></a></li>/i
5:列表页循环体内标题正则:/<li><a href="http://www.sznest.net/_mfmb/0001/cpzs/[a-z]{1,}/[0-9]{1,}.html" title="([^"]{1,})"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="279"></div><p class="title">[^<]{1,}</p></a></li>/i
6:列表页循环体内图片正则:/<li><a href="http://www.sznest.net/_mfmb/0001/cpzs/[a-z]{1,}/[0-9]{1,}.html" title="[^"]{1,}"><div><img src="([^"]{1,})" alt="[^"]{1,}" height="279"></div><p class="title">[^<]{1,}</p></a></li>/i
7:详情页简介正则:/<div class="right"><h1>[^<]{1,}</h1><hr><h5>([^<]{1,})</h5><hr><ul class="attribute">/i
8:详情页时间正则:/<li id="date"><em>日期:</em>([0-9-]{1,})</li>/i
9:详情页属性循环体正则:/</h5><hr><ul class="attribute">(.*?)<li id="date"><em>日期:</em>/i   
10:详情页属性循环体内属性名正则:/<li><em>([^:]{1,}):</em>[^<]{1,}</li>/i
11:详情页属性循环体内属性值正则:/<li><em>[^:]{1,}:</em>([^<]{1,})</li>/i
12:详情页相册循环体正则:/<div class="thumb_pic">(.*?)</div></div><div class="right">/i
13:详情页相册循环体内路径正则:/<li><img src="([^"]{1,})" data-url="[^"]{1,}" alt="" width="60" height="60"></li>/i
14:详情页详情正则:/<div class="intro" id="con_one_1">(.*?)</div></div><div class="clear"></div></div></div><div class="bg_foot" data-am-scrollspy=/i

添加智能家电采集规则
1:将生活家电的采集规则复制给智能家电
2:修改智能家电的列表页url默认页:http://www.sznest.net/_mfmb/0001/cpzs/znjd/
3:清空详情页属性循环体正则、详情页属性循环体内属性名正则、详情页属性循环体内属性值正则(因为智能家电没有属性)

添加客户案例采集规则
客户案例采集规则
1:列表页默认页url:http://www.sznest.net/_mfmb/0001/khal/
2:带参数的列表页url:http://www.sznest.net/_mfmb/0001/khal/page_endpage.html
3:带参数的详情页url:http://www.sznest.net/_mfmb/0001/khal/idvalue.html
4:列表页循环体正则:/<div class="list_pic"><ul id="list_pic_ul">(.*?)/ul><div class="clear"></div></div></div><div class="bg_foot"/i
5:列表页循环体内id正则:/<li><a href="http://www.sznest.net/_mfmb/0001/khal/([0-9]{1,}).html" title="[^"]{1,}"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="200"></div><p class="title">[^<]{1,}</p></a></li>/i
6:列表页循环体内标题正则:/<li><a href="http://www.sznest.net/_mfmb/0001/khal/[0-9]{1,}.html" title="([^"]{1,})"><div><img src="[^"]{1,}" alt="[^"]{1,}" height="200"></div><p class="title">[^<]{1,}</p></a></li>/i
7:列表页循环体内图片正则:/<li><a href="http://www.sznest.net/_mfmb/0001/khal/[0-9]{1,}.html" title="[^"]{1,}"><div><img src="([^"]{1,})" alt="[^"]{1,}" height="200"></div><p class="title">[^<]{1,}</p></a></li>/i
8:详情页时间正则:/<div class="news_show"><h1>[^<]{1,}</h1><div class="info">日期:([0-9]{4}-[0-9]{2}-[0-9]{2}) 人气/i
9:详情页详情正则:/</script></div><div class="intro">(.*?)<div class="clear"></div></div><div class="other">/i

第二步:添加完规则之后,接下来进入采集规则列表页面,然后点击开始采集就可以了

第三步:全部采集完成之后,还需要进入新闻中心、产品展示、客户案例三个节点的采集记录页面中去批量审核

相关阅读

第一集:初始化、登录后台、搭建网站节点框架

一:点击http://mfmb0001.sznest.net/admin/index/init.php这个链接初始化服务器上的网站数据二:登录后台登录地址:http://mfmb0001.sznest.net/admin/登录账号:手机与密码全填写13798214959初始化成功之后进入后台你将能看到左侧的“管理信息”只有一个首页在顶部有以下的菜单1:配置1…

了解详情 >>

第二集:采集PC站与手机站的网站资源

为了简化采集过程,提升后台用户体验,后台的采集网站资源的功能进行了改版升级,所以当前的部分视频内容与实际操作会有差异,看到有差异的地方,请以下面的文字介绍为准一:什么是网站资源?所谓网站的资源是指以下的几种文件1:代码文件1.1:网页文件1.2:样式文件,简称css文件1.3:javascript文件,简称js文件2:上传文件,即图片、字体文件二:采集到的网…

了解详情 >>

第三集:手动添加数据

一:添加公司简介与企业文化,见下图二:添加联系我们,见下图(下图的源代码是&lt;iframesrc=&quot;/html/map.php&quot;width=&quot;100%&quot;height=&quot;400&quot;frameborder=&quot;0&quot;&gt;&lt;/iframe&gt;点击左侧蓝色文字可复制),然后处…

了解详情 >>

第四集:获取PC站公共部分的代码、格式化及修改代码

一:点击备份下的/html/目录备份,会自动将当前目录压缩到网站的/_backup/zip/下二:将压缩的备份文件下载到本地电脑的D盘并且解压到D盘(这里为了演示方便,我就直接下载到D盘的根目录下)三:点击打开解压的文件夹一层一层进入直到找到html文件夹,然后移到D盘四:打开html文件夹,里面有以下的原始文件1:bodyfoot.php这个是公共底部文件…

了解详情 >>

第五集:获取手机站公共部分的代码、格式化及修改代码

一:点击备份下的/wap/目录备份,会自动将当前目录压缩到网站的/_backup/zip/下二:将压缩的备份文件下载到本地电脑的D盘并且解压到D盘三:点击解压的文件夹一层一层进入直到找到wap文件夹,然后移到D盘四:创建搜索文件,在wap文件夹中复制bodytop.php或者bodyfoot.php中的任意一个文件,改名为search.php五:新建站点1:…

了解详情 >>

第六集:首页公司简介、页脚、logo、banner等杂项源代…

一:首页公司简介源代码&lt;p&gt;【&lt;spanstyle=&quot;color:rgb(255,0,0);&quot;&gt;本段内容可在内容管理的区块管理中修改&lt;/span&gt;】美的集团是一家全球领先的消费电器、暖通空调、机器人及工业自动化系统的科技集团。提供多元化的产品种类,包括空调、冰箱、洗衣机、厨房家电、及各类小型家电。美的坚…

了解详情 >>

Copyright @ 2008-2019   www.sznest.net   All rights reserved  网巢网是一家专业为企业提供免费建站、自助建站的模板建站公司     友情链接:香港张元洪律师行   

微信

移动端

客服

顶部