项目名称:网页教学http://www.webjx.com
目标站点URL:http://www.webjx.com/photoshop/index.html
远程列表URL:http://www.webjx.com/photoshop/list_56_3.html
如果列表要分页采集:选“是”
远程列表分页URL:http://www.webjx.com/photoshop/list_56_{$pageid}.html 然后填写远程列表起始页和结束页
获取列表开始代码:<dl><dt><span>
获取列表结束代码:</dd>
</dl>
</div>
获取连接开始代码:<a title="" href="
获取连接结束代码:">
获取标题开始代码:<h1>
获取标题结束代码:</h1>
获取内容开始代码:<div id="entrybody">
获取内容结束代码:</h3></div>
是否内容分页采集:
分页设置
获取分页URL列表区域开始代码:<div id="entrynum">
获取分页URL列表区域结束代码:</a> </div>
获取分页URL开始代码:<a href='
获取分页URL结束代码:'>
匹配过虑内容字符选项一:过滤文章开头的“浏览网页教学网更多的。。。。”
过虑字符开始代码:<h3
过虑字符结束代码:</h3>
匹配过虑内容字符选项二:过滤文章结尾的“浏览网页教学网更多的。。。。”
过虑字符开始代码:<h3
过虑字符结束代码:</a>
经过测试,无论被采集站的文章分页与否都能采集成功,在文章编辑了也是分页的,但在网页中却只显示一页,这可能是分页调用的问题,我不是很明白,望有人指教
问题已解决,把模板中config.xml的内容模式中的1改为0,显示分页模板为0.