TemplateSpider顾名思义是一个模板爬虫,看好哪个网站,指定好URL,自动扒下来做成 html模版。并且所下载的css、js、图片、html文件会自动分好类保存到特定文件夹。
然后使用 模版计算工具,自动将 html模版计算合成为 网市场云建站系统 可用的模版。项目最初目的为 网市场云建站系统(CMS建站系统) 因模版量少而做。用了之前写的 xnx3 ,以及 Jsoup 。使用方法将要扒取的网站页面的网址粘贴进去点击左下方“开始抓取”按钮等待抓取完毕,自动打开下载好的文件夹简单且方便实列演示例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看,或者二次加工。使用模板计算工具进行强制合成可以将导入的模版页面的一些标签自动进行替换。比如:将页面的title自动设置好动态标签自动将模版页面中的 Keywords 、description 删除掉。修改好了以后就可以上传至空间或者vps使用了,调用一下文件即可,最简单的div+$(“#page1”).load(“b.html”)直接加载B.html文件制作不易,点个赞再走吧
0 评论