HTML5先行者高级交流群
欢迎加入学习讨论
专注前端,专注网页设计制作及网站开发项目 - (低价承接网站开发项目) QQ:370158739
加入收藏
RSS
首页
JS下载
CSS3手册
Json在线解析
html5教程
网站及特效实例
视频教程
html5资讯
网络编程
html5书籍
HTML5演示
论坛
入门教程
高级应用
滚动新闻
html5实验
javascript特效
Photoshop教程及网页素材
jquery特效
html5视频教程
CSS3视频教程
JS视频教程
JUQERY视频教程
Bootstrap视频教程
html5video
微信服务号开发教程
最新资讯
最新动态
IT动态
ASP编程
PHP编程
正则表达式
AJAX相关
ASP.NET
JSP编程
Flex
脚本加解密
网页编辑器
相关技巧
黑客相关
网页播放器
其它综合
java教程
您的位置
:
首页
>
cms教程
>
帝国ecms教程
» 正文
帝国cms采集图文教程(上,中,下)全集 帝国cms,采集,图文教程
2014-04-03 23:51:20
[
小
大
]
已经帮助:
人解决问题
帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采集功能来完成信息的录入。为了深入了解帝国cms采集功能,下面我们以“新浪各地新闻”栏目为例来进行实战采集。
VGZHTML5中文学习网 - HTML5先行者学习网
一、增加采集节点
VGZHTML5中文学习网 - HTML5先行者学习网
1、添加节点:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
2、选择要增加采集的栏目:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
3、进入增加节点表单:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
4、在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
5、下来发现好多选项,如“采集页面地址方式二,内容页地址前缀...”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
6、这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
7、把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
8、切换到Dreamweaver代码方式,
VGZHTML5中文学习网 - HTML5先行者学习网
就是信息链接区域:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
9、得到信息链接区域正则:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
10、得到信息页链接正则:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
11、注意:如果信息页链接是相对地址,例如< a href="/c/2012-03-05/205924063527.shtml" target="_blank" >,那么“内容页地址前缀”要加域名:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
12、现在要采集内容页的标题和内容:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
13、查看新闻页“源文件”,找title标签:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
14、取得标题正则:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
15、这里是要采集的内容区域:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
16、取得新闻内容正则:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
(注意:新闻内容正则里的 d_id='*' 用了通配符,因为每一篇新闻的d_id值是不同的,所以可以用*来代替它,“*”可以代替任意字符。)
VGZHTML5中文学习网 - HTML5先行者学习网
17、点击提交按钮就完成了整个采集节点:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
二、预览采集节点是否正确
VGZHTML5中文学习网 - HTML5先行者学习网
1、提交按钮后返回管理节点:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
2、点击“预览”采集,进入节点预览结果:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
3、采集内容页列表
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
4、采集内容页页面:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
三、采集
VGZHTML5中文学习网 - HTML5先行者学习网
1、预览采集节点无误后,然后返回“管理节点”,点击“开始采集”链接就开始进行采集:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
2、系统正在采集中:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
3、采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
4、修改信息页面如图:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
5、对采集的信息进行审核并入库,点击“入库全部信息按钮”:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
6、确定操作:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
7、信息入库完毕提示:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
信息入库完毕后下来点击”管理信息“:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
我们可以看到刚刚采集入库的新闻信息:
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
VGZHTML5中文学习网 - HTML5先行者学习网
最后到“数据更新”刷新首页、栏目、和内容页就可以完成网站的信息采集了。由于帝国cms采集功能非常强大,一时半刻也说不完,下一页将继续讲解其他功能的使用和技巧。
VGZHTML5中文学习网 - HTML5先行者学习网
1
2
3
下一页
尾页
来顶一下
返回首页
(责任编辑:)
推荐书籍
推荐资讯
html5及css3做的3D小
html5视频应用
友情链接:
联系人:QQ370158739
关于HTML5先行者
-
联系我们
-
广告服务
-
友情链接
-
网站地图
-
版权声明
-
人才招聘
-
帮助