多年之前写过一个爬虫,里面用到了模板模式,模板模式实现起来好像很简单,基本上只用抽象类加继承就可以了,它总是这么普通以至于人们总是忽略它。但我要说的是当你无论遇到什么问题都应该想想这个问题是不是用模板模式解决更好,也许你会有意想不到的惊喜。
模板模式的解释
模板模式是说,在父类中定义一个业务运行的骨架或者主要流程,其中部分步骤的实现放到子类中完成,这样子类就可以在不改变主要业务流程的情况下,修改该步骤的具体实现。
PHP中抽象类就是一个模板,在抽象类中将某些步骤可以做成抽象方法,在子类中去实现这样抽象方法。
在爬虫中的应用
下面,用一个爬虫的例子来演示模板模式:
<?php
/**
* Author: shanhuhai
* Date: 2017/9/3 22:37
* Mail: 441358019@qq.com
*/
abstract class Spider {
public function get($url) {
$content = file_get_contents($url);
return $content;
}
abstract public function parseTitle($content);
public function fetch($url){
$content = $this->get($url);
$title = $this->parseTitle($content);
echo $title.PHP_EOL;
}
}
class QQSpider extends Spider {
public function parseTitle($content){
preg_match("#title:'(+.)'#iUs", $content, $mat);
return $mat[1];
}
}
class NeteaseSpider extends Spider {
public function parseTitle($content) {
preg_match("#<h1>([^<>+]+)</h1>#iUs", $content, $mat);
return $mat[1];
}
}
$spider = new QQSpider();
$spider->fetch('http://news.qq.com/a/20170903/174402.htm');
$spider = new NeteaseSpider();
$spider->fetch('http://news.163.com/17/0903/18/CTEAHU2S0001875P.html');
还是用爬虫来做例子,由于不同的站点内容解析规则是不一样的,但是解析流程都是一样的,这时使用模板模式是最好不过了,我们将主业务流程放到抽象类也就是“模板”中,具体不同网站的解析规则放到抽象方法中,然后在子类中实现这些具体的解析规则,从而实现了不需要修改主业务流程就可以根据爬去内容的不同添加和修改某个步骤的具体实现方法。
上面的代码由于编码等问题可能是运行不成的,但是这不妨碍你理解模板模式。
转载请注明:大后端 » php设计模式之——模板模式