近日工作中涉及到项目同时处理多个线程问题时,在网上找到了PHP的pthreads扩展以及curl_multi_init函数,具体如下:
一 、windows下安装php真正的多线程扩展pthreads教程
扩展地址:
注意事项php5.3或以上,且为线程安全版本。apache和php使用的编译器必须一致。通过phpinfo()查看Thread Safety为enabled则为线程安全版。通过phpinfo()查看Compiler项可以知道使用的编译器。本人的为:MSVC9 (Visual C++ 2008)。本人使用环境32位windows xp sp3,wampserver2.2d(php5.3.10-vc9 + apache2.2.21-vc9)。一、下载pthreads扩展下载地址:根据本人环境,我下载的是pthreads-2.0.8-5.3-ts-vc9-x86。2.0.8代表pthreads的版本。5.3代表php的版本。ts表示php要线程安全版本的。vc9表示php要Visual C++ 2008编译器编译的。x86则表示32位的二、安装pthreads扩展复制php_pthreads.dll 到目录 bin\php\ext\ 下面。(本人路径D:\wamp\bin\php\php5.3.10\ext)复制pthreadVC2.dll 到目录 bin\php\ 下面。(本人路径D:\wamp\bin\php\php5.3.10)复制pthreadVC2.dll 到目录 C:\windows\system32 下面。打开php配置文件php.ini。在后面加上extension=php_pthreads.dll提示!Windows系统需要将 pthreadVC2.dll 所在路径加入到 PATH 环境变量中。我的电脑--->鼠标右键--->属性--->高级--->环境变量--->系统变量--->找到名称为Path的--->编辑--->在变量值最后面加上pthreadVC2.dll的完整路径(本人的为C:\WINDOWS\system32\pthreadVC2.dll)。三、测试pthreads扩展- class AsyncOperation extends \Thread {
- public function __construct($arg){
- $this->arg = $arg;
- }
- public function run(){
- if($this->arg){
- printf("Hello %s\n", $this->arg);
- }
- }
- }
- $thread = new AsyncOperation("World");
- if($thread->start())
- $thread->join();
- ?>
运行以上代码出现 Hello World,说明pthreads扩展安装成功!
附上一个Thinkphp3.2.2简单例子- <?php
- namespace Home\Controller;
- class test extends \Thread {
- public $url;
- public $result;
- public function __construct($url) {
- $this->url = $url;
- }
- public function run() {
- if ($this->url) {
- $this->result = model_http_curl_get($this->url);
- }
- }
- }
- function model_http_curl_get($url) {
- $curl = curl_init();
- curl_setopt($curl, CURLOPT_URL, $url);
- curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
- curl_setopt($curl, CURLOPT_TIMEOUT, 5);
- curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.2)');
- $result = curl_exec($curl);
- curl_close($curl);
- return $result;
- }
- for ($i = 0; $i < 10; $i++) {
- $urls[] = 'http://www.baidu.com/s?wd='. rand(10000, 20000);
- }
- /* 多线程速度测试 */
- $t = microtime(true);
- foreach ($urls as $key=>$url) {
- $workers[$key] = new test($url);
- $workers[$key]->start();
- }
- foreach ($workers as $key=>$worker) {
- while($workers[$key]->isRunning()) {
- usleep(100);
- }
- if ($workers[$key]->join()) {
- dump($workers[$key]->result);
- }
- }
- $e = microtime(true);
- echo "多线程耗时:".($e-$t)."秒<br>";
- /* 单线程速度测试 */
- $t = microtime(true);
- foreach ($urls as $key=>$url) {
- dump(model_http_curl_get($url));
- }
- $e = microtime(true);
- echo "For循环耗时:".($e-$t)."秒<br>";
测试结果如下:
多线程耗时:2.8371710777282714844秒For循环耗时:10.941586017608642578秒原文出自:http://www.thinkphp.cn/topic/22676.html
二 、curl_multi_init()
<?php
echo date("Y-m-d H:m:s",time());echo " ";echo floor(microtime()*1000);echo "<br>";$mtime = explode(" ", microtime());$mtime = $mtime[1].($mtime[0] * 1000);$mtime2 = explode(".", $mtime);$mtime = $mtime2[0]; echo $mtime;echo "<br>";$urls = array('http://www.webkaka.com', 'http://www.webkaka.com', 'http://www.webkaka.com', 'http://www.webkaka.com', 'http://www.webkaka.com');print_r(async_get_url($urls)); // [0] => example1, [1] => example2echo "<br>";echo date("Y-m-d H:m:s",time());echo " ";echo floor(microtime()*1000);echo "<br>";$mtime_ = explode(" ", microtime());$mtime_ = $mtime_[1].($mtime_[0] * 1000);$mtime2_ = explode(".", $mtime_);$mtime_ = $mtime2_[0]; echo $mtime_;echo "<br>";echo $mtime_ - $mtime;function async_get_url($url_array, $wait_usec = 0)
{ if (!is_array($url_array)) return false; $wait_usec = intval($wait_usec); $data = array(); $handle = array(); $running = 0; $mh = curl_multi_init(); // multi curl handler $i = 0; foreach($url_array as $url) { $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // return don't print curl_setopt($ch, CURLOPT_TIMEOUT, 30); curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)'); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirect curl_setopt($ch, CURLOPT_MAXREDIRS, 7); curl_multi_add_handle($mh, $ch); // 把 curl resource 放进 multi curl handler 里 $handle[$i++] = $ch; } /* 执行 */ do { curl_multi_exec($mh, $running); if ($wait_usec > 0) /* 每个 connect 要间隔多久 */ usleep($wait_usec); // 250000 = 0.25 sec } while ($running > 0); /* 读取资料 */ foreach($handle as $i => $ch) { $content = curl_multi_getcontent($ch); $data[$i] = (curl_errno($ch) == 0) ? $content : false; } /* 移除 handle*/ foreach($handle as $ch) { curl_multi_remove_handle($mh, $ch); } curl_multi_close($mh); return $data;}?>
关于curl_multi_init()
一般来说,想到要用curl_multi_init()时,目的是要同时请求多个url,而不是一个一个依次请求,否则就要curl_init()了。
不过,在使用curl_multi的时候,你可能遇到cpu消耗过高、网页假死等现象,可以看看
使用curl_multi的步骤总结如下:
第一步:调用curl_multi_init
第二步:循环调用curl_multi_add_handle这一步需要注意的是,curl_multi_add_handle的第二个参数是由curl_init而来的子handle。第三步:持续调用curl_multi_exec第四步:根据需要循环调用curl_multi_getcontent获取结果第五步:调用curl_multi_remove_handle,并为每个字handle调用curl_close第六步:调用curl_multi_close各函数作用解释:
curl_multi_init()初始化一个curl批处理句柄资源。
curl_multi_add_handle()向curl批处理会话中添加单独的curl句柄资源。curl_multi_add_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。
curl_multi_exec()解析一个curl批处理句柄,curl_multi_exec()函数有两个参数,第一个参数表示一个批处理句柄资源,第二个参数是一个引用值的参数,表示剩余需要处理的单个的curl句柄资源数量。
curl_multi_remove_handle()
移除curl批处理句柄资源中的某个句柄资源,curl_multi_remove_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。curl_multi_close()关闭一个批处理句柄资源。
curl_multi_getcontent()在设置了CURLOPT_RETURNTRANSFER的情况下,返回获取的输出的文本流。
curl_multi_info_read()获取当前解析的curl的相关传输信息。