首页
关于
Search
1
给你10个市场数据调研报告的免费下载网站!以后竞品数据就从这里找!
183 阅读
2
php接口优化 使用curl_multi_init批量请求
144 阅读
3
《从菜鸟到大师之路 ElasticSearch 篇》
107 阅读
4
2024年备考系统架构设计师
104 阅读
5
PHP 文件I/O
92 阅读
php
thinkphp
laravel
工具
开源
mysql
数据结构
总结
思维逻辑
令人感动的创富故事
读书笔记
前端
vue
js
css
书籍
开源之旅
架构
消息队列
docker
教程
代码片段
redis
服务器
nginx
linux
科普
java
c
ElasticSearch
测试
php进阶
php基础
登录
Search
标签搜索
php函数
php语法
性能优化
安全
错误和异常处理
问题
vue
Composer
Session
缓存
框架
Swoole
api
并发
异步
正则表达式
php-fpm
mysql 索引
开发规范
协程
dafenqi
累计撰写
786
篇文章
累计收到
32
条评论
首页
栏目
php
thinkphp
laravel
工具
开源
mysql
数据结构
总结
思维逻辑
令人感动的创富故事
读书笔记
前端
vue
js
css
书籍
开源之旅
架构
消息队列
docker
教程
代码片段
副业
redis
服务器
nginx
linux
科普
java
c
ElasticSearch
测试
php进阶
php基础
页面
关于
搜索到
560
篇与
的结果
2023-08-08
纯PHP实现定时器任务(Timer)
纯PHP实现定时器任务(Timer)定时器任务,在WEB应用比较常见,如何使用PHP实现定时器任务,大致有两种方案:1)使用Crontab命令,写一个shell脚本,在脚本中调用PHP文件,然后定期执行该脚本;2)配合使用ignore_user_abort()和set_time_limit(),使脚本脱离浏览器运行。前者是利用Linux的特性,和PHP本身没有多大关系,后者使用场景有限,且只能由一次HTTP请求触发该脚本,执行完后退出。那么我们如何使用纯PHP实现纯粹的定时器任务,且能适应认识任务业务需求?基础知识此程序在Linux下开发,以cli模式运行,一下是基本知识的简要介绍。CLI:PHP的命令行模式,常见的WEB应用使用的是fpm;进程:进程是程序运行的基本单元,进程之间是独立运行且互不干扰的,有独立的运行空间,每个进程都有一个进程控制块;进程间通信:既然进程是独立运行,我们需要一种机制保证不同进程信息的交换,进程间通信主要包括:管道,IPC(共享内存,信号,消息队列),套接字;PCNTL扩展:PHP的一个进程扩展,主要用到pcntl_alarm()函数,详细介绍请查阅官网.实现原理用一个三维数组保存所有需要执行的任务,一级索引为时间戳,值为执行任务的方法、回调参数等,具体数组形式如下:复制代码array( '1438156396' => array( array(1,array('Class','Func'), array(), true), ))说明:1438156396 时间戳array(1,array('Class','Func'), array(), true) 参数依次表示: 执行时间间隔,回调函数,传递给回调函数的参数,是否持久化(ture则一直保存在数据中,否则执行一次后删除)复制代码这些任务可以是任意类的方法。既然是定时任务,我们需要一个类似计时的东东,此方案采用信号量去做,每一秒向当前进程发送SIGALRM信号,并捕获该信号,触发信号处理函数,循环遍历数据,判断是否有当前时间需要执行的任务。如果有则采用回调方式触发,并把参数传递给该方法。复制代码 1 <?php 2 /** 3 *定时器 4 */ 5 class Timer 6 { 7 //保存所有定时任务 8 public static $task = array(); 9 10 //定时间隔 11 public static $time = 1; 12 13 /** 14 *开启服务 15 *@param $time int 16 */ 17 public static function run($time = null) 18 { 19 if($time) 20 { 21 self::$time = $time; 22 } 23 self::installHandler(); 24 pcntl_alarm(1); 25 } 26 /** 27 *注册信号处理函数 28 */ 29 public static function installHandler() 30 { 31 pcntl_signal(SIGALRM, array('Timer','signalHandler')); 32 } 33 34 /** 35 *信号处理函数 36 */ 37 public static function signalHandler() 38 { 39 self::task(); 40 //一次信号事件执行完成后,再触发下一次 41 pcntl_alarm(self::$time); 42 } 43 44 /** 45 *执行回调 46 */ 47 public static function task() 48 { 49 if(empty(self::$task)) 50 {//没有任务,返回 51 return ; 52 } 53 foreach(self::$task as $time => $arr) 54 { 55 $current = time(); 56 57 foreach($arr as $k => $job) 58 {//遍历每一个任务 59 $func = $job['func']; /回调函数/ 60 $argv = $job['argv']; /回调函数参数/ 61 $interval = $job['interval']; /时间间隔/ 62 $persist = $job['persist']; /持久化/ 63 64 if($current == $time) 65 {//当前时间有执行任务 66 67 //调用回调函数,并传递参数 68 call_user_func_array($func, $argv); 69 70 //删除该任务 71 unset(self::$task[$time][$k]); 72 } 73 if($persist) 74 {//如果做持久化,则写入数组,等待下次唤醒 75 self::$task[$current+$interval][] = $job; 76 } 77 } 78 if(empty(self::$task[$time])) 79 { 80 unset(self::$task[$time]); 81 } 82 } 83 } 84 85 /** 86 *添加任务 87 */ 88 public static function add($interval, $func, $argv = array(), $persist = false) 89 { 90 if(is_null($interval)) 91 { 92 return; 93 } 94 $time = time()+$interval; 95 //写入定时任务 96 self::$task[$time][] = array('func'=>$func, 'argv'=>$argv, 'interval'=>$interval, 'persist'=>$persist); 97 } 98 99 /**100 *删除所有定时器任务101 */102 public function dellAll()103 {104 self::$task = array();105 }106 }复制代码这是定时器类核心部分,有一个静态变量保存有所有需要执行的任务,这里为什么是静态的呢?大家自行思考.当进程接受到 SIGALRM 信号后,触发 signalHandler 函数,随后循序遍历数组查看是否有当前时间需要执行的任务,有则回调,并传递参数,删除当前job,随后检查是否要做持久化任务,是则继续将当前job写入事件数组等待下次触发,最后再为当前进程设置一个闹钟信号.可以看出这个定时器,只要触发一次就会从内部再次触发,得到自循环目的.复制代码 1 <?php 2 3 class DoJob 4 { 5 public function job( $param = array() ) 6 { 7 $time = time(); 8 echo "Time: {$time}, Func: ".get_class()."::".__FUNCTION__."(".json_encode($param).")\n"; 9 }10 }复制代码这是回调类及函数,为方便说明,加入不少调试信息.Timer类及回调都有了,我们看看使用场景是怎么样的.复制代码 1 <?php 2 3 require_once(__DIR__."/Timer.php"); 4 require_once(__DIR__."/DoJob.php"); 5 6 7 Timer::dellAll(); 8 9 Timer::add( 1, array('DoJob','job'), array(),true);10 11 Timer::add( 3, array('DoJob','job'),array('a'=>1), false);12 13 echo "Time start: ".time()."\n";14 Timer::run();15 16 while(1)17 {18 sleep(1);19 pcntl_signal_dispatch();20 }复制代码代码非常短,这里注册了两个job,随后运行定时器,在一个无限循环里捕捉信号触发动作,如果不捕获将无法触发事先注册的处理函数.这样一个自循环的定时器开发完成.运行结果如下:如我们场景类添加的任务一样,在90的时候执行了两个任务,一个为持久化的不带参数的job,一个为非持久化带参数的job,随后非持久化job不再执行.总结在收到信号前,当前进程不能退出.这里我使用了条件永远为真的循环.在我们实际生产环境中,需要创造这么一个先决条件,比如说,我们有一组服务,这些服务都是一直运行的,不管是IO访问,等待socket链接等等,当前服务都不会终止,即使进程阻塞也不会有问题,这种场景,也就是有一个一直运行的服务中使用.目前PHP只支持以秒为单位的触发,不支持更小时间单位,对位定时任务而言基本足够
2023年08月08日
12 阅读
0 评论
0 点赞
2023-08-08
php性能分析
PHP 性能分析与实验(一)——性能的宏观分析PHP 性能分析与实验(二)——性能的微观分析
2023年08月08日
11 阅读
0 评论
0 点赞
2023-08-08
From Apprentice To Artisan - 从百草园到三味书屋
From Apprentice To Artisan 原文作者: Taylor Otwell 网上偶得此书,是Laravel的作者写的。 Laravel是近年来优秀的PHP框架,国内外都有很多支持者。该框架应用了大量PHP5尤其是5.3以后的新特性,使得后端的开发进一步的简便而灵活。具体可以看这里 http://www.laravel.com作者写的这本书详细介绍了Laravel框架涉及的各种软件理念和工具,如依赖注入、控制反转容器、面向接口编程等。
2023年08月08日
24 阅读
0 评论
0 点赞
2023-08-08
php调试利器之phpdbg
php调试利器之phpdbg简介PHPDBG是一个PHP的SAPI模块,可以在不用修改代码和不影响性能的情况下控制PHP的运行环境。PHPDBG的目标是成为一个轻量级、强大、易用的PHP调试平台。可以在PHP5.4和之上版本中使用。在php5.6和之上版本将内部集成。主要功能:– 单步调试– 灵活的下断点方式(类方法、函数、文件:行、内存地址、opcode)– 可直接调用php的eval– 可以查看当前执行的代码– 用户空间API(userland/user space)– 方便集成– 支持指定php配置文件– JIT全局变量– readline支持(可选),终端操作更方便– 远程debug,使用java GUI– 操作简便(具体看help)安装为了使用phpdgb,你首先需要下载一个php的源码包。然后下载phpdgb的源码包,并放在php源码包的sapi目录下。最后,你就可以执行命令安装了。编译安装示例如下:假设我们已经下载php的源码包,并放在了/home/php目录下。1234567cd /home/php/sapigit clone https://github.com/krakjoe/phpdbgcd .././buildconf --force./config.nicemake -j8make install-phpdbg注意:1、如果你的php版本是php5.6或者更高的版本,phpdbg已经集成在php的代码包中,无需单独下载了。2、编译参数中记得要加 –enable-phpdbg。3、编译时参数,–with-readline 可以选择性添加。如果不添加,phpdbg的history等功能无法使用。基本使用参数介绍phpdbg是php的一个sapi,它可以以命令行的方式调试php。常用参数如下:The following switches are implemented (just like cli SAPI):-n ignore php ini-c search for php ini in path-z load zend extension-d define php ini entryThe following switches change the default behaviour of phpdbg:-v disables quietness-s enabled stepping-e sets execution context-b boring – disables use of colour on the console-I ignore .phpdbginit (default init file)-i override .phpgdbinit location (implies -I)-O set oplog output file-q do not print banner on startup-r jump straight to run-E enable step through eval()Note: passing -rr will cause phpdbg to quit after execution, rather than returning to the console常用功能之前我们介绍过gdb工具。其实phpdbg和gdb功能有些地方非常相似。如,可以设置断点,可以单步执行,等。只是他们调试的语言不一样,gdb侧重于调试c或者c++语言,而phpdbg侧重于调试php语言。下面我们将对phpdbg的一些常用调试功能做下介绍。要调试的代码如下:文件test_phpdbg_inc.php源代码如下:123456<?php function phpdbg_inc_func(){echo "phpdbg_inc_func \n"; } ?>文件test_phpdgb.php的源代码如下:1234567891011121314151617181920212223242526<?phpinclude(dirname(__FILE__)."/test_phpdbg_inc.php"); class demo{ public function __construct(){ echo __METHOD__.":".__LINE__."\n"; } public function func($param){ $param++; echo "method func $param\n"; } public function __destruct(){ echo __METHOD__.":".__LINE__."\n"; } } function func(){ $param = "ali"; $param = $param + "baba"; echo "function func $param\n";}$demo = new demo(); $demo->func(1); func(); phpdbg_inc_func();?>启动phpdbgphpdbg安装成功后,会在安装目录的bin目录下。进入bin目录,直接输入phpdbg即可。如下:12345phpdeg[Welcome to phpdbg, the interactive PHP debugger, v0.4.0]To get help using phpdbg type "help" and press enter[Please report bugs to http://github.com/krakjoe/phpdbg/issues]prompt>要想加载要调试的php脚本,只需要执行exec命令即可。如下:123phpdbg......prompt> exec ./test_phpdbg.php当然我们也可以在启动phpdbg的时候,指定e参数。如下:1phpdbg -e ./test_phpdbg.php查看帮助信息如果你之前使用过其他的调试工具,你会发现phpdbg和他们比较相似。但是,你使用初期,还是会经常需要获取帮助信息。通过help命令我们可以获取帮助信息。123456789......prompt> helpphpdbg is a lightweight, powerful and easy to use debugging platform for PHP5.4+It supports the following commands:Information list list PHP source......设置断点设置断点的命令和gdb一样。都是break,简写形式为b。不过具体的命令参数还是有所差异的。和gdb的断点命令相同之处,它们都可以“按文件名:行号” 或者 行号的方式设置断点。除此之外,phpdbg还提供了一些针对php特有的设置断点的方式。如,根据opline设置断点,根据opcode设置断点等。众所周知,php代码最终是解析成opcode,然后由php内核一条条执行。一条php语句,可能会解析成多条opcode。如果可以按opcode设置断点,我们就可以更精确的跟踪程序执行过程。下面我们来看看phapdbg设置断点的具体示例。按opline设置断点:这里所说的opline,就是以方法入口作为起点,当前代码的行号。如test_phpdgb.php文件中,第18行的代码“$param = $param + “baba”;”的opline就是 2。12345678910111213......prompt> b func#2prompt> rdemo::__construct:5method func 2[Breakpoint #0 resolved at func#2 (opline 0x7f5b230a2e38)][Breakpoint #0 resolved at func#2 (opline 0x7f5b230a2e38)][Breakpoint #0 resolved at func#2 (opline 0x7f5b230a2e38)][Breakpoint #0 in func()#2 at ./test_phpdbg.php:18, hits: 1]00018: $param = $param + "baba"; 00019: echo "function func $param\n";; 00020: }......查看断点和gdb一样,phpdbg也是使用info break命令查看断点。示例如下:123456789101112....prompt> info breakFile Breakpoints:1 /home/hailong.xhl/test_phpdbg.php:10Opline Breakpoints:0 7ff3219e1df0 (function breakpoint)Function opline Breakpoints:0 func opline 2....通过上面的显示,我们可以知道。info break的显示结果中会把断点的类型也给显示出来。#后面的数字是断点号。我们可以根据断点号删除断点。删除断点和gdb命令不一样。phpdbg的删除断点不是delete命令,而是break del 命令。示例如下:12345......prompt> break del 1[Deleted breakpoint #1]prompt>......break del 后面的数字1就是断点号。查看代码phpdbg查看代码的命令也是list。但是和gdb相比,使用的方式更多样一些。显示指定函数的代码:123456789......prompt> l f func 00017: $param = "ali"; 00018: $param = $param + "baba"; 00019: echo "function func $param\n";; 00020: } 00021:prompt>......单步执行phpdbg的单步执行只有一个命令 step。和gdb的step命令差不多。都是一行一行的执行代码。注意,phpdbg是没有next命令的。12345678....prompt> s[Breakpoint #0 resolved at func#2 (opline 0x152ba40)][L19 0x152ba70 ZEND_ADD_STRING C2 @0 ./test_phpdbg.php]00019: echo "function func $param\n";; 00020: } 00021:....继续执行和gdb一样,phpdbg的继续执行命令也是continue,简写形式为c。执行php代码这个是phpdbg的一个特色。可以在调试的过程中使用ev命令执行任意的php代码。如:123456......prompt> ev $var = "val";valprompt> ev var_dump($var);string(3) "val"......可以通过这种方式,在调试过程中动态的修改变量值,查看执行效果。
2023年08月08日
15 阅读
0 评论
0 点赞
2023-08-08
curl_init()单线程和curl_multi_init()多线程的速度比较
curl_init()单线程和curl_multi_init()多线程的速度比较php中curl_init()的作用很大,尤其是在抓取网页内容或文件信息的时候,例如之前文章curl获得header检测GZip压缩的源代码就介绍到curl_init()的强大。curl_init()处理事物是单线程模式,如果需要对事务处理走多线程模式,那么php里提供了一个函数curl_multi_init()给我们,这就是多线程模式处理事务的函数。curl_init()与curl_multi_init()的速度比较curl_multi_init()多线程能提高网页的处理速度吗?今天我通过实验来验证一下这个问题。今天我的测试很简单,那就是要抓取www.webkaka.com网页的内容,要连续抓5次,分别用curl_init()和curl_multi_init()函数来完成,记录两者的耗时,比较得出结论。首先,用curl_init()单线程连续抓5次www.webkaka.com网页的内容。程序代码如下:echo date('Y-m-d H:m:s',time());echo ' ';echo floor(microtime()*1000);echo '';$mtime = explode(' ', microtime());$mtime = $mtime[1].($mtime[0] * 1000);$mtime2 = explode('.', $mtime);$mtime = $mtime2[0];echo $mtime;echo '';$urls = array('http://www.webkaka.com','http://www.webkaka.com','http://www.webkaka.com','http://www.webkaka.com','http://www.webkaka.com');print_r(async_get_url($urls)); // [0] => example1, [1] => example2echo '';echo date('Y-m-d H:m:s',time());echo ' ';echo floor(microtime()*1000);echo '';$mtime_ = explode(' ', microtime());$mtime_ = $mtime_[1].($mtime_[0] * 1000);$mtime2_ = explode('.', $mtime_);$mtime_ = $mtime2_[0];echo $mtime_;echo '';echo $mtime_ - $mtime;function async_get_url($url_array, $wait_usec = 0){if (!is_array($url_array))return false;$wait_usec = intval($wait_usec);$data = array();$handle = array();$running = 0;$mh = curl_multi_init(); // multi curl handler$i = 0;foreach($url_array as $url) {$ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // return don't printcurl_setopt($ch, CURLOPT_TIMEOUT, 30);curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)');curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirectcurl_setopt($ch, CURLOPT_MAXREDIRS, 7);curl_multi_add_handle($mh, $ch); // 把 curl resource 放进 multi curl handler 里$handle[$i++] = $ch;}do {curl_multi_exec($mh, $running);if ($wait_usec > 0)usleep($wait_usec); // 250000 = 0.25 sec} while ($running > 0);foreach($handle as $i => $ch) {$content = curl_multi_getcontent($ch);$data[$i] = (curl_errno($ch) == 0) ? $content : false;}foreach($handle as $ch) {curl_multi_remove_handle($mh, $ch);}curl_multi_close($mh);return $data;}为了避免随机性,我分别测了5次(用CTRL+F5强行刷新的方式),数据如下:curl_init():第一次 第二次第三次 第四次 第五次 平均 耗时(ms) 3724 3615 2540 1957 2794 2926 curl_multi_init():第一次 第二次 第三次 第四次 第五次 平均 耗时(ms) 4275 2912 3691 4198 3891 3793 从测试结果来看,我们发现两种方法的耗时差不了太多,只有700多毫秒。很多人原本以为多线程比单线程耗时会短很多,实际上并不是这样的,从数据来看,多线程反而比单线程耗时更多了一点。不过,对于某些事务来说,用多线程来处理不一定是为了追求速度,这个是需要注意的。关于curl_multi_init()一般来说,想到要用curl_multi_init()时,目的是要同时请求多个url,而不是一个一个依次请求,否则就要curl_init()了。不过,在使用curl_multi的时候,你可能遇到cpu消耗过高、网页假死等现象,可以看看如何解决curl_multi导致网页假死的问题使用curl_multi的步骤总结如下:第一步:调用curl_multi_init第二步:循环调用curl_multi_add_handle这一步需要注意的是,curl_multi_add_handle的第二个参数是由curl_init而来的子handle。第三步:持续调用curl_multi_exec第四步:根据需要循环调用curl_multi_getcontent获取结果第五步:调用curl_multi_remove_handle,并为每个字handle调用curl_close第六步:调用curl_multi_close各函数作用解释:curl_multi_init()初始化一个curl批处理句柄资源。curl_multi_add_handle()向curl批处理会话中添加单独的curl句柄资源。curl_multi_add_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。curl_multi_exec()解析一个curl批处理句柄,curl_multi_exec()函数有两个参数,第一个参数表示一个批处理句柄资源,第二个参数是一个引用值的参数,表示剩余需要处理的单个的curl句柄资源数量。curl_multi_remove_handle()移除curl批处理句柄资源中的某个句柄资源,curl_multi_remove_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。curl_multi_close()关闭一个批处理句柄资源。curl_multi_getcontent()在设置了CURLOPT_RETURNTRANSFER的情况下,返回获取的输出的文本流。curl_multi_info_read()获取当前解析的curl的相关传输信息。实例请看本文里async_get_url()的写法。
2023年08月08日
12 阅读
0 评论
0 点赞
1
...
78
79
80
...
112