首页
关于
Search
1
给你10个市场数据调研报告的免费下载网站!以后竞品数据就从这里找!
135 阅读
2
php接口优化 使用curl_multi_init批量请求
129 阅读
3
2024年备考系统架构设计师
102 阅读
4
《从菜鸟到大师之路 ElasticSearch 篇》
101 阅读
5
PHP 文件I/O
89 阅读
php
thinkphp
laravel
工具
开源
mysql
数据结构
总结
思维逻辑
令人感动的创富故事
读书笔记
前端
vue
js
css
书籍
开源之旅
架构
消息队列
docker
教程
代码片段
redis
服务器
nginx
linux
科普
java
c
ElasticSearch
测试
php进阶
php基础
登录
Search
标签搜索
php函数
php语法
性能优化
安全
错误和异常处理
问题
vue
Composer
Session
缓存
框架
Swoole
api
并发
异步
正则表达式
php-fpm
mysql 索引
开发规范
协程
dafenqi
累计撰写
785
篇文章
累计收到
4
条评论
首页
栏目
php
thinkphp
laravel
工具
开源
mysql
数据结构
总结
思维逻辑
令人感动的创富故事
读书笔记
前端
vue
js
css
书籍
开源之旅
架构
消息队列
docker
教程
代码片段
副业
redis
服务器
nginx
linux
科普
java
c
ElasticSearch
测试
php进阶
php基础
页面
关于
搜索到
785
篇与
的结果
2023-08-07
一个PHP程序员要掌握哪些知识?
一个PHP程序员要掌握哪些知识?本文不但可以作为一个PHP程序员的参考,其它语言的WEB开发者也可以借鉴1.HTML,CSS,JAVASCRIPT是作为一个WEB开发者的基础知识。HTML要学到什么程序呢?本人觉得至少要能与CSS配合完成手写代码排版,虽然现在的网页排版工具一大堆,但不可能100%完美,作为一个专业人士,手写代码是必须的。如何学习CSS?可能大部份人觉得能做得出漂亮精美的网页就自认为自己的CSS水来不错了,其实,CSS不单是一个定义网页的样式,它还是一个行业的标准,在团队合作的环境里,符合标准就显得很重要了。想把自己的CSS水平达到高手级别,建议大家试下用DIV+CSS排版,会大大增长自己的CSS水平。可参考一下 http://www.37dg.com/index.jsp这个页面的源代码,中间那个表格也是用DIV+CSS拼出来的,不知为什么,作者没有把这个页面的CSS代码放在一个独立的文件,正好适合当初者DIV+CSS排版学习。DIV+CSS必须符合标准,必须在FIREFOX和IE下调试过都正常才是正确的。Javascript博大精深,不要小看它,以前有个老外用纯JS写了个《星际争霸》,很是惊人。估计世界上也没几个人能把javascript学到“精通”这个程序。WEB开发者至少能用JS完成基本的验证,和一些版面控制,比如动态增减表格的行,动态移动或改变某些控件的值等。2. AJAX ---- 有经验的程序员都会知道,AJAX不算什么新技术,根本就是JAVASCRIPT+XMLHTTP。现在的人都学会了忽悠,炒炒冷饭也能成为一种新菜式了。不过,我们不用关于这个概念问题,我们会用就行了。在做一些无刷新提交的时候,掌握AJAX是必要的。从底层的角度来看(注意,是从传输的底层角度,我不想因此引起不必要争论),AJAX其实也是在不断的向服务器获取数据库最新信息,只不过是我们的浏览器没有反映出刷新这个效果罢了。AJAXA最有用的地方就是用于表单验证,比如:要验证一个用户注册时输入的用户名是否被使用,以前是必须用户提交后才能验证,用了AJAX就可以在用户输入完成后马上给出验证信息。在程序员眼中看来就像JAVASCRIPT可以直接访问数据库一样。3.XML----XML是比一个HTML更加严格的标准。理论上说XML迟早会代替HTML,但至少短期内无可能的。XML+样式也能做出和HTML同样复杂的页面。但还没有什么支持XML排版的工具。所以就目前而言,XML最大的作用是作为一个数据库的表格来用。比如说,我之前有个项目,是把购物网站定单信息传输给快递公司,但两间不同的公司用的是不同的数据库,无法直接导出导入数据。幸好有了XML,我把所有的数据生成一个XML文件,传给对方后很方便就能导入XML文件。可见,一个行业的标准是多么的重要。XML就胜在可以适应不同的数据库平台,不同的操作系统。4. 数据库, 现在WEB流行的数据库就oracle,MS SQL server,MYSQL,ACCESS等。除了学会所有的SQL查询语句(包括多表联合查询),至少要掌握存储过程,触发器,索引,视图等。很多新手不注意使用索引,我试验过MYSQL,在一个十万条记录的表,(硬盘为FAT32)在有索引和没有索引的情况下,查询速度差了十几倍。另外,数据库的维护和安全很重要,要懂得如何监视数据库的异常,可以参考一下DBA的教程。5。Linux ----现在大型一点的站点都用了linux作为服务器了,所以学习linux是必要的,linux的在网络方面的功能是远远胜于windows. (不过如果只是当作一个普通PC使用,用linux会烦得你要抓狂). 不用学得很深入,基本的linux控制和配置命令就够用了。虽然有些版本的桌面系统做得越来越强大,linux越来越像windows了,不过,如果你不掌握命令行操作,估计你找工作过不了面试的那一关6。服务器,不管用IIS,APACHE,TOMCAT, 各种配置和设定也是必须的。7。PHP------PHPer当然要会PHP了,不废话了,能用面对对象的方式写程序,能将经常要重用的东西写成类,你就合格了,。8。模板引擎-------在今时今日,如何你还未用过MVC的方式写程序,你就OUT了。phplib,smarty是PHP界最有名的模板引擎。个人推荐smarty,因为PHPlib有点老了,用起smarty的标识,好像觉得更合理。9。ADODB---- 如果说一个项目本来是用SQL SERVER的,只需要改一下就能用到MYSQL数据库,是不是很不可思议,不错,ADODB就能完成此功能。可能有人觉得完全没必要,项目做好不可能再更改数据库,那就因需使用吧。至少我个人很喜欢,PHP+MYQL的情况下,ADODB能完成“事务处理”的功能,以前的低版本MYSQL可做不到这点。PHP+MYSQL的架构下,我用ADODB写数据库读写的类,版面就用smarty, ADODB+SMARTY简直就天下无敌。10。英文-----现在去应聘程序员,稍为高薪的,英文读写必须流利。各位programmer不能在这方面翻跟斗了。
2023年08月07日
14 阅读
0 评论
0 点赞
2023-08-07
学习笔记(PHP函数)
笔记内容:1.函数是一段完成指定任务的已命名代码。函数声明:fuction 函数名(参数1,参数2,参数3,... ... ...){函数体return 返回值}2.函数作用:1.提高代码的重用性(效率);2.提供软件的可维护性;3.提高软件开发效率,软件可靠性提高;4.提高执行速度;3.调用函数:用函数的函数名和参数;其作用:1.调用整个函数,2.代表return后面的值,函数内部执行过程,遇到第一个return时,下面的语句就不再执行,若要返回多个值,可以用数组或对象。4.函数声明帮助文档内容:1).写出函数的作用;2).函数有几个参数,各个参数的类型;3.)函数执行后返回什么样的结果;5.函数内部声明的变量的作用域是局部的,它们在函数之外是不可见的,相应的,除了全局变量外;函数外部定义的变量在函数内部也是不可见的;6.按值传递:在按值方式传递时,PHP会建立变量的拷贝。这时如果在函数内部改变了变元的值,那么所改变的只是拷贝。当函数退出时,拷贝就会被清除,原始值不会被改变。按址传递(参数前面加多个&符号)(只适用于变量的传递):在按址传递变量时,函数内部对变量的改变会影响变量的原始值;这种方式传递的是变量的内存地址,相当于指针; 好处:1)传递大型字符串,数组,对象时,与按值传递相比,开销较少;2) 这种方式可以从函数内部直接向外部返回结果。 缺点:允许修改外部变量,可能对函数外部的程序带来负面影响;7.省略变元:若调用函数时,参数个数少于函数所需参数个数,PHP解释程序时会发出一个警告信息;为确保相应的参数会被设置,我们可以在函数 定义 里设置默认参数值使用默认参数的规则:1)没有默认值的参数必须位于赋予默认值的参数之前;2)只有像字符串或数字这样的常数才能作为默认值,不能使用变量;3)如果主叫方传递了相应的变元,参数默认值会被忽略;8.变元数量不定;若函数变元数量不定,可以用PHP内置函数来确定实际传递了多少个变元处理不定变元的内置函数:1)func_num_args() 返回传递给函数的变元个数2)func_get_arg($arg_num) 返回指定索引位置上的变元3)func_get_args() 返回一个数组,其中包含全部变元9.函数要返回多个值,可以用数组或对象,但应注意,返回的是这个数组,而不是单个元素,如return($n[0],$n[1],$n[2],$n[3],$n[4])是 错 的;10.作用域:在变量名前加上 global,我们就可以访问函数外部定义的变量;用$global[]数组也可以访问脚本里所有的全局变量;11.静态变量:在变量名前加上 static 静态变量在初始化之后,就会在多次函数调用期间保持它的值;12.嵌套函数:只有外层函数被调用了,内层的嵌套函数才可用;13.include() require()用include() 和require()可以把库包含到当前脚本,库文件可以是任意后缀名文件。include()与require()的唯一区别在于如何处理错误,出现错误时,include()会生成一个警告,并且允许脚步继续执行,而require()会产生一个严重错误,并退出脚本require_once() include_once()在脚本执行过程中包含指定文件,并且只包含一次。14.检测函数是否存在的函数:function_exists("函数名")若函数存在,返回值为真,不存在时,返回值为假
2023年08月07日
11 阅读
0 评论
0 点赞
2023-08-07
学习PHP&MYSQL之——字符编码篇
学习PHP&MYSQL之——字符编码篇一、字符编码简介 计算机里,只能用二进制码记录文字、图片、图像、声音等媒体,要想将各式各样的媒体映射为简单的二进制编码(媒体 –> 01),就要将很多01根据多种变化的排列组合来表示这些媒体,这些排列组合的方法就成为了编码,文字、图片、声音都存在各式各样的编码。今天学习一下燕十八PHP公益培训课之——字符编码篇。 1、ASCII最早的编码——ASCII编码,ASCII编码只能表示键盘上(A-Z、a-z、0-9、+-*/&^%)等不超过127个字符。1个字节有8位,可以表示256个字符,要表示ASCII码只需要7位就够了,所有最高位始终是0。0000 00001111 1111 --> 共256种值常用汉字3000多,1个字节不能表示,只能用2个字节表示,可以表示65535个字符,表示汉字够用了。0000 0000 0000 00001111 1111 1111 1111 --> 共65535种值 2、GB2312最早的中文字符集GB2312,GB2312不占用ASCII的0-127,两个字节组合来用,但是这样的组合就少了很多,例如:1xxx xxxx 1xxx xxxx --> [129 - 255] [129 - 255]例如:130 140 97 95 144 233 (分组前)↓ ↓ ↓ ↓[130 140] [97] [95] [144 233] (分组后)↓ ↓ ↓ ↓[汉字] [字母] [字母] [汉字]GB2312只收录了6763个汉字,基本满足了常用汉字的需求,但有些汉字没有收录。 3、GBKGBK编码完全兼容GB2312,GBK还是双字节,理论上第2字节不再局限于129-255,如果第1字节大于128,则带下一个字节组成一个汉字,如果第1个小于128,就直接转ASCII。例如:1xxx xxxx xxxx xxxx --> 129 - 255例如:133 22 63 199 22 (分组前)↓ ↓ ↓[133 22] [63] [199 22] (分组后)↓ ↓ ↓[汉字] [字母] [汉字]实际上,GBK的编码方式,有单字节和双字节编码组成,00-7F范围内只占一位,和ASCII保持一致,此范围内严格上说有96个字符和32个控制符号。之后的双字节中,前一字节是双字节的第一位。总体上说第一字节的范围是81-FE(也就是不含80和FF),第二字节的一部分领域在40-7E,其他领域在80-FE。收录汉字21003个、符号883个、并提供1894个造字码位。 4、Unicode和UTF-8Unicode是一个世界通用的码表,它占4个字节,包含232,共40多亿字符,但常用的集中在前65535个标号里,2个字节就够用了。Unicode只负责分配编号,而且都用4个字节来分配编号,而真正的实现方式成为Unicode转换格式(Unicode Transformation Format,简称为UTF)例如,如果一个仅包含基本7位ASCII字符的Unicode文件,如果每个字符都使用2字节的原Unicode编码传输,其第一字节的8位始终为0,这造成了较大的浪费。对于这种情况,可以使用UTF-8编码,这是一种变长编码。它根据一定的算法减小浪费,具体实现如下:Unicode根据一定算法转为UTF-8例如:0000 0000 0000 0000 0000 0000 0000 0041 –> A (Unicode)↓0000 0041 –> A (UTF-8)Unicode与UTF-8的关系就像原文件与压缩文件的关系,具体如下:UCS-4编码UTF-8字节流U+00000000 - U+0000007F 0xxxxxxxU+00000080 - U+000007FF 110xxxxx 10xxxxxxU+00000800 - U+0000FFFF 1110xxxx 10xxxxxx 10xxxxxxU+00010000 - U+001FFFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxxU+00200000 - U+03FFFFFF 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxxU+00040000 - U+7FFFFFFF 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxxUTF-8编码是根据第一字节的高位来决定一个字符占几个字节的,基本规律是:第一字节高位占用字节数0 1个字节11 2个字节111 3个字节1111 4个字节11111 5个字节111111 6个字节二、乱码的形成乱码产生的原因:解码时与实际编码不一致(可修复)。传输过程中,编码不一致,导致字节丢失(不可修复)。1、解码时与实际编码不一致情况复制代码<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> !-- --》 乱码测试 测试 复制代码2、传输过程中,编码不一致,导致字节丢失(这种情况将在下一篇见到)接《学习PHP&MYSQL之——字符编码篇(一)》,这一篇主要学习MySQL乱码形成和字符集设置。MySQL的字符集转换过程如下图:image这个过程至少存在3个字符集的设置,客户端字符集、连接器字符集、服务器端字符集。其中连接器起到至关重要的作用,具体流程为,客户端向服务器端存数据时,客户端将自身字符集编码的数据发送到连接器,连接器选择一种字符集进行转换,然后再将转换好的字符集转换为服务端字符集,再发送给服务器端存储。当客户端向服务器端取数据时,以上过程相逆。下图为一种场景:image客户端为GBK编码,连接器为UTF8编码,服务器端也为UTF8编码。当客户端将GBK编码的数据发送到连接器时,连接器将GBK编码的数据转换为UTF8编码,暂存在连接器,之后连接器再将暂存的数据不进行任何转换发送到服务端存入数据库。客户端取数据时,将上述过程相逆。这样场景可能存在一定的问题,如果数据库中本来就存储了只有UTF8编码下才有而GBK编码下没有的字符,在客户端取数据时,由连接器UTF8编码的字符再转换为GBK时就可能丢失字节。(如果场景只针对中国,可能不会存在什么问题。)下图是另一种场景image客户端还是GBK编码,连接器也是GBK编码,服务端还是UTF8编码。当客户端将GBK编码的数据发送到连接器是,连接器不进行转换,暂存在连接器,连接器再将暂存的GBK编码的数据转为UTF8编码发送到服务器。取数据时与上述过程相逆。这个场景也会出现丢失字节的现象。根据以上场景分析,若想在MySQL不出现乱码,需要指定客户端的编码,让连接器不理解错误,这样就不会存入错误的数据,取数据的时候,要告诉连接器,返回结果的字符集,所以要设置3个字符集分别是:客户端字符集、返回结果字符集、连接器字符集。看以下场景复制代码设置客户端字符集为GBKset character_set_client=gbk;设置连接器字符集为GBKset character_set_connection=latin1;设置返回结果字符集为GBKset character_set_results=gbk;复制代码当客户端为GBK,连接器为latin1时,客户端字符集的容量比连接器的字符集的容量大,比如客户端包含中文汉字编码,但连接器却没有,当客户端有汉字数据发送到连接器时,连接器转为latin1时将丢失字节,就会产生乱码,而且这种乱码是不可修复的字节码丢失(上一篇 乱码的第2种情况)。总结上面,Server字符集 >= Connection字符集 >= Client字符集。set character_set_client=gbk;set character_set_connection=gbk;set character_set_results=gbk;以上三条都设置为gbk,可以简写为以下形式set namesgbk; ;总结上一篇和本文,要想php+mysql开发中不出现乱码需注意以下几点:html、php的meta中的charset信息的编码html、php等文件保存的编码格式mysql数据库中client、connection、resultsmysql数据库表字段编码以上四点编码都统一其它相关文章 《UTF-8 BOM问题》 、《 PHP正确解析UTF-8字符串 》
2023年08月07日
16 阅读
0 评论
0 点赞
2023-08-07
用fsockopen发邮件
用fsockopen发邮件/* |---------------------------------------------------------------------------- | 发送邮件 例: $conf = array( 'to'=>'1019822077@qq.com', 'from'=>'woai_php@sina.com', 'subject'=>'邮件标题', 'content'=>'邮件内容', 'user'=>'woai_php', 'pwd'=>'这里是密码', 'smtp'=>'smtp.sina.com', ); sendMail($conf); |---------------------------------------------------------------------------- | */ function sendMail($conf){ $fp = @fsockopen($conf['smtp'],25, $errno, $errstr,30); fputs($fp, "HELO hi"."rn");//和服务器打招呼,可省略 fputs($fp, "AUTH LOGIN ".base64_encode($conf['user'])."rn"); fputs($fp, base64_encode($conf['pwd'])."rn"); fputs($fp,"MAIL FROM:"."<".$conf['from'].">"."rn"); fputs($fp,"RCPT TO:"."<".$conf['to'].">"."rn"); fputs($fp,"DATA "."rn"); fgets($fp, 512); $header = ""; $header .= "MIME-Version:1.0rn"; $header .= "Content-Type:text/htmlrn"; $header .= "To: ".$conf['to']."rn"; $header .= "From: ".$conf['from']."<".$conf['from'].">rn"; $header .= "Subject: ".$conf['subject']."rn"; $header .= "Date: ".date("r")."rn"; fputs($fp, $header."rn".$conf['content']."rn.rn"); fputs($fp,"QUIT "."rn"); fgets($fp, 512); fclose($fp); }
2023年08月07日
23 阅读
0 评论
0 点赞
2023-08-07
用 PHP 读取和编写 XML DOM
用 PHP 读取和编写 XML DOM用 PHP 读取和编写可扩展标记语言(XML)看起来可能有点恐怖。实际上,XML 和它的所有相关技术可能是恐怖的,但是用 PHP 读取和编写 XML 不一定是项恐怖的任务。首先,需要学习一点关于 XML 的知识 —— 它是什么,用它做什么。然后,需要学习如何用 PHP 读取和编写 XML,而有许多种方式可以做这件事。本文提供了 XML 的简短入门,然后解释如何用 PHP 读取和编写 XML。什么是 XML?XML 是一种数据存储格式。它没有定义保存什么数据,也没有定义数据的格式。XML 只是定义了标记和这些标记的属性。格式良好的 XML 标记看起来像这样:Jack Herrington这个 标记包含一些文本:Jack Herrington。不包含文本的 XML 标记看起来像这样:用 XML 对某件事进行编写的方式不止一种。例如,这个标记形成的输出与前一个标记相同:也可以向 XML 标记添加属性。例如,这个 标记包含 first 和 last 属性:也可以用 XML 对特殊字符进行编码。例如,& 符号可以像这样编码:&包含标记和属性的 XML 文件如果像示例一样格式化,就是格式良好的,这意味着标记是对称的,字符的编码正确。清单 1 是一份格式良好的 XML 的示例。清单 1. XML 图书列表示例 Jack Herrington PHP Hacks O'Reilly Jack Herrington Podcasting Hacks O'Reilly 清单 1 中的 XML 包含一个图书列表。父标记 包含一组 标记,每个 标记又包含 、 和 标记。当 XML 文档的标记结构和内容得到外部模式文件的验证后,XML 文档就是正确的。模式文件可以用不同的格式指定。对于本文来说,所需要的只是格式良好的 XML。如果觉得 XML 看起来很像超文本标记语言(HTML),那么就对了。XML 和 HTML 都是基于标记的语言,它们有许多相似之处。但是,要着重指出的是:虽然 XML 文档可能是格式良好的 HTML,但不是所有的 HTML 文档都是格式良好的 XML。换行标记(br)是 XML 和 HTML 之间区别的一个好例子。这个换行标记是格式良好的 HTML,但不是格式良好的 XML:This is a paragraph With a line break这个换行标记是格式良好的 XML 和 HTML:This is a paragraph With a line break如果要把 HTML 编写成同样是格式良好的 XML,请遵循 W3C 委员会的可扩展超文本标记语言(XHTML)标准(参见 参考资料)。所有现代的浏览器都能呈现 XHTML。而且,还可以用 XML 工具读取 XHTML 并找出文档中的数据,这比解析 HTML 容易得多。回页首使用 DOM 库读取 XML读取格式良好的 XML 文件最容易的方式是使用编译成某些 PHP 安装的文档对象模型 (DOM)库。DOM 库把整个 XML 文档读入内存,并用节点树表示它,如图 1 所示。图 1. 图书 XML 的 XML DOM 树图书 XML 的 XML DOM 树树顶部的 books 节点有两个 book 子标记。在每本书中,有 author、publisher 和 title 几个节点。author、publisher 和title 节点分别有包含文本的文本子节点。读取图书 XML 文件并用 DOM 显示内容的代码如清单 2 所示。清单 2. 用 DOM 读取图书 XML<?php $doc = new DOMDocument(); $doc->load( 'books.xml' );$books = $doc->getElementsByTagName( "book" ); foreach( $books as $book ) { $authors = $book->getElementsByTagName( "author" ); $author = $authors->item(0)->nodeValue;$publishers = $book->getElementsByTagName( "publisher" ); $publisher = $publishers->item(0)->nodeValue;$titles = $book->getElementsByTagName( "title" ); $title = $titles->item(0)->nodeValue;echo "$title - $author - $publisher\n"; } ?>脚本首先创建一个 new DOMdocument 对象,用 load 方法把图书 XML 装入这个对象。之后,脚本用 getElementsByName 方法得到指定名称下的所有元素的列表。在 book 节点的循环中,脚本用 getElementsByName 方法获得 author、publisher 和 title 标记的 nodeValue。nodeValue是节点中的文本。脚本然后显示这些值。可以在命令行上像这样运行 PHP 脚本:% php e1.phpPHP Hacks - Jack Herrington - O'ReillyPodcasting Hacks - Jack Herrington - O'Reilly%可以看到,每个图书块输出一行。这是一个良好的开始。但是,如果不能访问 XML DOM 库该怎么办?回页首用 SAX 解析器读取 XML读取 XML 的另一种方法是使用 XML Simple API(SAX)解析器。PHP 的大多数安装都包含 SAX 解析器。SAX 解析器运行在回调模型上。每次打开或关闭一个标记时,或者每次解析器看到文本时,就用节点或文本的信息回调用户定义的函数。SAX 解析器的优点是,它是真正轻量级的。解析器不会在内存中长期保持内容,所以可以用于非常巨大的文件。缺点是编写 SAX 解析器回调是件非常麻烦的事。清单 3 显示了使用 SAX 读取图书 XML 文件并显示内容的代码。清单 3. 用 SAX 解析器读取图书 XML <?php $g_books = array(); $g_elem = null;function startElement( $parser, $name, $attrs ) { global $g_books, $g_elem; if ( $name == 'BOOK' ) $g_books []= array(); $g_elem = $name; }function endElement( $parser, $name ) { global $g_elem; $g_elem = null; }function textData( $parser, $text ) { global $g_books, $g_elem; if ( $g_elem == 'AUTHOR' || $g_elem == 'PUBLISHER' || $g_elem == 'TITLE' ) { $g_books[ count( $g_books ) - 1 ][ $g_elem ] = $text; } }$parser = xml_parser_create();xml_set_element_handler( $parser, "startElement", "endElement" ); xml_set_character_data_handler( $parser, "textData" );$f = fopen( 'books.xml', 'r' );while( $data = fread( $f, 4096 ) ) { xml_parse( $parser, $data ); }xml_parser_free( $parser );foreach( $g_books as $book ) { echo $book['TITLE']." - ".$book['AUTHOR']." - "; echo $book['PUBLISHER']."\n"; } ?>脚本首先设置 g_books 数组,它在内存中容纳所有图书和图书信息,g_elem 变量保存脚本目前正在处理的标记的名称。然后脚本定义回调函数。在这个示例中,回调函数是 startElement、endElement 和 textData。在打开和关闭标记的时候,分别调用startElement 和 endElement 函数。在开始和结束标记之间的文本上面,调用 textData。在这个示例中,startElement 标记查找 book 标记,在 book 数组中开始一个新元素。然后,textData 函数查看当前元素,看它是不是 publisher、title 或 author 标记。如果是,函数就把当前文本放入当前图书。为了让解析继续,脚本用 xml_parser_create 函数创建解析器。然后,设置回调句柄。之后,脚本读取文件并把文件的大块内容发送到解析器。在文件读取之后,xml_parser_free 函数删除解析器。脚本的末尾输出 g_books 数组的内容。可以看到,这比编写 DOM 的同样功能要困难得多。如果没有 DOM 库也没有 SAX 库该怎么办?还有替代方案么?回页首用正则表达式解析 XML可以肯定,即使提到这个方法,有些工程师也会批评我,但是确实可以用正则表达式解析 XML。清单 4 显示了使用 preg_ 函数读取图书文件的示例。清单 4. 用正则表达式读取 XML<?php $xml = ""; $f = fopen( 'books.xml', 'r' ); while( $data = fread( $f, 4096 ) ) { $xml .= $data; } fclose( $f );preg_match_all( "/\<book\>(.*?)\</book\>/s", $xml, $bookblocks );foreach( $bookblocks[1] as $block ) { preg_match_all( "/\<author\>(.*?)\</author\>/", $block, $author ); preg_match_all( "/\<title\>(.*?)\</title\>/", $block, $title ); preg_match_all( "/\<publisher\>(.*?)\</publisher\>/", $block, $publisher ); echo( $title[1][0]." - ".$author1." - ". $publisher1."\n" ); } ?>请注意这个代码有多短。开始时,它把文件读进一个大的字符串。然后用一个 regex 函数读取每个图书项目。最后用 foreach 循环,在每个图书块间循环,并提取出 author、title 和 publisher。那么,缺陷在哪呢?使用正则表达式代码读取 XML 的问题是,它并没先进行检查,确保 XML 的格式良好。这意味着在读取之前,无法知道 XML 是否格式良好。而且,有些格式正确的 XML 可能与正则表达式不匹配,所以日后必须修改它们。我从不建议使用正则表达式读取 XML,但是有时它是兼容性最好的方式,因为正则表达式函数总是可用的。不要用正则表达式读取直接来自用户的 XML,因为无法控制这类 XML 的格式或结构。应当一直用 DOM 库或 SAX 解析器读取来自用户的 XML。回页首用 DOM 编写 XML读取 XML 只是公式的一部分。该怎样编写 XML 呢?编写 XML 最好的方式就是用 DOM。清单 5 显示了 DOM 构建图书 XML 文件的方式。清单 5. 用 DOM 编写图书 XML<?php $books = array(); $books [] = array( 'title' => 'PHP Hacks', 'author' => 'Jack Herrington', 'publisher' => "O'Reilly" ); $books [] = array( 'title' => 'Podcasting Hacks', 'author' => 'Jack Herrington', 'publisher' => "O'Reilly" );$doc = new DOMDocument(); $doc->formatOutput = true;$r = $doc->createElement( "books" ); $doc->appendChild( $r );foreach( $books as $book ) { $b = $doc->createElement( "book" );$author = $doc->createElement( "author" ); $author->appendChild( $doc->createTextNode( $book['author'] ) ); $b->appendChild( $author );$title = $doc->createElement( "title" ); $title->appendChild( $doc->createTextNode( $book['title'] ) ); $b->appendChild( $title );$publisher = $doc->createElement( "publisher" ); $publisher->appendChild( $doc->createTextNode( $book['publisher'] ) ); $b->appendChild( $publisher );$r->appendChild( $b ); }echo $doc->saveXML(); ?>在脚本的顶部,用一些示例图书装入了 books 数组。这个数据可以来自用户也可以来自数据库。示例图书装入之后,脚本创建一个 new DOMDocument,并把根节点 books 添加到它。然后脚本为每本书的 author、title 和 publisher 创建节点,并为每个节点添加文本节点。每个 book 节点的最后一步是重新把它添加到根节点 books。脚本的末尾用 saveXML 方法把 XML 输出到控制台。(也可以用 save 方法创建一个 XML 文件。)脚本的输出如清单 6 所示。清单 6. DOM 构建脚本的输出% php e4.php <?xml version="1.0"?> Jack Herrington PHP Hacks O'Reilly Jack Herrington Podcasting Hacks O'Reilly %使用 DOM 的真正价值在于它创建的 XML 总是格式正确的。但是如果不能用 DOM 创建 XML 时该怎么办?回页首用 PHP 编写 XML如果 DOM 不可用,可以用 PHP 的文本模板编写 XML。清单 7 显示了 PHP 如何构建图书 XML 文件。清单 7. 用 PHP 编写图书 XML<?php $books = array(); $books [] = array( 'title' => 'PHP Hacks', 'author' => 'Jack Herrington', 'publisher' => "O'Reilly" ); $books [] = array( 'title' => 'Podcasting Hacks', 'author' => 'Jack Herrington', 'publisher' => "O'Reilly" ); ?> <?phpforeach( $books as $book ) { ?> <?php echo( $book['title'] ); ?> <?php echo( $book['author'] ); ?> <?php echo( $book['publisher'] ); ?> <?php } ?> 脚本的顶部与 DOM 脚本类似。脚本的底部打开 books 标记,然后在每个图书中迭代,创建 book 标记和所有的内部title、author 和 publisher 标记。这种方法的问题是对实体进行编码。为了确保实体编码正确,必须在每个项目上调用 htmlentities 函数,如清单 8 所示。清单 8. 使用 htmlentities 函数对实体编码 <?phpforeach( $books as $book ) { $title = htmlentities( $book['title'], ENT_QUOTES ); $author = htmlentities( $book['author'], ENT_QUOTES ); $publisher = htmlentities( $book['publisher'], ENT_QUOTES ); ?> <?php echo( $title ); ?> <?php echo( $author ); ?> <?php echo( $publisher ); ?> <?php } ?> 这就是用基本的 PHP 编写 XML 的烦人之处。您以为自己创建了完美的 XML,但是在试图使用数据的时候,马上就会发现某些元素的编码不正确。回页首结束语XML 周围总有许多夸大之处和混淆之处。但是,并不像您想像的那么难 —— 特别是在 PHP 这样优秀的语言中。在理解并正确地实现了 XML 之后,就会发现有许多强大的工具可以使用。XPath 和 XSLT 就是这样两个值得研究的工具。参考资料学习您可以参阅本文在 developerWorks 全球站点上的 英文原文。在 XHTML 1.0 The Extensible HyperText Markup Language 上学习 XHTML 的标准。找到 standards for XML。了解 XML Path (XPath) language。了解 XSL Transformations,这是用于转换 XML 的语言。请阅读用来定义 XML 文档结构的标准 XML Schema。在 developerWorks 的 XML 专区 找到面向 XML 开发人员的更多资源。请访问 developerWorks 的 开放源码专区 获得全面的 how-to 信息、工具和项目更新,帮助您用开放源码技术开发并把它们用于 IBM 产品。获得产品和技术请访问 PHP.net,了解关于 PHP 的最新新闻、找到下载,并向其他用户学习。了解 Expat XML Parser,这个解析器用来向 PHP 提供 SAX 解析器功能。利用 IBM 试用软件 改造您的下一个开放源码开发项目,可以下载也可以通过 DVD 得到。讨论通过参与 developerWorks blogs 加入 developerWorks 社区。关于作者Jack D. Herrington 是有 20 多年经验的高级软件工程师。他是三本书的作者:Code Generation in Action、Podcasting Hacks 和即将发表的 PHP Hacks。他还撰写了 30 多篇文章。
2023年08月07日
14 阅读
0 评论
0 点赞
1
...
136
137
138
...
157