rewrite之htaccess规则详解解说

[apache] 2024-04-16 圈点257

摘要:rewrite之htaccess规则详解解说

rewrite规则的指令

        对于Rewrite来说共有九个指令:RewriteBase, RewriteCond, RewriteEngine, RewriteLock, RewriteLog, RewriteLogLevel, RewriteMap, RewriteOptions, 

RewriteRule。通常最常用的是 RewriteEngine, RewriteBase, RewriteCond, RewriteRule 四个指令,下面简单介绍这四个指令。

       [1]RewriteEngine: 就是是否使用 Rewrite 模式的开关, 使用就设置成 on, 否则设置成 off。

       [2]RewriteBase:如果使用目录别名的话就需要设置这个指令,假设一个网站目录使用了别名操作: RewriteBase /ceshi   /123/456 那么当客户端访

问/ceshi/index.html 文件时是相当于访问 /123/456/index.html。

       [3]RewriteCond:指令定义一条规则条件。在一条RewriteRule指令前面可能会有一条或多条RewriteCond指令,只有当自身的模板(pattern)匹配成功且这些条件也满足时规则才被应用于当前URL处理。注意,RewriteCond 指令后面可带 Flag, 现在只要2个可用, 一个是 NC(不区分大小写的意思), 一个是 OR(连接下一个条件)。这里对Rewritecond的正则匹配函数进行简单说明。


第一个: ! 表示否的意思. 比如一个条件: 判断访问此页面的上一页URL是否包含 sex 字符的话可以用这样: RewriteCond %{HTTP_REFERER} !(sex)

第二个: < 就是小于的意思, TestString < CondPattern.

第三个: > 就是大于于的意思, TestString < CondPattern.

第四个: = 相等的意思. <, >, = 三个和通常程序语言使用的 <, >, = 功能类似.

第五个: -d 是否是一个目录. 判断TestString是否不是一个目录可以这样: !-d

第六个: -f 是否是一个文件. 判断TestString是否不是一个文件可以这样: !-f

第七个: -s 是否是一个正常的有大小的文件. 判断TestString是否不是一个正常的有大小的文件可以这样: !-s

第八个: -l 是否是一个快捷方式文件. 判断TestString是否不是一个快捷方式文件可以这样: !-l

第九个: -x 是否是一个文件并且又执行权限. 判断TestString是否不是一个文件并且又执行权限可以这样: !-x

第十个: -F 检查TestString是否是一个合法的文件,而且通过服务器范围内的当前设置的访问控制进行访问。这个检查是通过一个内部subrequest完成的, 因此需要小心使用这

个功能以降低服务器的性能。

第十一个: -U 检查TestString是否是一个合法的URL,而且通过服务器范围内的当前设置的访问控制进行访问。这个检查是通过一个内部subrequest完成的, 因此需要小心使用

这个功能以降低服务器的性能。

        [4]RewriteRule:是一个简单的命令告诉mod_rewrite这个模块如何去重写,关键的地方在于可以在模式和替换中使用正则表达式来匹配相应的字符,正则表达式的广泛

的灵活性能将动态的URL转换成各式各样的符合要求的静态URL。


FLAG_参数

C|chain

C|chain 意思: 字符 'C' 或者 字符串 'chain' 表示出了该行重写规则外还要有其他的重写规则, 相当于通常程序语言的 与符号 '&' , 如果第一条规则条匹配的话进行下一项

条件匹配. 如果第一条或者中间一条匹配不成功. 在其后的都会被跳过.

 

CO|cookie

CO|cookie 意思: 字符 'CO' 或者 字符串 'cookie' 表示当某些特殊的规则被匹配到的时候, 允许设置一个COOKIE, 设置参数包含3个必须字段和2个可选字段.

三个必须的字段是设定COOKIE的名字, 值, 还有这个COOKIE的所属域名, 另外两个可选的字段是COOKIE的生存时间和路径.默认的COOKIE生存时间是浏览器的会话时间. 默认的路

径是 '/', 针对整个网站.

实际的使用例子想下面这样

RewriteEngine On

# RewriteRule 匹配模式 - [CO=COOKIE名称:COOKIE值:COOKIE域名:生存时间:路径] 各个参数用冒号:连接

RewriteRule ^/index.html - [CO=mycookie:myCookieValue:.test.com:1440:/]

#RewriteRule ^/index.html - [CO=mycookie:myCookieValue:.test.com] 或者省略后面的参数.

上面的规则的意思是在请求 index.html 文件的时候设置一个COOKIE值. COOKIE名是 mycookie, 值是:myCookieValue, 生效的域名是 .test.com, 生效时间是分钟计算的. 也就

是生存时间是1天=24小时=1440分钟.

 

E|env

E|env 意思: 字符 'E' 或者 字符串 'env' 表示你可以设置一个环境变量. 注意一下变量在这个规则运行后生效.

看一个简单的例子, 就是apache在记录日志的时候不记录图片的读取记录. 那么下面的规则就有用了.

RewriteRule \.(png|gif|jpg) - [E=image:1]

CustomLog logs/access_log combined env=!image

 

F|forbidden

F|forbidden 意思: 字符 'F' 或者 字符串 'forbidden' 表示禁止访问. Apache服务器会返回403禁止访问状态码给客户端.

下面的规则表示获取或者下载 exe程序文件是被显示禁止访问.

RewriteRule \.exe - [F]

 

G|gone

G|gone 意思: 字符 'G' 或者 字符串 'gone' 表示服务器响应状态码为:410 通常使用该标志的时候 target 目标值设置成 "-" 被请求的资源是有效的.

下面的例子表示旧的资源是有效的. 并且不在乎大小写.

RewriteRule oldproduct - [G,NC]

 

H|handler

H|handler 意思: 字符 'H' 或者 字符串 'handler' 表示强制使用某类型处理程序处理被请求的资源. 比如请求一些不带后缀的文件的时候. 下面的列子表示当请求的URL里没

有带'.'的时候, 强制使用PHP来处理这类的请求.

RewriteRule !\. - [H=application/x-httpd-php]

 

L|last

L|last 意思: 字符 'L' 或者 字符串 'last' 表示当前规则是最后一条规则,停止分析以后规则的重写。该标志的使用频率非常高.

RewriteCond %{REQUEST_URI} !index\.php

RewriteRule ^(.*) index.php?req=$1 [L]

一定要注意的地方, 使用[L]标志的时候, 一定要注意你的匹配条件, 不会非常容易让你的重写规则陷入死循环, 比如你要定义页面所有页面请求都重写到一个 index.php 文件, 

那么一定要注意在匹配条件时确定当请求的脚本不是index.php时才执行重写规则. 不然很明显当前页面请求的是 index.php, 当然 这个请求被重写到 index.php 然后

index.php又被重写到index.php.. 这样反复执行. 页面会报错. 错误日志会记录报告你超出最大的重定向次数.

 

N|next

N|next 意思: 字符 'N' 或者 字符串 'next' 表示重新回到规则顶部重复执行. 一般在极端情况下用这个标志. 相当于一个while循环, 知道匹配失败时返回. 下面的例子表示

把请求地址中的所有A字符替换成B字符.

RewriteRule (.*)A(.*) $1B$2 [N]

 

NC|nocase

NC|nocase 意思: 字符 'NC' 或者 字符串 'nocase' 表示请求的规则部分不区分大小写. 类似正则式里的/xxx/i 模式.

RewriteRule (.*\.(jpg|gif|png))$ http://images.test.com$1 [P,NC]

 

NE|noescape

NE|noescape 意思: 字符 'NE' 或者 字符串 'noescape' 表示不对URL中的特殊字符进行 hexcode 转码.看下面的例子:

RewriteRule ^/share/(.+) /goShare.html#$1 [NE,R]

上面的例子表示所有请求 /share/xxx.xx的请求都会被定向到/goShare.html文件上. 并且后面的部分作为一个#后面的值. 如果不加NE标志的话, #将被转义成 %23 这样就造成 

404 错误了.

 

NS|nosubreq

NS|nosubreq 意思: 字符 'NS' 或者 字符串 'nosubreq' 表示只用于不是内部子请求.比如,在mod_include试图搜索可能的目录默认文件(index.xxx)时, Apache会内部地产生

子请求。对子请求,它不一定有用的,而且如果整个规则集都起作用,它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。根据你的需要遵循以下原则: 如果你使

用了有CGI脚本的URL前缀,以强制它们由CGI脚本处理,而对子请求处理的出错率(或者开销)很高,在这种情况下,可以使用这个标记。

 

P|proxy

P|proxy 意思: 字符 'P' 或者 字符串 'proxy' 标志需要模块 mod_proxy 支持, 类似一个分发器网关的作用.比如网站的所有图片想用单独的一台服务器来运行. 那么先前的代

码里的图片请求的时候, 直接定向到图片服务器去.

RewriteRule (.*)\.(jpg|gif|png) http://images.example.com$1.$2 [P]

使用[P]标志, 意味着使用了[L]标志, 因为使用该标志后马上就重定向到新地址了. 后面的重写规则会被忽略掉.

 

PT|passthrough

PT|passthrough 意思: 字符 'PT' 或者 字符串 'passthrough' 表示替换URL请问部分的地址.看例子

Alias /icons /usr/local/apache/icons

RewriteRule /pics/(.+)\.jpg /icons/$1.gif [PT]

当请求/pics/下的图片文件时, 实际是返回的是 /icons/目录下的同名文件. 需要注意的是一定要设置 [PT] 标志. 否则Alias设置无效.

 

QSA|qsappend

QSA|qsappend 意思: 字符 'QSA' 或者 字符串 'qsappend' 不怎么好表示. 看例子:

RewriteRule /pages/(.+) /page.php?page=$1 [QSA]

如果又标志: [QSA] 那么重写后的URL是: /page.php?page=123&one=two

如果没有[QSA]标志, 那么结果是: /page.php?page=123

此标记强制重写引擎在已有的替换串中追加一个请求串,而不是简单的替换。 如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。

 

R|redirect

R|redirect 意思: 字符 'R' 或者 字符串 'redirect' 表示进行重定向, 状态码在300-399里随机出, 默认是 302 重定向.通常和标志L一起使用. 使用模式: [R[=302]]

 

S|skip

T|type 意思: 字符 'S' 或者 字符串 'skip' 表示跳过执行下面的几个重写规则. 又点类似goto. 看下面的例子, 如果URL请求的文件不存在的话就跳过下面的两行重写规则.

# 请求的文件是否存在

RewriteCond %{REQUEST_FILENAME} !-f

RewriteCond %{REQUEST_FILENAME} !-d

# 不存在的情况

RewriteRule .? - [S=2]

RewriteRule (.*\.gif) images.php?$1

RewriteRule (.*\.html) docs.php?$1

 

T|type

T|type 意思: 字符 'T' 或者 字符串 'type' 表示为apache设置特定请求的响应类型. 也就是常说的 MIME type,比如一个perl脚本. 希望给客户端显示文本源码, 那么可以这

样做:

RewriteRule \.pl$ - [T=text/plain]

或者你的服务器上的文件没有设置扩展名. 那么可以通知重写添加该文件的类型. 方便客户端显示.

RewriteRule IMG - [T=image/jpg]


简单的几个案例

例子1: 所有请求都定向到 index.php 脚本, 注意要排除 index.php 本身. 比如就进入死循环了.

RewriteRule !^index\.php$ index.php [L]

例子2: 当请求不存在的资源时, 统一定义到根目录下的 404.html

RewriteCond %{REQUEST_FILENAME} !-f

RewriteCond %{REQUEST_FILENAME} !-d

RewriteRule ^.*$ /404.html [L]

例子3: 限制访问. 比如来自一些不友好的网站连接过来的请求. 不允许访问. 下例中如果 HTTP_REFERER 中包含 sex 字符, 则不允许访问.

RewriteCond %{HTTP_REFERER} sex

RewriteRule ^.*$ - [F]

例子4: 按照时间显示不同的页面, 比如访问 hello.html 页面时. 如果 在 8:00-19:00 的时候访问. 显示 hello.day.html 其他时间访问显示: hello.night.html

RewriteCond %{TIME_HOUR}%{TIME_MIN} >0700

RewriteCond %{TIME_HOUR}%{TIME_MIN} <1900

RewriteRule ^hello\.html$ hello.day.html

RewriteRule ^hello\.html$ hello.night.html

例子5: 伪静态化, 比如访问 /user20.html 则调用viewUser.php 显示用户ID为20的用户资料

RewriteRule ^user([0-9]*)\.html$ viewUser.php?userid=$1

例子6: 喜欢用二级域名的比较实用了. 比如网站目录下有 user, upload 等几个目录, 可以通过 http://www.test.com/user 这样的模式访问. 但是如果想做成统一用二级域名

模式访问: http://user.test.com , 但是不允许 http://www.test.com/user 这样访问. 那么就像下面这样来限制.

RewriteCond %{REQUEST_URI} ^/user

RewriteRule ^.*$ http://user.test.NET" [L] 


.htaccess文件模板:

<IfModule mod_rewrite.c> 

RewriteEngine On 

#这里编写rewrite规则

</IfModule>


htaccess  

感谢反馈,已提交成功,审核后即会显示