從此不再懼怕URI編碼:JavaScript及C# URI編碼詳解

混亂的URI編碼
   JavaScript中編碼有三種方法:escape、encodeURI、encodeURIComponent
   C#中編碼主要方法:HttpUtility.UrlEncode、Server.UrlEncode、Uri.EscapeUriString、Uri.EscapeDataString
   JavaScript中的還好,隻提供瞭三個,C#中主要用的就有這麼多,還沒有列出其他編碼(HTML),一多就弄不明白,弄不明白就心生恐懼,心生恐懼就變得苦逼,本文就向大傢詳細解釋在JavaScript及C#中如何對URI進行編碼的方法(註:本文不涉及到其他編碼)。
 escape:不推薦使用
   原因:eacape是BOM中的方法,隻能對ASCII符號正確編碼,而encodeURI、encodeURIComponent可以對所有的Unicode符號編碼。ECMAScript v3 反對使用該方法,應用使用decodeURI() 和decodeURIComponent() 替代它。
   escape不編碼字符有69個:*,+,-,.,/,@,_,0-9,a-z,A-Z
 encodeURI:用於對網址編碼(不包含參數)
   encodeURI不編碼字符有82個:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
   encodeURI就是為這個而設計的。encodeURI不對URI中的特殊字符進行編碼,如冒號(:)、斜杠(/)。下面看個示例:
 encodeURI("/a file with spaces.html")
 // outputs /a%20file%20with%20spaces.html
 
   可以看到僅僅把空格替換成瞭20%,所以此方法可用於對網址進行編碼。
   由於encodeURI不對冒號(:)、斜杠(/)進行編碼,所以如果參數(如把網址作為參數)中包含冒號(:)、斜杠(/),就會解析出錯,所以此方法不能對參數進行編碼。
 encodeURIComponent:用於對網址參數進行編碼
   encodeURIComponent不編碼字符有71個:!,',(,),*,-,.,_,~,0-9,a-z,A-Z
   可以看到此方法對:/都進行瞭編碼,所以不能用它來對網址進行編碼。由於此方法對中文,空格,井號(#),斜線(/),冒號(:)都進行瞭編碼,所以適合對URI中的參數進行編碼。看下面的示例:
 var param="博客園";
 var url="/?key="+encodeURIComponent(param)+"&page=1";
 console.log(url);//outputs /?key=%E5%8D%9A%E5%AE%A2%E5%9B%AD&page=1
 
   可以看到,這正是我們想要的結果(這裡隻對需要編碼的參數(page=1不需要編碼)進行瞭編碼)。
 Server.UrlEncode && HttpUtility.UrlEncode:不推薦
   把這兩個放到一起說是因為這兩個方法在絕大多數情況下是一樣的。它們的區別是HttpUtility.UrlEncode默認使用UTF8格式編碼,而Server.UrlEncode是使用系統預設格式編碼,Server.UrlEncode使用系統預設編碼做為參數調用HttpUtility.UrlEncode編碼,所以如果系統全局都用UTF8格式編碼,這兩個方法就是一樣的。
   這兩個方法是怎麼編碼的呢,我們來看個示例:
 string url1 = "/a file with spaces.html?a=1&b=博客園#abc";
 Response.Write(HttpUtility.UrlEncode(url1) );
 
//output
 http%3a%2f%2fwww.aiwalls.com%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc
 
   由上面的例子我們可以看出,HttpUtility.UrlEncode對冒號(:)和斜杠(/)進行瞭編碼,所以不能用來對網址進行編碼。
   那麼能不能對參數進行編碼呢,答案也是否定的。因為在參數中空格應該被編碼為%20而不是被HttpUtility.UrlEncode編碼為加號(+),所以不推薦用這兩個方法對URI進行編碼。
 Uri.EscapeUriString:用於對網址編碼(不包含參數)
   我們還是用例子說話:
 string url1 = "/a file with spaces.html?a=1&b=博客園#abc";
 Response.Write( Uri.EscapeUriString(url1));
 //outputs:
 /a%20file%20with%20spaces.html?a=1&b=%E5%8D%9A%E5%AE%A2%E5%9B%AD#abc
 
   可以看出,Uri.EscapeUriString對空格進行瞭編碼,也對中文進行瞭編碼,但對冒號(:)、斜杠(/)和井號(#)未編碼,所以此方法可以用於網址進行編碼,但不能對參數進行編碼,作用類似JavaScript中的encodeURI方法。
 Uri.EscapeDataString:用於對網址參數進行編碼
   仍然用例子說話:
 string url1 = "/a file with spaces.html?a=1&b=博客園#abc";
 Response.Write(Uri.EscapeDataString(url1));
 //outputs:
 http%3A%2F%2Fwww.aiwalls.com%2Fa%20file%20with%20spaces.html%3Fa%3D1%26b%3D%E5%8D%9A%E5%AE%A2%E5%9B%AD%23abc
 
   可以看出,Uri.EscapeDataString對冒號(:)、斜杠(/)、空格、中文、井號(#)都進行瞭編碼,所以此方法不可以用於網址進行編碼,但可以用於對參數進行編碼,作用類似JavaScript中的encodeURIComponent方法。
 小結
   在JavaScript中推薦的做法是用encodeURI對URI的網址部分編碼,用encodeURIComponent對URI中傳遞的參數進行編碼。
   在C#中推薦的做法是用Uri.EscapeUriString對URI的網址部分編碼,用Uri.EscapeDataString對URI中傳遞的參數進行編碼。
   解碼部分就不說瞭,與編碼方法相對應。
 
摘自 土豆

發佈留言