[SQL與PHP] 字串處理及常規表示式



[SQL與PHP] 字串處理及常規表示式

來源J2h論壇‧程式設計討論
        Php教學文件
        2005-08-04 Thursday by ben
        參、字串處理及常規表示式(regular expression)
       
        一、字串處理
       
        trim();:去頭尾空白。
        ltrim();:去頭部空白。
        chop();:去尾部空白。
        nl2br();將”\n”換行改成<br>。
        print();同作用同echo,但print是函式,傳回布林值。
        printf();格式化字串,傳回整數。
        sprintf();格式化字串。
        轉換規格%[顯示寬度][-][][.小數位數]型別:有-代表向左靠齊,沒-代表向右。
        %b:將變數解釋為整數,並以二進位顯示。
        %c:將變數解釋為整數,並以字元顯示。
        %d:將變數解釋為整數,並以十進位顯示。
        %f:將變數解釋為浮點數,並以浮點數顯示。
        %o:將變數解釋為整數,並以八進位顯示。
        %s:將變數解釋為字串,並以字串顯示。
        %x:將變數解釋為整數,並以十六進位顯示,用a-f。
        %X:將變數解釋為整數,並以十六進位顯示,用A-F。
        AddSlashes();若有反斜時,加上Slash,讓輸入字串若含特殊字元時,加上逸出字元\,以免存入資料庫時衝碼。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
        StripSlashes();若有反斜時,去掉Slash,使資料庫取出資料還原。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
        strtoupper();轉大寫。
        strtolower();轉小寫。
        ucfirst();字串首轉大寫。
        ucwords();字串中每個Word的字首轉大寫。
        strtok(字串,”分隔字元”);:擷取字串的前面到分字元為止。
        substr(字串,開始字元,長度);:擷取子字串,第一字元算0;開始字元為負,為字串尾減該數,即字尾算1倒數該數之字元。長度省略則取到字尾;長度為負則取到字尾倒數該數之字元。
        strcmp(字串一,字串二);:比較兩字串,相等為0,正為字串一ASC碼大,負數為字串二ASC碼大。
        strcasecmp(字串一,字串二);:同上,但不分大小寫。
        strlen();:字串長度。
        strstr(字串,欲找之子字串);:找到傳回子字串「第一次」出現以後之剩餘字串,找不到傳回「假」。
        strchr(字串,欲找之子字串);:同上。
        stristr(字串,欲找之子字串);:同上,但不分大小寫。
        strrchr(字串,欲找之子字串);:找到傳回子字串「最後一次」出現以後之剩餘字串,找不到傳回「假」。
        strpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回子字串「第一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時,從字串首開始找。但是「假」傳回值是0,字首位置傳回值也是0,會混淆。可以用if(傳回值===fasle)測,如果成立傳回值代表「假」,如果不成立傳回值代表位置0。
        strrpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回「子字串字首字元」「最後一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時,從字串首開始找。
        str_replace(蒐尋字串,代換字串,字串堆);:在字串堆中找到「蒐尋字串」並用「代換字串」換掉它們。
        substr_replace(字串堆,代換字串,起點,長度);:在字串堆指定的起點及長度,用代換字串換掉它們。起點為0或正,由字串堆頭起算;起點為負,由字串堆尾起算。長度未指定,則換到字串堆尾;長度為0,則插入原字串;長度為正,則取代幾個字串數;長度為負,則自尾端開如取代,停於長度。
        二、正規表示式(regular expression)
       
        PHP支援兩種正規表示式,POSIX和Perl。POSIX內建,Perl語法須將PCRE(Perl-compatible regular expression)程式庫編譯進來。正規表示式比字串慢,儘量用字串。
       
        ():括住子表示式。
        []:括住字元。
        {}:括住重覆次數說明。
        .除\
        以外的單一字元。如.at相符於cat,sat,mat。
        [a-z]、[^a-z]:a到z、非a-z。
        [aeiou]
        [a-zA-Z]
        字元類別:
        [[:alpha:]]:字母。
        [[:alnum:]]:字母及數字。
        [[:lower:]]:小寫字母。
        [[:upper:]]:大寫字母。
        [[:digit:]]:數字字元。
        [[:xdigit:]]:16進位數字字元。
        [[:punct:]]:標點。
        [[:blank:]]:跳格及空白。
        [[:space:]]:空白。
        [[:cntrl:]]:控制字元。
        [[:print:]]:所有可視字元。
        [[:graph:]]:除空白字元外所有可視字元。
        []*:表示該樣式會出現0或0次以上。
        []+:表示該樣式會出現1或1次以上。如[[:alpha:]]+表示至少會有一個英文字母。
        (very )*large:相符於large、very large、very very large。
        {3}:重複三次。
        {2,4}:重複二到四次。
        {2,}:重複兩次以上。
        ^(在表示式外),表示式須出現在被蒐尋字串首才算相符。如^bob。
        $,表示式須出現在被蒐尋字串尾才算相符。如com$。
        ^[a-z]$,字串頭尾之間,出現a-z任一字元就算相符。
        (選項一)|(選項二)|(選項三):多選一都符合
        特殊字元,在正規表示式中須以\特殊字元取代。
        中括號外
       
        \:跳脫字元。
        ^:比對字串頭。
        $:比對字串尾。
        .:換行之外的任意字元。
        |:多重選擇起點(讀成OR)。
        (:子樣式起點。
        ):子樣式終點。
        *:重複0次以上。
        +:重複1次以上。
        {:重複次數 最小/最大 量化值起點。
        }:重複次數 最小/最大 量化值終點。
        中括號外
       
        \:跳脫字元。
        ^:否定。
        -:表示字元範圍。
        ereg(正規表示式,被蒐尋字串,陣列名);:在被蒐尋字串中找符合於正規表示式的子字串,找到就放進陣列,成為一個元素。傳回真假(1,0)。陣列名可省略。
        eregi(正規表示式,被蒐尋字串,陣列名);:同ereg,但不分大小寫。
        ereg_replace(正規表示式,取代字串,被蒐尋字串);:在被蒐尋字串中找到表示式,用取代字串換掉。
        eregi_replace(正規表示式,取代字串,被蒐尋字串);:同ereg_replace,但不分大小寫。
        split(正規表示式表述之分隔字串,被切割字串,傳回元素上限);:用分隔字串,將被切割字串,切成一段段,成為陣列中一個個元素。傳回陣列。
        參、字串處理及常規表示式(regular expression)
       
        一、字串處理
       
        trim();:去頭尾空白。
        ltrim();:去頭部空白。
        chop();:去尾部空白。
        nl2br();將”\n”換行改成<br>。
        print();同作用同echo,但print是函式,傳回布林值。
        printf();格式化字串,傳回整數。
        sprintf();格式化字串。
        轉換規格%[顯示寬度][-][][.小數位數]型別:有-代表向左靠齊,沒-代表向右。
        %b:將變數解釋為整數,並以二進位顯示。
        %c:將變數解釋為整數,並以字元顯示。
        %d:將變數解釋為整數,並以十進位顯示。
        %f:將變數解釋為浮點數,並以浮點數顯示。
        %o:將變數解釋為整數,並以八進位顯示。
        %s:將變數解釋為字串,並以字串顯示。
        %x:將變數解釋為整數,並以十六進位顯示,用a-f。
        %X:將變數解釋為整數,並以十六進位顯示,用A-F。
        AddSlashes();若有反斜時,加上Slash,讓輸入字串若含特殊字元時,加上逸出字元\,以免存入資料庫時衝碼。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
        StripSlashes();若有反斜時,去掉Slash,使資料庫取出資料還原。Q3上引數為變數時,做完此運算立刻存回此變數,導致變數值改變;較新的版本,引數為變數時,做完此運算不會導致變數值改變。
        strtoupper();轉大寫。
        strtolower();轉小寫。
        ucfirst();字串首轉大寫。
        ucwords();字串中每個Word的字首轉大寫。
        strtok(字串,”分隔字元”);:擷取字串的前面到分字元為止。
        substr(字串,開始字元,長度);:擷取子字串,第一字元算0;開始字元為負,為字串尾減該數,即字尾算1倒數該數之字元。長度省略則取到字尾;長度為負則取到字尾倒數該數之字元。
        strcmp(字串一,字串二);:比較兩字串,相等為0,正為字串一ASC碼大,負數為字串二ASC碼大。
        strcasecmp(字串一,字串二);:同上,但不分大小寫。
        strlen();:字串長度。
        strstr(字串,欲找之子字串);:找到傳回子字串「第一次」出現以後之剩餘字串,找不到傳回「假」。
        strchr(字串,欲找之子字串);:同上。
        stristr(字串,欲找之子字串);:同上,但不分大小寫。
        strrchr(字串,欲找之子字串);:找到傳回子字串「最後一次」出現以後之剩餘字串,找不到傳回「假」。
        strpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回子字串「第一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時,從字串首開始找。但是「假」傳回值是0,字首位置傳回值也是0,會混淆。可以用if(傳回值===fasle)測,如果成立傳回值代表「假」,如果不成立傳回值代表位置0。
        strrpos(字串,欲找之子字串,指定蒐尋之起始位置);:找到傳回「子字串字首字元」「最後一次」出現的位置,找不到傳回「假」。字串首位置算0,省略蒐尋起點時,從字串首開始找。
        str_replace(蒐尋字串,代換字串,字串堆);:在字串堆中找到「蒐尋字串」並用「代換字串」換掉它們。
        substr_replace(字串堆,代換字串,起點,長度);:在字串堆指定的起點及長度,用代換字串換掉它們。起點為0或正,由字串堆頭起算;起點為負,由字串堆尾起算。長度未指定,則換到字串堆尾;長度為0,則插入原字串;長度為正,則取代幾個字串數;長度為負,則自尾端開如取代,停於長度。
        二、正規表示式(regular expression)
       
        PHP支援兩種正規表示式,POSIX和Perl。POSIX內建,Perl語法須將PCRE(Perl-compatible regular expression)程式庫編譯進來。正規表示式比字串慢,儘量用字串。
       
        ():括住子表示式。
        []:括住字元。
        {}:括住重覆次數說明。
        .除\
        以外的單一字元。如.at相符於cat,sat,mat。
        [a-z]、[^a-z]:a到z、非a-z。
        [aeiou]
        [a-zA-Z]
        字元類別:
        [[:alpha:]]:字母。
        [[:alnum:]]:字母及數字。
        [[:lower:]]:小寫字母。
        [[:upper:]]:大寫字母。
        [[:digit:]]:數字字元。
        [[:xdigit:]]:16進位數字字元。
        [[:punct:]]:標點。
        [[:blank:]]:跳格及空白。
        [[:space:]]:空白。
        [[:cntrl:]]:控制字元。
        [[:print:]]:所有可視字元。
        [[:graph:]]:除空白字元外所有可視字元。
        []*:表示該樣式會出現0或0次以上。
        []+:表示該樣式會出現1或1次以上。如[[:alpha:]]+表示至少會有一個英文字母。
        (very )*large:相符於large、very large、very very large。
        {3}:重複三次。
        {2,4}:重複二到四次。
        {2,}:重複兩次以上。
        ^(在表示式外),表示式須出現在被蒐尋字串首才算相符。如^bob。
        $,表示式須出現在被蒐尋字串尾才算相符。如com$。
        ^[a-z]$,字串頭尾之間,出現a-z任一字元就算相符。
        (選項一)|(選項二)|(選項三):多選一都符合
        特殊字元,在正規表示式中須以\特殊字元取代。
        中括號外
       
        \:跳脫字元。
        ^:比對字串頭。
        $:比對字串尾。
        .:換行之外的任意字元。
        |:多重選擇起點(讀成OR)。
        (:子樣式起點。
        ):子樣式終點。
        *:重複0次以上。
        +:重複1次以上。
        {:重複次數 最小/最大 量化值起點。
        }:重複次數 最小/最大 量化值終點。
        中括號外
       
        \:跳脫字元。
        ^:否定。
        -:表示字元範圍。
        ereg(正規表示式,被蒐尋字串,陣列名);:在被蒐尋字串中找符合於正規表示式的子字串,找到就放進陣列,成為一個元素。傳回真假(1,0)。陣列名可省略。
        eregi(正規表示式,被蒐尋字串,陣列名);:同ereg,但不分大小寫。
        ereg_replace(正規表示式,取代字串,被蒐尋字串);:在被蒐尋字串中找到表示式,用取代字串換掉。
        eregi_replace(正規表示式,取代字串,被蒐尋字串);:同ereg_replace,但不分大小寫。
        split(正規表示式表述之分隔字串,被切割字串,傳回元素上限);:用分隔字串,將被切割字串,切成一段段,成為陣列中一個個元素。傳回陣列。