MySQL CHAR_LENGTH

2013-05-14_084905

這是MySQL 5實力養成暨評量裡的5-12.『CHAR_LENGTH函數,可回傳傳入字串參數的字數(Character),試問執行SELECT CHAR_LENGTH(‘大家好’);結果為何?』

答案:(A) 3

這個函數的使用我懷疑會跟編碼有關係,所以我答9,其依據是來自MySQL BIT_LENGTH的測試,所以這次一樣測試看看,很顯然地跟編碼沒有關係,在Unicode的phpmyadmin環境下查詢一樣顯示3。

朋友們可以參考MySQL 5.7 Reference Manual :: 12 Functions and Operators :: 12.5 String Functions

MySQL 5.1参考手册 :: 12. 函数和操作符::12.3. 字符串函数

繁體中文轉譯如下:

假如結果的長度大於 max_allowed_packet 系統變數的最大值時,字串值函數的返回值為NULL。請參見7.5.2節,「調節伺服器參數」

對於在字串位置操作的函數,第一個位置的編號為 1。

  • ASCII(str)

返回值為字串str 的最左字元的數值。假如str為空字串,則返回值為 0 。假如str 為NULL,則返回值為 NULL。 ASCII()用於帶有從 0到255的數值的字元。

mysql> SELECT ASCII(‘2’);

-> 50

mysql> SELECT ASCII(2);

-> 50

mysql> SELECT ASCII(‘dx’);

-> 100

見 ORD()函數。

  • BIN(N)

返回值為N的二進制值的字串資料表示,其中  N 為一個longlong (BIGINT) 數字。這等同於 CONV(N,10,2)。假如N 為NULL,則返回值為NULL。

mysql> SELECT BIN(12);

-> ‘1100’

  • BIT_LENGTH(str)

返回值為二進制的字串str 長度。

mysql> SELECT BIT_LENGTH(‘text’);

-> 32

  • CHAR(N,… [USING charset])

CHAR()將每個參數N理解為一個整數,其返回值為一個包含這些整數的代碼值所給出的字元的字串。NULL值被省略。

mysql> SELECT CHAR(77,121,83,81,’76’);

-> ‘MySQL’

mysql> SELECT CHAR(77,77.3,’77.3′);

-> ‘MMM’

大於 255的CHAR()參數被轉換為多結果字元。 例如,CHAR(256) 相當於 CHAR(1,0), 而CHAR(256*256) 則相當於 CHAR(1,0,0):

mysql> SELECT HEX(CHAR(1,0)), HEX(CHAR(256));

+—————-+—————-+

| HEX(CHAR(1,0)) | HEX(CHAR(256)) |

+—————-+—————-+

| 0100           | 0100           |

+—————-+—————-+

mysql> SELECT HEX(CHAR(1,0,0)), HEX(CHAR(256*256));

+——————+——————–+

| HEX(CHAR(1,0,0)) | HEX(CHAR(256*256)) |

+——————+——————–+

| 010000           | 010000             |

+——————+——————–+

CHAR()的返回值為一個二進制字串。可選擇使用USING語句產生一個給出的字元編碼中的字串:

mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));

mysql> SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));
+---------------------+--------------------------------+
| CHARSET(CHAR(0x65)) | CHARSET(CHAR(0x65 USING utf8)) |
+---------------------+--------------------------------+
| binary              | utf8                           |
+---------------------+--------------------------------+

如果 USING已經產生,而結果字串不符合給出的字元編碼,則會發出警告。   同樣,如果嚴格的SQL模式被激活,則CHAR()的結果會成為NULL。

  • CHAR_LENGTH(str)

返回值為字串str 的長度,長度的單位為字元。一個多字節字元算作一個單字元。對於一個包含五個二字節字元編碼,LENGTH()返回值為 10,而CHAR_LENGTH()的返回值為5。

  • CHARACTER_LENGTH(str)

CHARACTER_LENGTH()是CHAR_LENGTH()的同義詞。

  • COMPRESS(string_to_compress)

壓縮一個字串。這個函數要求 MySQL已經用一個諸如zlib的壓縮庫壓縮過。   否則,返回值始終是NULL。UNCOMPRESS() 可將壓縮過的字串進行解壓縮。

mysql> SELECT LENGTH(COMPRESS(REPEAT(‘a’,1000)));

-> 21

mysql> SELECT LENGTH(COMPRESS(”));

-> 0

mysql> SELECT LENGTH(COMPRESS(‘a’));

-> 13

mysql> SELECT LENGTH(COMPRESS(REPEAT(‘a’,16)));

-> 15

壓縮後的字串的內容按照以下方式儲存:

    • 空字串按照空字串儲存。
    • 非空字串未壓縮字串的四字節長度進行儲存(首先為低字節),後面是壓縮字串。如果字串以空格結尾,就會在後加一個”.”號,以防止當結果值是儲存在CHAR或VARCHAR類型的字段列時,出現自動把結尾空格去掉的現象。(不推薦使用 CHAR 或VARCHAR 來儲存壓縮字串。最好使用一個 BLOB 列代替)。
  • CONCAT(str1,str2,…)

返回結果為連接參數產生的字串。如有任何一個參數為NULL ,則返回值為 NULL。或許有一個或多個參數。 如果所有參數均為非二進制字串,則結果為非二進制字串。 如果自變數中含有任一二進制字串,則結果為一個二進制字串。一個數字參數被轉化為與之相等的二進制字串格式;若要避免這種情況,可使用顯式類型 cast, 例如: SELECT CONCAT(CAST(int_col AS CHAR), char_col)

mysql> SELECT CONCAT(‘My’, ‘S’, ‘QL’);

-> ‘MySQL’

mysql> SELECT CONCAT(‘My’, NULL, ‘QL’);

-> NULL

mysql> SELECT CONCAT(14.3);

-> ‘14.3’

  • CONCAT_WS(separator,str1,str2,…)

CONCAT_WS() 代資料表 CONCAT With Separator ,是CONCAT()的特殊形式。   第一個參數是其它參數的分隔符。分隔符的位置放在要連接的兩個字串之間。分隔符可以是一個字串,也可以是其它參數。如果分隔符為 NULL,則結果為 NULL。函數會忽略任何分隔符參數後的NULL 值。

mysql> SELECT CONCAT_WS(‘,’,’First name’,’Second name’,’Last Name’);

-> ‘First name,Second name,Last Name’

mysql> SELECT CONCAT_WS(‘,’,’First name’,NULL,’Last Name’);

-> ‘First name,Last Name’

CONCAT_WS()不會忽略任何空字串。 (然而會忽略所有的 NULL)。

  • CONV(N,from_base,to_base)

不同數基間轉換數字。返回值為數字的N字串資料表示,由from_base基轉化為 to_base 基。如有任意一個參數為NULL,則返回值為 NULL。自變數 N 被理解為一個整數,但是可以被指定為一個整數或字串。最小基數為 2 ,而最大基數則為 36。 If to_base 是一個負數,則 N 被看作一個帶符號數。否則, N 被看作無符號數。 CONV() 的運行精確度為 64比特。

mysql> SELECT CONV(‘a’,16,2);

-> ‘1010’

mysql> SELECT CONV(‘6E’,18,8);

-> ‘172’

mysql> SELECT CONV(-17,10,-18);

-> ‘-H’

mysql> SELECT CONV(10+’10’+’10’+0xa,10,10);

-> ’40’

  • ELT(N,str1,str2,str3,…)

N = 1,則返回值為  str1 ,若N = 2,則返回值為 str2 ,以此類推。   若N 小於1或大於參數的數目,則返回值為 NULL 。 ELT() 是  FIELD()的補數。

mysql> SELECT ELT(1, ‘ej’, ‘Heja’, ‘hej’, ‘foo’);

-> ‘ej’

mysql> SELECT ELT(4, ‘ej’, ‘Heja’, ‘hej’, ‘foo’);

-> ‘foo’

  • EXPORT_SET(bits,on,off[,separator[,number_of_bits]])

返回值為一個字串,其中對於bits值中的每個位組,可以得到一個 on 字串,而對於每個清零比特位,可以得到一個off 字串。bits 中的比特值按照從右到左的順序接受檢驗 (由低位比特到高位比特)。字串被分隔字串分開(預設為逗號『,』),按照從左到右的順序被新增到結果中。number_of_bits 會給出被檢驗的二進制位數 (預設為 64)。

mysql> SELECT EXPORT_SET(5,’Y’,’N’,’,’,4);

-> ‘Y,N,Y,N’

mysql> SELECT EXPORT_SET(6,’1′,’0′,’,’,10);

-> ‘0,1,1,0,0,0,0,0,0,0′

  • FIELD(str,str1,str2,str3,…)

返回值為str1str2str3,……列資料表中的str 指數。在找不到str 的情況下,返回值為 0 。

如果所有對於FIELD() 的參數均為字串,則所有參數均按照字串進行比較。如果所有的參數均為數字,則按照數字進行比較。否則,參數按照雙倍進行比較。

如果str 為NULL,則返回值為0 ,原因是NULL不能同任何值進行同等比較。FIELD() 是ELT()的補數。

mysql> SELECT FIELD(‘ej’, ‘Hej’, ‘ej’, ‘Heja’, ‘hej’, ‘foo’);

-> 2

mysql> SELECT FIELD(‘fo’, ‘Hej’, ‘ej’, ‘Heja’, ‘hej’, ‘foo’);

-> 0

  • FIND_IN_SET(str,strlist)

假如字串str 在由N 子鏈組成的字串列資料表strlist 中, 則返回值的範圍在 1 到 N 之間 。一個字串列資料表就是一個由一些被『,』符號分開的自鏈組成的字串。如果第一個參數是一個常數字串,而第二個是type SET列,則   FIND_IN_SET() 函數被最佳化,使用比特計算。如果str不在strlist 或strlist 為空字串,則返回值為 0 。如任意一個參數為NULL,則返回值為 NULL。 這個函數在第一個參數包含一個逗號(『,』)時將無法正常運行。

mysql> SELECT FIND_IN_SET(‘b’,’a,b,c,d’);

-> 2

  • FORMAT(X,D)

將number X設置為格式 ‘#,###,###.##’, 以四捨五入的方式保留到小數點後D位, 而返回結果為一個字串。詳見12.9.4節,「其他函數」.

  • HEX(N_or_S)

如果N_OR_S 是一個數字,則返回一個 十六進制值 N 的字串資料表示,在這裡,   N 是一個longlong (BIGINT)數。這相當於 CONV(N,10,16)。

如果N_OR_S 是一個字串,則返回值為一個N_OR_S的十六進制字串資料表示, 其中每個N_OR_S 裡的每個字元被轉化為兩個十六進制數字。

mysql> SELECT HEX(255);

-> ‘FF’

mysql> SELECT 0x616263;

-> ‘abc’

mysql> SELECT HEX(‘abc’);

-> 616263

  • INSERT(str,pos,len,newstr)

返回字串 str, 其子字串起始於 pos 位置和長期被字串 newstr取代的len 字元。  如果pos 超過字串長度,則返回值為原始字串。 假如len的長度大於其它字串的長度,則從位置pos開始替換。若任何一個參數為null,則返回值為NULL。

mysql> SELECT INSERT(‘Quadratic’, 3, 4, ‘What’);

-> ‘QuWhattic’

mysql> SELECT INSERT(‘Quadratic’, -1, 4, ‘What’);

-> ‘Quadratic’

mysql> SELECT INSERT(‘Quadratic’, 3, 100, ‘What’);

-> ‘QuWhat’

這個函數支援多字節字元。

  • INSTR(str,substr)

返回字串 str 中子字串的第一個出現位置。這和LOCATE()的雙參數形式相同,除非參數的順序被顛倒。

mysql> SELECT INSTR(‘foobarbar’, ‘bar’);

-> 4

mysql> SELECT INSTR(‘xbar’, ‘foobar’);

-> 0

這個函數支援多字節字元,並且只有當至少有一個參數是二進制字串時區分大小寫。

  • LCASE(str)

LCASE() 是 LOWER()的同義詞。

  • LEFT(str,len)

返回從字串str 開始的len 最左字元。

mysql> SELECT LEFT(‘foobarbar’, 5);

-> ‘fooba’

  • LENGTH(str)

返回值為字串str 的長度,單位為字節。一個多字節字元算作多字節。這意味著 對於一個包含5個2字節字元的字串, LENGTH() 的返回值為 10,而 CHAR_LENGTH()的返回值則為5。

mysql> SELECT LENGTH(‘text’);

-> 4

  • LOAD_FILE(file_name)

讀取檔案並將這一檔案按照字串的格式返回。 檔案的位置必須在伺服器上,您必須為檔案制定路徑全名,而且您還必須擁有FILE 特許權。檔案必須可讀取,檔案容量必須小於 max_allowed_packet字節。

若檔案不存在,或因不滿足上述條件而不能被讀取, 則函數返回值為 NULL。

mysql> UPDATE tbl_name

SET blob_column=LOAD_FILE(‘/tmp/picture’)

WHERE id=1;

  • LOCATE(substr,str) , LOCATE(substr,str,pos)

第一個語法返回字串 str中子字串substr的第一個出現位置。第二個語法返回字串 str中子字串substr的第一個出現位置, 起始位置在pos。如若substr 不在str中,則返回值為0。

mysql> SELECT LOCATE(‘bar’, ‘foobarbar’);

-> 4

mysql> SELECT LOCATE(‘xbar’, ‘foobar’);

-> 0

mysql> SELECT LOCATE(‘bar’, ‘foobarbar’,5);

-> 7

這個函數支援多字節字元,並且只有當至少有一個參數是二進制字串時區分大小寫。

  • LOWER(str)

返回字串 str 以及所有根據最新的字元編碼映射資料表變為小寫字母的字元 (預設為  cp1252 Latin1)。

mysql> SELECT LOWER(‘QUADRATICALLY’);

-> ‘quadratically’

這個函數支援多字節字元。

  • LPAD(str,len,padstr)

返回字串 str, 其左邊由字串padstr 填補到len 字元長度。假如str 的長度大於len, 則返回值被縮短至 len 字元。

mysql> SELECT LPAD(‘hi’,4,’??’);

-> ‘??hi’

mysql> SELECT LPAD(‘hi’,1,’??’);

-> ‘h’

  • LTRIM(str)

返回字串 str ,其引導空格字元被刪除。

mysql> SELECT LTRIM(‘  barbar’);

-> ‘barbar’

這個函數支援多字節字元。

  • MAKE_SET(bits,str1,str2,…)

返回一個設定值 (一個包含被『,』號分開的字字串的字串) ,由在bits 組中具有相應的比特的字串組成。str1 對應比特 0, str2 對應比特1,以此類推。str1str2, …中的 NULL值不會被新增到結果中。

mysql> SELECT MAKE_SET(1,’a’,’b’,’c’);

-> ‘a’

mysql> SELECT MAKE_SET(1 | 4,’hello’,’nice’,’world’);

-> ‘hello,world’

mysql> SELECT MAKE_SET(1 | 4,’hello’,’nice’,NULL,’world’);

-> ‘hello’

mysql> SELECT MAKE_SET(0,’a’,’b’,’c’);

-> ”

  • MID(str,pos,len)

MID(str,pos,len) 是 SUBSTRING(str,pos,len)的同義詞。

  • OCT(N)

返回一個 N的八進制值的字串資料表示,其中 N 是一個longlong (BIGINT)數。這等同於CONV(N,10,8)。若N 為 NULL ,則返回值為NULL。

mysql> SELECT OCT(12);

-> ’14’

  • OCTET_LENGTH(str)

OCTET_LENGTH() 是 LENGTH()的同義詞。

  • ORD(str)

若字串str 的最左字元是一個多字節字元,則返回該字元的代碼, 代碼的計算通過使用以下公式計算其組成字節的數值而得出:

   (1st byte code)
+ (2nd byte code × 256)
+ (3rd byte code × 2562) ...

 

假如最左字元不是一個多字節字元,那麼 ORD()和函數ASCII()返回相同的值。

mysql> SELECT ORD(‘2’);

-> 50

  • POSITION(substr IN str)

POSITION(substr IN str)是 LOCATE(substr,str)同義詞。

  • QUOTE(str)

引證一個字串,由此產生一個在SQL語句中可用作完全轉義數據值的結果。  返回的字串由單引號標注,每例都帶有單引號 (『’』)、 反斜線符號 (『』)、 ASCII NUL以及前面有反斜線符號的Control-Z 。如果自變數的值為NULL, 則返回不帶單引號的單詞 「NULL」。

mysql> SELECT QUOTE(‘Don’t!’);

-> ‘Don’t!’

mysql> SELECT QUOTE(NULL);

-> NULL

  • REPEAT(str,count)

返回一個由重複的字串str 組成的字串,字串str的數目等於count 。 若 count <= 0,則返回一個空字串。若str 或 count 為 NULL,則返回 NULL 。

mysql> SELECT REPEAT(‘MySQL’, 3);

-> ‘MySQLMySQLMySQL’

  • REPLACE(str,from_str,to_str)

返回字串str 以及所有被字串to_str替代的字串from_str 。

mysql> SELECT REPLACE(‘www.mysql.com’, ‘w’, ‘Ww’);

-> ‘WwWwWw.mysql.com’

這個函數支援多字節字元。

  • REVERSE(str)

返回字串 str ,順序和字元順序相反。

mysql> SELECT REVERSE(‘abc’);

-> ‘cba’

這個函數支援多字節字元。

  • RIGHT(str,len)

從字串str 開始,返回最右len 字元。

mysql> SELECT RIGHT(‘foobarbar’, 4);

-> ‘rbar’

這個函數支援多字節字元。

  • RPAD(str,len,padstr)

返回字串str, 其右邊被字串 padstr填補至len 字元長度。假如字串str 的長度大於 len,則返回值被縮短到與 len 字元相同長度。

mysql> SELECT RPAD(‘hi’,5,’?’);

-> ‘hi???’

mysql> SELECT RPAD(‘hi’,1,’?’);

-> ‘h’

這個函數支援多字節字元。

  • RTRIM(str)

返回字串 str ,結尾空格字元被刪去。

mysql> SELECT RTRIM(‘barbar   ‘);

-> ‘barbar’

這個函數支援多字節字元。

  • SOUNDEX(str)

str返回一個soundex字串。 兩個具有幾乎同樣探測的字串應該具有同樣的 soundex 字串。一個標準的soundex 字串的長度為4個字元,然而SOUNDEX() 函數會返回一個人以長度的字串。 可使用結果中的SUBSTRING() 來得到一個標準 soundex 字串。在str會忽略所有未按照字母順序排列的字元。 所有不在A-Z範圍之內的國際字母符號被視為元音字母。

mysql> SELECT SOUNDEX(‘Hello’);

-> ‘H400’

mysql> SELECT SOUNDEX(‘Quadratically’);

-> ‘Q36324’

注意:這個函數執行原始的Soundex算法,而非更加流行的加強版本(如D. Knuth所述)。其區別在於原始版本首先會刪去元音,其次是重複,而加強版則首先刪去重複,而後刪去元音。

  • expr1 SOUNDS LIKE expr2

這相當於SOUNDEX(expr1) = SOUNDEX(expr2)。

  • SPACE(N)

返回一個由N 間隔符號組成的字串。

mysql> SELECT SPACE(6);

-> ‘      ‘

  • SUBSTRING(str,pos) , SUBSTRING(str FROM pos) SUBSTRING(str,pos,len) , SUBSTRING(str FROM pos FOR len)

不帶有len 參數的格式從字串str返回一個子字串,起始於位置 pos。帶有len參數的格式從字串str返回一個長度同len字元相同的子字串,起始於位置 pos。 使用 FROM的格式為標準 SQL 語法。也可能對pos使用一個負值。假若這樣,則子字串的位置起始於字串結尾的pos 字元,而不是字串的開頭位置。在以下格式的函數中可以對pos 使用一個負值。

mysql> SELECT SUBSTRING(‘Quadratically’,5);

-> ‘ratically’

mysql> SELECT SUBSTRING(‘foobarbar’ FROM 4);

-> ‘barbar’

mysql> SELECT SUBSTRING(‘Quadratically’,5,6);

-> ‘ratica’

mysql> SELECT SUBSTRING(‘Sakila’, -3);

-> ‘ila’

mysql> SELECT SUBSTRING(‘Sakila’, -5, 3);

-> ‘aki’

mysql> SELECT SUBSTRING(‘Sakila’ FROM -4 FOR 2);

-> ‘ki’

這個函數支援多字節字元。

注意,如果對len使用的是一個小於1的值,則結果始終為空字串。

SUBSTR()是 SUBSTRING()的同義詞。

  • SUBSTRING_INDEX(str,delim,count)

在定界符 delim 以及count 出現前,從字串str返回自字串。若count為正值,則返回最終定界符(從左邊開始)左邊的一切內容。若count為負值,則返回定界符(從右邊開始)右邊的一切內容。

mysql> SELECT SUBSTRING_INDEX(‘www.mysql.com’, ‘.’, 2);

-> ‘www.mysql’

mysql> SELECT SUBSTRING_INDEX(‘www.mysql.com’, ‘.’, -2);

-> ‘mysql.com’

這個函數支援多字節字元。

  • TRIM([{BOTH | LEADING | TRAILING} [remstr] FROM] str) TRIM(remstr FROM] str)

返回字串 str , 其中所有remstr 前綴和/或後綴都已被刪除。若分類符BOTH、LEADIN或TRAILING中沒有一個是給定的,則假設為BOTH 。remstr 為可選項,在未指定情況下,可刪除空格。

mysql> SELECT TRIM(‘  bar   ‘);

-> ‘bar’

mysql> SELECT TRIM(LEADING ‘x’ FROM ‘xxxbarxxx’);

-> ‘barxxx’

mysql> SELECT TRIM(BOTH ‘x’ FROM ‘xxxbarxxx’);

-> ‘bar’

mysql> SELECT TRIM(TRAILING ‘xyz’ FROM ‘barxxyz’);

-> ‘barx’

這個函數支援多字節字元。

  • UCASE(str)

UCASE()是UPPER()的同義詞。

  • UNCOMPRESS(string_to_uncompress)

對經COMPRESS()函數壓縮後的字串進行解壓縮。若參數為壓縮值,則結果為 NULL。這個函數要求  MySQL 已被諸如zlib 之類的壓縮庫編譯過。否則, 返回值將始終是 NULL。

mysql> SELECT UNCOMPRESS(COMPRESS(‘any string’));

-> ‘any string’

mysql> SELECT UNCOMPRESS(‘any string’);

-> NULL

  • UNCOMPRESSED_LENGTH(compressed_string)

返回壓縮字串壓縮前的長度。

mysql> SELECT UNCOMPRESSED_LENGTH(COMPRESS(REPEAT(‘a’,30)));

-> 30

  • UNHEX(str)

執行從HEX(str)的反向操作。就是說,它將參數中的每一對十六進制數字理解為一個數字,並將其轉化為該數字代資料表的字元。結果字元以二進制字串的形式返回。

mysql> SELECT UNHEX(‘4D7953514C’);

-> ‘MySQL’

mysql> SELECT 0x4D7953514C;

-> ‘MySQL’

mysql> SELECT UNHEX(HEX(‘string’));

-> ‘string’

mysql> SELECT HEX(UNHEX(‘1267’));

-> ‘1267’

  • UPPER(str)

返回字串str, 以及根據最新字元編碼映射轉化為大寫字母的字元 (預設為cp1252 Latin1).

mysql> SELECT UPPER(‘Hej’);

-> ‘HEJ’

該函數支援多字節字元。

感謝你看到這裡,很快就可以離開了,但最好的獎勵行動就是按一下幫我分享或留言,感恩喔~

點我分享到Facebook

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *