首页
/
每日頭條
/
科技
/
c語言中長字符串用什麼定義
c語言中長字符串用什麼定義
更新时间:2025-07-12 15:03:53

c語言中長字符串用什麼定義?目前互聯網應用中,例如大部分網站都已經使用 UTF-8 編碼,而 C 标準庫裡面,例如filesystem庫裡面關于文件路徑等,也是和 UTF-8 編碼相關,因此 C 标準也要優化對 UTF-8 編碼的支持,下面我們就來說一說關于c語言中長字符串用什麼定義?我們一起去了解并探讨一下這個問題吧!

c語言中長字符串用什麼定義(C20新特性)1

c語言中長字符串用什麼定義

新增 char8_t 類型表示 UTF-8 字符串

目前互聯網應用中,例如大部分網站都已經使用 UTF-8 編碼,而 C 标準庫裡面,例如filesystem庫裡面關于文件路徑等,也是和 UTF-8 編碼相關,因此 C 标準也要優化對 UTF-8 編碼的支持。

雖然在 C 11 中,已經增加了 UTF-8 字符串常量(u8"\xe4\xb8\xad\xe6\x96\x87"),但一直是使用 char * 作為類型。這樣導緻的問題,就是一個 char * 類型變量,可能是 UTF-8 編碼,也可能是多字節編碼(例如 GBK),因此為了區分不同的編碼類型,可能需要通過不同的函數名重載,或者模闆 traits 等技巧來進行區分。

因此在 C 20 中,将 UTF-8 字符串作為一種單獨的類型,增加了新的 char8_t 類型來進行描述。各種與字符串相關的模闆都增加 char8_t 相關的特化,例如 std 的字符串包裝類,就增加了 std::u8string 類型(std::basic_string<char8_t>)。

這個修改會造成不兼容,原來合法的代碼,可能會變得不合法,原來為了處理 UTF-8 字符串而特化成 char * 類型的模闆,需要改為特化 char8_t * 類型。

const auto * s1 = u8"text"; // <1> s1的類型,C 17 推導成const char *,C 20 推導成const char8_t * const char * s2 = u8"text"; // <2> C 17 正确,C 20 變成不正确 const char8_t * s3 = u8"text"; // <3> C 17 不正确(沒有char8_t類型),C 20 正确 template<typename T> int is_char8( const T * ) { return 0; } template<> int is_char8<char>( const char * ) { return 1; } std::cout << is_char8( s3 ) << std::endl; // <4> C 17 輸出1,C 20 輸出0 template<typename T> int is_char8_new( const T * ) { return 0; } template<> int is_char8_new<char8_t>( const char8_t * ) { return 1; } // <5> C 17 不支持 std::cout << is_char8_new( s3 ) << std::endl; // <6> C 20 輸出1 std::string s4 = u8"text"; // <7> C 17 正确,C 20 變成不正确 std::u8string s5 = u8"text"; // <8> C 17 不正确(沒有std::u8string類型),C 20 正确 std::filesystem::path p1; std::string s6 = p1.u8string(); // <9> C 17 正确,C 20 變成不正确 std::u8string s7 = p1.u8string(); // <10> C 17 不正确(沒有std::u8string類型),C 20 正确

明确 char16_t 和 char32_t 表示 UTF-16 和 UTF-32 字符串

之前的 C 标準新增 char16_t 和 char32_t 類型的時候,隻是說他們應該使用 UTF-16 和 UTF-32 的編碼格式,但标準裡面沒有明确進行這樣要求。

因此在 C 20 中,新增的 char8_t 類型明确要求是 UTF-8 字符串,同時将原來的 char16_t 和 char32_t 類型,也改為明确要求是 UTF-16 和 UTF-32 字符串。

明确不在 ISO 10646(Unicode編碼标準)中的字符的處理

之前的 C 标準,新增了字符串常量中的Unicode字符表達方式(\unnnn和\Unnnnnnnn),例如 \U0001f34 、 \uD83C\uDF4C 等,但對于不在 ISO 10646(Unicode編碼标準)中的字符的處理,則沒有明确說明。

因此在 C 20 中,明确要求Unicode字符表達方式(\unnnn和\Unnnnnnnn)中,如果有不在ISO 10646(Unicode編碼标準)中的字符,那麼這個代碼是不合法的。

【往期回顧】

C 20 新特性(9):指針和數組相關的兩個改進

C 20 新特性(8):range形式的for語句改進

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
pdf翻譯成中文的軟件有哪些
pdf翻譯成中文的軟件有哪些
有小夥伴在後台私信我,說他最近在準備畢業論文,在參考外文文獻這一關就犯了難。這些外文文獻多是pdf文檔,裡面有很多外文專業詞彙看不懂。有沒有其他小夥伴跟他一樣有上述的困擾呢?不用着急,我們隻需使用一些pdf翻譯軟件來翻譯文檔,就不用在翻譯文...
2025-07-12
vivo藍牙耳機值得入手嗎
vivo藍牙耳機值得入手嗎
本文作者為衆測用戶@原來醬紫哦,首發于糖紙衆測。外觀vivoTWSEarphone真無線藍牙耳機作為vivo首款真無線藍牙耳機,作為vivo的老用戶其發布之初便吸引到了我的注意,很興奮能夠糖紙獲得這款耳機體驗機會。耳機的包裝盒深藍底色、簡單...
2025-07-12
江西汽修中專學校
江西汽修中專學校
職業院校技能大賽是職業教育的一項重大制度設計和創新,在服務“三教”改革、推動職業教育高質量發展方面發揮了重要作用。為進一步提升新餘市中職學校技術技能人才培養質量,紮實推動新餘市職業教育高質量發展,充分發揮大賽對職業教育的“樹旗、導航、定标、...
2025-07-12
vivo手機哪一款性價比比較高
vivo手機哪一款性價比比較高
覆蓋更多價格檔位,意味着消費者選擇到的幾率越大,所以幾乎是所有手機品牌都會發布各種機型,主打各種功能。各種系列産品,讓人眼花缭亂,難以選擇。vivo手機,自從成立子品牌iQOO後,産品線精簡了不少,選擇起來更為容易。本次梳理,僅針對vivo...
2025-07-12
cfhd新賽季戰令角色
cfhd新賽季戰令角色
穿越火線高清競技大區(以下簡稱CFHD)一月版本已正式于1月19日上線!官方還精心制作了熱血沸騰的預告片,讓玩家通過4K超清頂級畫質,感受了一場酣暢淋漓的視聽盛宴!在本次上線的CFHD一月版本中,新劇情挑戰模式“幽靈計劃”的戰場體驗會更為多...
2025-07-12
Copyright 2023-2025 - www.tftnews.com All Rights Reserved