1. UNICODE个人感觉分广义和狭义, 广义的UNICODE包括UTF8, UCS2, UCS4, 而狭义的UNICODE(主要是Windows平台)就是指UCS2。
2. UNICODE统一为两个字节,增加了网络传输及存储的开销。
3. UTF8对英文字符还是1个字节存储,只对其他语言字符用多个字节存储(2-6个字节)。
4. UNCIODE与UTF8之间可相互转换,C++11中的操作如下:
std::codecvt_utf8 | 封装了UTF8相关的编码转换 |
std::codecvt_utf16 | 封装了UCS2相关的编码转换 |
std::codecvt_utf8_utf16 | 封装了UTF8与UCS2的编码转换 |
5. 低字节在低地址的为小端;高字节在低地址的为大端。
6. 系统的大小端和CPU架构体系相关联, 比如说X86是小端, PowPC是大端,ARM则是可控制(默认也是小端)。
7. 程序判断大小端:
bool IsLittleEndian() { int i=1; return (*(char *)&i == 1); }
8. 栈存储数据int类型整数1的结构如下: