字符:
Unicode(HEX):
Unicode(十进制):
所在范围:
名称 | 字数 | Unicode范围 | 首末字符 | 查看 |
---|---|---|---|---|
基本汉字 | 20992 | 4E00 - 9FFF | 一 - 鿿 | 字符 文档 |
扩展A | 6592 | 3400 - 4DBF | 㐀 - 䶿 | 字符 文档 |
扩展B | 42720 | 20000 – 2A6DF | 𠀀 - 𪛟 | 字符 文档 |
扩展C | 4154 | 2A700 – 2B739 | 𪜀 - 𫜹 | 字符 文档 |
扩展D | 222 | 2B740 – 2B81D | 𫝀 - 𫠝 | 字符 文档 |
扩展E | 5762 | 2B820 – 2CEA1 | 𫠠 - 𬺡 | 字符 文档 |
扩展F | 7473 | 2CEB0 – 2EBE0 | 𬺰 - 𮯠 | 字符 文档 |
扩展G | 4939 | 30000 – 3134A | 𰀀 - 𱍊 | 字符 文档 |
扩展H | 4192 | 31350 – 323AF | 𱍐 - 𲎯 | 字符 文档 |
汉字注音 | 48 | 3100 – 312F | - ㄯ | 字符 文档 |
汉字注音拓展 | 32 | 31A0 – 31BF | ㆠ - ㆿ | 字符 文档 |
兼容汉字 | 512 | F900 – FAFF | 豈 - | 字符 文档 |
兼容汉字扩展 | 544 | 2F800 – 2FA1F | 丽 - | 字符 文档 |
康熙部首 | 224 | 2F00 – 2FDF | ⼀ - | 字符 文档 |
汉字部首拓展 | 128 | 2E80 – 2EFF | ⺀ - | 字符 文档 |
汉字笔画 | 48 | 31C0 – 31EF | ㇀ - | 字符 文档 |
汉字结构 | 16 | 2FF0 – 2FFF | ⿰ - | 字符 文档 |
中文符号和标点 | 64 | 3000 – 303F | - 〿 | 字符 文档 |
象形符号和标点 | 32 | 16FE0 – 16FFF | 𖿠 - | 字符 文档 |
中文兼容形式标点 | 32 | FE30 – FE4F | ︰ - ﹏ | 字符 文档 |
半角和全角形式字符 | 240 | FF00 – FFEF | - | 字符 文档 |
小型变体形式 | 32 | FE50 – FE6F | ﹐ - | 字符 文档 |
垂直形式 | 16 | FE10 – FE1F | ︐ - | 字符 文档 |
相关工具
在线中文字符Unicode编码范围查询工具,查询中文字符的Unicode代码点(Unicode Code Point)范围,查看代码点范围内的所有中文字符。
在线中文字符Unicode编码范围查询工具,列出了 Unicode 中所有中文字符,中文标点,全角字符的代码点范围,支持查看范围名称, 范围内字符个数(包含空码位),范围起始和结束代码点,首末字符等。还支持查看范围内的所有字符,以及 Unicode 文档。
- 查询:输入单个字符或者 Unicode Code Point (支持 HEX 和十进制格式),查询对应的字符所在的 Unicode 代码点范围。
- 本工具提供的 Unicode 字符编码信息基于 Unicode 15.0 。
- 汉字的 Unicode 范围可以用于汉字的正则表达式匹配,根据具体的需求,设置不同的正则 Unicode 范围模式。 注意:需要开启正则表达式的 Unicode 标志。
- 很多常见的资料匹配中文正则为 [\u4E00-\u9FA5] ,根据上述表格可知,缺失了部分汉字字符和标点符号。
- Unicode : 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码, 以满足跨语言、跨平台进行文本转换、处理的要求。 简单而言,Unicode 定义了字符和数字(Unicode Code Point)的一一映射。 Unicode Code Point 可以用于正则表达式匹配,特殊字符展示等场景。
- 同一个字符,在不同的字符集下(比如 ASCII,UTF-8,UTF-16,GB18030 等),其数字编码可能不同。 不同字符集可以支持全部或者部分的 Unicode 字符,也可以包含 Unicode 字符以外的其他字符。