汉字排序与Unicode解析及自定义规则

汉字排序与Unicode解析及自定义规则

sort、sorted()都是参照字符的编码(Unicode)大小,进行排序的。汉字对应的编码顺序,本身就是杂乱的,所以使用sort排序结果自然无规则可言。

对少量的数据,可以理解为以汉字的首字母进行升序的。

解决思路:

首先要有自己的排序规则,比如按拼音字母,笔画多少。

然后再创建排序规则(可以是一个文本文件、也可以保存到数据库、也可以做个列表保存)。

最后用匿名函数配合sort就行排序。

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。

相关推荐

best365体育官网平台 js怎么发包

js怎么发包

📅 08-15 👁️ 1046
best365体育官网平台 多少岁以下不能学伪声?女孩子学伪声最佳年龄是几岁?
bat365app手机版下载 科普文章

科普文章

📅 08-27 👁️ 7267