一看文学

字:
关灯 护眼
一看文学 > 重生之乘风而起 > 第七百四十二章 新方案

第七百四十二章 新方案

第七百四十二章 新方案 (第2/2页)

“当前全收集,则指当前我们已知的汉字符号,包括大陆简化字,宝岛、港澳、新岛的繁体字,还有岛国,朝韩所用的一些汉字符号,全部采纳到新编码体系中来。”
  
  “未来可拓展的意思,就是要给字库留够充足的冗余编码空间,给将来采集更多的文字符号做好准备。”周至侃侃而谈:“刚刚旦增大师已经说了,我国是多民族的国家,很多民族都有自己的文字,这些文字,同样是我们华夏一族大家庭的瑰宝。”
  
  “因此我们要留足这个字库的拓展空间,以备将来时机成熟后,将这些少数民族的文字也收纳进来。”
  
  “这就是我的设想,关于华夏标准大字库的设想。”
  
  “呃……周至同学。”李红江倒也是光棍:“我给你道个歉,也给辜老和旦增大师道个歉,之前自己的确没有意识到这个问题的重要性。”
  
  “但是我之前已经说了,gb13000是根据iso/iec1064来设计的,通用多八位编码字符集的码位就只有两万多个,就好像一个养殖场,鸡笼子就这么多,实在是装不下你们说的这么多鸡啊?”
  
  “所以说这个多八位编码字符集是有问题的呀,不适合中国的需要呀,那我们为什么还要凑合着用呢?”周至反问道。
  
  “要是不用这个,那又用哪个呢?”李红江倒是不觉得周至是在无理取闹,能够提出问题来不是本事儿,关键是问题提出来之后,你还得能够解决问题才算。
  
  “为什么不用unicode呢?”
  
  “unicode?”李红江想了一下:“unicode八字还没一撇吧?国际标准都还没有出来,我们哪来的参照?”
  
  unicode的汉语翻译,叫做统一码,也叫万国码、单一码,是由统一码联盟开发的一项计算机科学领域里的业界标准,主要就包括字符集和编码方案。
  
  统一码是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符,设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
  
  统一码设计之初的目的,就是为了打造一个能够容纳世界上所有文字和符号的字符编码方案。
  
  其设计思路,就是用数字0-0x10ffff来映射所有字符,最多可以容纳1114112个字符,或者说有1114112个码位。
  
  后世大家所熟悉的utf-8、utf-16、utf-32,其实都是将数字转换到程序数据的编码方案。
  
  当然这些码位也不是随便乱用的,而是规定了区间,比如上一世给汉字使用的区间,就是3400-4dbf,4e00-9fff,20000-3ffff三段,称作:中日韩越统一表意文字区间。
  
  这就有一百多万个码位,装下所有汉字绰绰有余。
  
  因为不存在上限,utf理论上还可以继续扩展。
  
  当然从上一世的经验来看,也完全没有这个必要,足够用了。
  
  
『加入书签,方便阅读』
热门推荐
极品全能学生 凌天战尊 御用兵王 帝霸 开局奖励一亿条命 大融合系统 冷情帝少,轻轻亲 妖龙古帝 宠妃难为:皇上,娘娘今晚不侍寝 仙王的日常生活