請選擇 進入手機版 | 繼續訪問電腦版

简帛网

 找回密碼
 立即注册
查看: 5565|回復: 1

[新闻] “中华字库”工程启动

[複製鏈接]
發表於 2011-7-28 14:08 | 顯示全部樓層 |閱讀模式
《 光明日报 》( 2011年07月27日   03 版)
    本报北京7月26日电(记者 吴娜)由著名文字学家裘锡圭先生担任项目首席专家的“中华字库”工程研发工作今日正式启动。这标志着“中华字库”工程从筹备阶段进入到全面研发建设阶段。

    作为新闻出版总署重大科技工程项目之一的“中华字库”工程,是列入《国家“十一五”时期文化发展规划纲要》的重大建设项目,也是国家《文化产业振兴规划》中特别指出的具有带动作用的重大文化建设项目。

    据了解,现有的字库只收入了7万多字,古汉字及许多少数民族文字都没有纳入,远远满足不了总结和传承文献,传播中华文化的需要。

    新闻出版总署副署长、重大科技工程项目领导小组副组长孙寿山表示,“中华字库”工程将建成全部汉字及少数民族文字的编码和主要字体字符库,形成汉字编码体系,重点研发汉字输入、输出、存储、传输以及兼容等关键技术。完成后的“中华字库”预计可编码字符数在50万左右,包括汉字古文字约10万、楷书汉字约30万、各少数民族文字约10万,并将形成我国多语种文字的数字化处理技术体系,能对我国各种出土、传世文献和当代文字作品进行数字化处理,也能够满足社会数字化服务和数字化监管如国土资源管理、公民身份管理等需要。

    “中华字库”工程由中国出版集团公司牵头组建总体组,共分为28个包,预计5年内完成,有近30家高校、研究院所和企业参与工程的研发。

http://epaper.gmw.cn/gmrb/html/2 ... 727_4-03.htm?div=-1
發表於 2011-8-27 09:39 | 顯示全部樓層

这里没有你找不到的字

摘要

    我国现有的字库只收入了7万多字,已无法满足时代需求。历经5年精心准备的“中华字库”工程进入研发阶段,工程将利用先进的信息技术手段,收集和汇总历代文献资源中出现过的汉字和少数民族文字,辨析源流衍变,确定每个字形的历史地位,建立汉字及少数民族文字的编码和主要字体字符库。字库建成后将是开放性的,会及时吸收新的字或字形。

    你是否知道?计算机屏幕上显现的每个字符,背后都有一个对应的被国际标准化组织正式认证的区位编码。如果字符没有编码,它将无法在电脑中显现和存储。而这个字符编码汇聚的地方,就是字库。

    我国现有的字库只收入了7万多字,除了遗漏的许多现代汉字外,古汉字和许多少数民族文字也没被纳入进来。而随着电脑应用的日渐广泛,现有的字库已远远不能满足人们各方面的需求。

    一条喜讯传来:历经5年精心准备的“中华字库”工程日前正式进入研发阶段。

    “一套权威全面的字表”

    “中华字库”工程总体组专职副组长张力伟介绍,该工程将利用先进的信息技术手段,收集和汇总历代文献资源中出现过的汉字和少数民族文字,辨析源流衍变,确定每个字形的历史地位,建立汉字及少数民族文字的编码和主要字体字符库,重点研发汉字输入、输出、存储、传输以及兼容等关键技术。

    完成后的“中华字库”预计可编码字符数在50万左右,包括汉字古文字约10万、楷书汉字约30万、各少数民族文字约10万。

    张力伟表示:“‘中华字库’最终的呈现状态,就是做出一套权威全面的字表来,然后提交给国际标准化组织,在电脑区位中给每个字编码,厂商再据此做出字形,从而满足现实的各种需求。”

    “永久的保存和无限的传播”

    上古至今的各种传世文献,是中华各族人民的精神财富,具有不可估量的价值。“让我国的传统文献实现‘永久的保存和无限的传播’,是‘中华字库’建成后最重要的意义。”张力伟指出。

    张力伟说:“网上已有的一些文献资料,文字的准确度不够,还常常出现拼字、空格、替代等,都是因为字库不完善。古文字中的甲骨文、铜器铭文等,是文化的瑰宝。但由于目前我国的古文字都没有编码,导致现在无法对其实现数字化,录入时只能转写成现代的通行字,转写中字的意义损失很大。因此,从长远来看,要对传统文化典籍进行数字化的存储和传播,就需要建立一个容量更大的‘中华字库’。”

    “‘中华字库’工程完成后,不仅对文字学和文献学领域贡献巨大,还将会对我国的整个社会科学研究产生巨大的推动作用。”北京师范大学教授、“中华字库”工程楷书召集组召集人李国英这样说。

    “工程实施起来不容易”

    日常生活中,有人因为名字中使用了生僻字,在上户口、入学、就医、出国等各种需要电脑录入个人信息的场合出现麻烦。据统计,我国不少的行政村名包含生僻字,而为其村民录入二代身份证信息就会遇到障碍。

    “‘中华字库’的研发,本质上虽然是为了传世文献的数字出版,但将连带地解决这些现实应用问题。”张力伟表示。

    “字库工程实施起来并不容易!”张力伟感慨地说:“这需要我们做大量工作。某些字在历史上无依据,就不能收录。因此,‘中华字库’工程不仅仅是一个简单的文字整理,更要对我国传统文献进行一番细致的整理。明清之前的文献,我们要统统过一遍,明清之后则将选取有代表性的版本,涉及文字量将达二三十亿之巨。”

    “字库将是开放性的,建成后并非一劳永逸”

    复旦大学教授、“中华字库”工程首席专家裘锡圭认为,“中华字库”工程性质比较特殊,其研究对象不仅仅是古今汉字,还包括少数民族文字,其本质上又有很浓厚的技术工程性质。因此,技术和文字这两部分工作之间如何配合好,是一个关键问题。

    据了解,在承担字库工程的单位中,既有复旦大学、清华大学、中国科学院、中国社会科学院等科研力量强大的高校和研究院所,又有北大方正、汉王科技等技术研发领先的企业。参与字库工程的研发人员中,既有文字、文献学的学者,也有汉字信息处理、计算机技术等方面的专家。

    裘锡圭说:“按照原计划,‘中华字库’工程要在5年内完成,时间紧迫。在文字方面,前三四年要做的主要是各种文字的整理工作,后一两年主要是字库集成的工作。”

    “过去研究文字,是先抄卡片,然后在书斋里一个字一个字地考订。然而由于文献数量巨大,仅仅用传统手段,‘中华字库’工程是不可能完成的。所幸的是,这几年,图像处理技术、数据库技术和网络通信技术等计算机高科技手段的出现,为‘中华字库’工程的完成提供了可能性。”从工程论证之初就开始参与这项工作,张力伟对此感受深刻。

    对这项工程的未来,裘锡圭先生有着更为深远的考虑,“‘中华字库’将是开放性的,建成后并非一劳永逸。如果在新发现的文字资料里出现了新的字或字形(其实,即使是已有资料里的字,也不可能一次就全部收齐),在相关的研究领域中出现了能够补充纠正以往研究的新成果,我们就应该及时加以吸收,使字库得以不断改进、不断完善。理想的状态是,字库工程完成后,还应有经常性的机构为此提供长期的机制保障。这是很有必要的。”(本报记者 吴 娜)

http://epaper.gmw.cn/gmrb/html/2 ... 824_1-09.htm?div=-1
您需要登錄後才可以回帖 登錄 | 立即注册

本版積分規則

簡帛網|手机版|

GMT+8, 2019-12-9 08:42 , Processed in 1.035770 second(s), 15 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表