「小学堂文字学资料库」是一个形、音、义综合的文字学资料库,可提供使用者根据文字的形、音等属性先检索出字头,再透过字头连接到个别的形、音、义资料库或字书索引。
本资料库由台湾行政院国家科学委员会经费补助,台湾大学中国文学系、中央研究院历史语言研究所、资讯科学研究所共同开发;台湾大学整合声韵资料,中央研究院整合字形资料及开发检索系统。
本资料库收录的字形涵盖甲骨文、金文、战国文字、小篆及楷书,总数超过20万字;收录的声韵资料涵盖上古、中古、近代及现代,总数超过128万笔;收录的字书索引资料则超过35万笔。
本资料库主要由汉字古今字资料库及汉字古今音资料库组成。汉字古今字资料库由甲骨文、金文、战国文字、小篆、异体字表资料库组成,而汉字古今音资料库则由上古音、中古音、近代音、官话、晋语、吴语、徽语、赣语、湘语、闽语、粤语、平话、客语、其他土话资料库组成,各资料库除可互相连结外,也可独立使用。
本资料库也包含了形音以外的资料库,例如甲骨文合集材料来源表资料库;也提供了一些语文工具软体的下载,例如吴守礼台语注音字型及输入法,小学堂增益集。
本资料库是一个整合型的资料库,期望能以单一查询界面,透过检索出的字头,衔接网际网路上不同的形、音、义资料库。初期衔接的资料库包括教育部的异体字字典及重编国语辞典、原行政院主计处电子处理资料中心的「CNS11643中文标准交换码全字库」、中华开放古籍协会的「开放康熙字典」、「数位典藏与数位学习国家型科技计画」的「国际电脑汉字与异体字知识库」。
本资料库、程式码,及其使用字型整体受到著作权法保护,目前仍在研议未来合宜的授权方式,但使用者操作本网站查询介面所得之各解析度「字形图片」及字形属性资讯,权利人特于此明示主张以CC0 1.0通用方式,在法律许可的范围内,抛弃该字形图片及字形属性资讯依著作权法可得享有之权利,使用者当可安心再行利用该查询字形图片及字形属性资讯。
快速連結