从《儒藏》的本质看古籍数字化的价值理念和技术前景

时间:2019-03-25 05:52:01 来源:颍东门户网 作者:匿名



从《儒藏》的本质看古籍数字化的价值理念和技术前景

作者:未知

摘要:古籍数字化是数字出版系统工程的重要组成部分。《儒藏》该项目是中国,韩国,日本和越南在古籍文献中密切合作的成功典范。

古籍的文本特征和古籍的编纂和出版的目的决定了古籍的数字化应该采用以学术研究为主的价值观。

这种价值取向也决定了古籍数字技术体系建设的方向。它必须在过去的“寻求全速率”和“精确率”的基础上改变搜索功能,并将其转化为真正以研究者为导向的高端智能检索系统。

从学术研究到文化大众化的古籍数字化必须充分发挥“一体机组合”的优势,促进学术研究与数字技术的合作。

关键词:古籍数字化;价值观;文化大众化

十多年前,数字出版在中国出版业仍然是一个备受争议的话题。长期以来的印刷技术似乎创造了更多依赖书籍的传统。

麦克卢汉说,今天的加速往往是全面的,当经济的任何一部分加速时,其他部分将不可避免地效仿。

目前,电子技术改造的总体前景非常明显,加速将继续,这是不可阻挡的。

世界图书市场的数字化仍在加速,随着习惯于“屏幕阅读时代”的消费群体的快速增长,盗版和免费资源的泛滥,以及传统出版和营销成本上升,传统论文质量发布正面临艰难的转型。

目前在人们面前的是如何做到这一点以及如何做得更好。

当然,古代书籍的数字化也不容忽视。

古籍数字化的主要问题是纸质书籍,特别是古籍,会不会消亡?美国Darnton教授开玩笑说,我们创造的信息远远超过了可以实现的数字信息。

他在八个难以克服的技术问题中引用了“Google图书搜索计划”。最重要的问题是,虽然屏幕上显示的扫描图像是正确的,但仍然无法掌握书本的关键,如纸质材料。任何电子书都没有印刷质量和装订风格的“感觉”以及书籍发布的特殊“气味”。因此,古书的电子图片远没有原书那么令人兴奋。

中国古代书籍文字的具体形式 - 字体,格式,版面,装订,纸质材料,印刷质量,装订风格,侧边栏,头,脚,书耳,线,心,鱼尾甚至书边距这是整体的一部分文本结构本身。这在文学研究和版本研究中尤为重要,它成为一种表达古籍意义的独特结构。

例如,在西方,羊皮被捆绑成书,这是一种水平阅读方法。中国将竹子切成一本书,将其编成一卷,并将其向左右扩展。它形成了一种从右到左阅读的习惯,然后形成一种东方民族风格。整理风格。

对于上述问题,钱存勋,张秀敏,潘继兴等着名学者都进行了详细的研究,所以我不再赘述。

纸质古籍具有独特的文化品味。电子书不提供或提供某些实物形式。许多人更喜欢纸质阅读而不是电脑屏幕。

因此,可以说纸质古籍不会消失,它将与数字出版并存。

2003年,杨牧之先生利用文源阁《四库全书》电子版的优势,信息量大,检索快捷方便,倡导古籍数字化。他认为这是古代书籍发展的趋势,是组织古籍的时代。新的工作要求。

这充分说明出版界的有识之士已经意识到古籍的数字化是一种历史发展趋势。

在一定程度上,中国古籍特别有利于建立大型历史文献数据库。我们有一千多年的大量文学和文学可以作为数字出版内容,而东亚有着悠久的中国历史,我们的优势特别好。突出。

《儒藏》本质是基于464种代表中国学术思想的儒家经典。选用了韩国,日本和越南历史上100多种中国重要的儒家作品,共计339本,约2.5本。十亿字。

这四个国家的古代汉语都是普通的汉字,语言比较简单。它更有利于联合建立大型历史文本电子文本数据库和高效,高效的检索系统。

特别需要指出的是,古代书籍和传统纸质出版物在文本内容和目标人口方面的数字化没有根本区别,但在使用文本的工具层面上发生了变化。古籍的数字化是基于编撰和出版的古籍的内容。目的和任务应符合古籍编纂和出版的目的和任务,即主要用于学术研究。

这种情况即使在未来很长一段时间也不会改变,这表明古代书籍的数字化必须优先服务于学术研究的价值。

许益民先生详细阐述了“中国古籍”的定义,认为古籍的主要部分是指辛亥革命前以中文编纂出版的书籍。

古籍所产生的历史和文化背景简而言之,主要由传统知识精英产生和服务。

说到古书所呈现的文本内容形式,如沉王树先生说,中国古籍最大的缺陷是整体表现形式与现代读者不同,语言中存在障碍。写作。

这个问题是由历史引起的。汉语和书写的形状,声音和意义具有时代特征。古代和现代语言有一定的差异。

正如宋代朱熹所说:“当时人们彼此认识,没有一个生活在儒家的老师。

(《朱子语类》第78卷)过去的语言可能有所不同,从古代到现代,语法不同于古代到现代。特别是自五四新文化运动以来,白话已经渗透到人们的心中,阅读古籍的人数逐渐减少。

传统的古代书籍垂直排列并没有标点。古代汉语语法和词义表达与现代汉语不同。各种典故的陌生程度客观地缩小了读者的范围。

古籍的特征本身决定了古籍的编纂和出版与其他着作的出版之间的区别。出版和出版古籍的工作可分为三个层次:第一层,复印或古籍的数字保存;第二级,用于科学研究和教学。人员使用;第三级,供一般读者阅读。

然而,古籍的安排主要是通过适当的方法服务于当代或未来的学术文化。

金克木先生认为,整理古籍的目的有两个:一是专家和半专家(银行非专家),另一个是普通人和年轻人。后者必须添加一个必要的先决条件:教育内容和方法。改革将在不降低语言水平的情况下提高语言水平。它不仅会说“再见”而不是“辞职”。古籍数字服务组主要是学术研究者。未来,古籍数字化的目标仍然是学术研究小组。这种区分秩序的工作概念尤为重要。实际上,它与建立古籍数字技术体系的方向性问题有关。

古籍数字化以学术研究为重点,有必要将其技术系统设计转化为研究者的标准,建立面向学术研究的古籍数据库。

二十多年来,中国古籍数字化之路基本上通过两条路径进行:一是用计算机揭示古籍,建立古籍书目数据库,为读者提供搜索和使用;另一种是将计算机用于古籍。内容被数字化,并提供一些相关的知识工具,使读者不仅可以通过计算机阅读古籍,还可以将它们传播到磁盘,CD和网络上。

显然,这个数字系统的设计并没有考虑到用户,特别是研究人员的需求,因此到目前为止大多数研究人员认为检索系统只能帮助他们找到信息,但却无法帮助组织或分析数据。

因此,台湾学者提出的“数字人性”概念对我们具有指导意义。 “数字人文”是大量数字资料和利用信息技术从事人文科学研究的结合体。

研究导向系统在数字数据的使用中发挥着关键作用。只有建立一个强大的系统,用户才能自由地观察历史数据,为自己的研究,探索历史资料之间的背景,并开始自己的讨论。 。

台湾学者向杰和翁安安解释了传统数字出版和研究型数字出版与“谜题”和“积木”的概念之间的区别:尽管谜题似乎是分开的,但它们必须结合起来合理。只有一种拼凑方式,即设计师给出的图像;构建块是非常不同的,它可以根据用户的不同想法和需求创建各种组合。

以研究为导向的系统使用户能够更轻松,更方便地制作满足其研究需求的各种组合。

以《儒藏》的数字化为例。随着本书电子版的逐步推广,版权问题将得到解决。《儒藏》版本启动后,本质问题将逐渐减少。您可以使用“文本磁带绘图”,它是图像版本和文本版本的组合,以提供准确的基于学校的文本,原始原始和各种基于学校的图像。

图像版本可以保留原件和学校的原始外观,并使纸张的古籍的原始外观(包括物理形式)尽可能地出现。

通过这种方式,文本版本和图像版本在同一环境中共存,扩展了传统印刷版本的容量,在密集的上下文信息网络中连接基础和不同的教科书,并将它们连接起来形成所谓的“超文本“网络。每本古籍的内容和价值都可以在多个层面上实现。可以在学校课本的过程中实现稀有书籍和各个学校,解决校对质量问题和一些难题,甚至发现许多新问题。

这种“超文本”系统还必须具有带有各种可能链接的开放多维网络。检索系统还将尝试开发版本之间的各种关联,并建立观察环境,让搜索者或用户可以自由地将搜索结果发展成有意义或有问题意识的文档集,并为其提供各种方法。用户观察文本之间的上下文。

《儒藏》本质最显着的特征是计算机技术在文本版本的处理中发挥了巨大作用。

有三个关键因素:首先,《儒藏》有一个成熟的《儒藏》出版物规范。

每个书籍组件的文本版本都有关于字体,字体大小,层次结构和顺序的详细规则。

其次,《儒藏》本质是儒家文学的集合,其类型简单,更有利于建立详细的文本分析功能,关键词检索,超文本链接等信息单元。

最后,《儒藏》本质文本内容是准确的。

《儒藏》编辑和校对采用简洁校对和现代标点符号的排版方法。这不仅避免了已经出版的一系列大型复印系列的重复,更重要的是,它迎合了人文科技进一步融合的趋势。

《儒藏》精英数字系统研究平台杨欣将建立一个面向研究的智能检索系统。过去,作为评估系统指标的“精确率”或“寻求率”可能只是一个起点。《儒藏》数字检索系统的本质不仅是被动地提供搜索功能,而且还具有主动开启新主题的能力。

《儒藏》数字检索系统首先考虑儒家经典的自我特征,并确定儒家经典所需的检索系统。它充分吸收了儒家经典的优秀成果,形成了一个开放的多学科。搜索系统可以尝试连接各种研究资源,如知网,万方等数据库资源,形成丰富研究数据的“超文本”链接,建立数据与数据之间的有机联系,并对数据进行深度处理。并开发,形成学术资源,不断探索新的研究背景或方向,构建学术研究的整体环境,充分实现学术研究与数字技术的互动,形成“人机整合”的对话过程。 “。

让我们谈谈古籍数字化的文化普及。

达顿先生曾经想象“电子书”可以设计成金字塔式的多层次结构,读者可以根据自己的需要采用不同层次的阅读和研究方法。

这种想法是个好主意。

金良年先生认为,古代知识精英文化如何将经典书籍转化为流行文化也值得深思。

古籍数字化的普及仍需要学术研究才能不断创新,努力推广经典。

当然,这也需要数字技术的进步。

纸质印刷品具有自然限制,例如迫使读者接受其形式,结构和空间。这些形式的材料的局限性限制了读者参与的自由。

在数字环境中,材料形式的局限性将被迅速克服,读者不仅可以对文本进行各种操作(如索引,扩充,复制,分解,重组,转移等),甚至可以参与写。

退后一步,读者可能会干预文本,修改文本,重写文本,并将它们变成自己的东西。

未来古籍的数字资源也可以让读者参与文本构建或以非常“个性化和个性化”的方式学习。这可能使数百人同时在线阅读 - 这本古老的书籍或公众对同一句话的评论,古籍的数字化也可能成为满足公众利益的“公共花园”。

相关新闻
新闻排行