2009年8月,法国国家图书馆(以下简称“法图”)透露,正与谷歌就其馆藏图书数字化合作进行商谈,并有可能在几个月后有所成果。此举遭到了法国文化界的强烈指责,被认为是“以国家无可估价的文化遗产换取技术服务”。法国文化部长密特朗随后作出紧急表态,叫停法图与谷歌的合作谈判,并宣布成立“图书馆遗产类馆藏数字化委员会”以对图书数字化的发展进行充分研究。2010年1月12日,该委员会提交了《文字遗产数字化报告》(Rapport sur la numérisation du patrimoine écrit,以下简称《报告》),在详细分析图书数字化现状和法图与谷歌的合作意向的基础上,就法国数字图书馆的发展方向提出了建议。
本文试从分析法国与谷歌图书数字化之争的背景和《报告》提出的建议出发,看法国准备如何在文化与网络结合日益紧密的今天发展其数字图书馆。
一、 背景:当数字图书馆与互联网越走越近
(一)随着网络的普及与发展,搜索引擎成为人们获得信息的主要途径
根据联机计算机图书馆中心(OCLC,Oneline Computer Library Center)2005年所做调查显示,虽然图书馆提供的信息在可信度和准确性方面比搜索引擎好,但搜索引擎系统在效率、易用性、便利性、速度等方面占有绝对优势。调查还显示,84%的受访者选择搜索引擎查找特定主题信息。而根据中国互联网络信息中心报告,2009年7月,谷歌搜索以767亿次位居全球搜索引擎用户使用品牌首位,市场分额67.5%,紧随其后的分别是雅虎网站(市场分额7.8%)和百度(市场分额7.0%)。
由此可见,在网络得到极大发展的今天,搜索引擎已成为人们获取信息的主要途径,其中,谷歌搜索以巨大的优势占据市场主导地位。
(二)搜索引擎服务多元化趋势使数字图书馆与搜索引擎的结合成为可能
搜索引擎服务已从单一的文字、图片搜索,向提供音乐、视频、资讯、文件等多元化的搜索发展,搜索结果无疑将因此更有针对性、更加精确。谷歌目前已开发了搜索类、工具类等不同的服务产品20多种。谷歌数字图书馆也正是在这一趋势下应运而生的。谷歌数字图书馆创立于2004年10月,其雄心勃勃的计划是,通过与多所大学和图书馆合作,在十年内完成3000万册图书的数字化处理,目前已完成了1000万册。而雅虎则与互联网档案库(Internet Archive)联合创立了“开源联盟”(OCA,Open Content Alliance),并集合多家机构进行图书数字化。“开源联盟”网站可以向网民提供100多万册公共领域图书。
(三)数字图书馆功能日趋社会化、服务化
经过近40年的发展,数字图书馆已从最初的研究、试验、规划阶段进入应用和规模扩大阶段。其功能也逐渐由传统图书馆、学校或科研机构图书馆负责保管和提供电子图书、文献、专业文件的附属工具转变为面向普通大众的,提供各类文字、影像资料的“在线资料库”,角色定位日益由“精英”走向“平民”。法图所属的Gallica数字图书馆在其1997年创立初期的定位为“提供各领域文献资料,对内容有选择的数字图书馆”。2005年,谷歌提出发展数字图书馆计划后,Gallica迅速调整定位,确定了“整体数字化”(numérisation de masse)的发展方向;2007年又与法国国家出版业公会(SNE)就开放版权图书进入Gallica展开谈判。目前,已有2万册当代出版的图书,可通过Gallica在发行网站上有条件的阅读。此外,报刊杂志的数字化也是Gallica发展的方向。截至2009年底,Gallica可提供95万份资料,其中14.5万本著作,65万分卷图书和期刊,11.5万张图片。目前,Gallica正在研究更新访问页面、站内搜索引擎,提高存储能力,以便更好地满足网民的要求。
综上所述,无论是从网民、搜索引擎还是数字图书馆的角度出发,加强数字图书馆的网络表现力,提升其网络服务力是三方共同的需求,数字图书馆与互联网越走越近已成必然。
二、《报告》所提建议:增强法国文字遗产的网络影响力
如此看来,谷歌与法国国家图书馆的合作无疑是一次双赢的“天作之合”。然而,法国政府有更多忧虑。除了“文化威胁”隐忧外,首先,图书的数字化如果完全依赖于私人公司,而私人公司又不提供后续服务的话,将不利于电子文献的升级和长期使用;其次,合作协议给予了谷歌太多专权,对其数字图书商业开发限制太少而对图书馆使用文件的限制太多,会影响法国数字图书馆自身的发展,此外,谷歌限制其竞争对手对由其数字化的图书进行引用和检索,这会限制法国图书的网络表现力;第三,谷歌搜索的排名方法,会自动地使流行的东西更流行,这可能会导致文化趋同。此外,协议中未提及对非谷歌处理的数字图书该如何使用,以及谷歌对于版权问题的漠视也是人们诟病的一个方面。
在搜索引擎日益发展的今天,法国数字图书馆与谷歌彻底分道扬镳已是不可能,面对谷歌提出的机遇与挑战,法国又该如何发展数字图书馆?本文通过对《报告》所提建议的分析,将其思路分为3个方面。
(一)加快图书数字化进程,增加数字图书拥有量
随着 “整体数字化”策略的提出,法图图书数字化规模迅速扩大,然而数字化工作却分散在不同部门,而不是由一个专门部门集中负责。数字化进展速度不尽如人意,目前法图处理图书的能力为每周1500册,谷歌则为2000册。法图前主席让-诺埃尔﹒雅那耐也承认,Gallica目前14.5万本著作的藏量实在称不上丰富。为了提高数字化效率,适应新的发展策略的要求,《报告》建议通过与其它机构合作,分担数字化进程、分享数字图书来达到加快速度,增加数字图书拥有量的目的。
1、加大与图书馆和出版商的合作
尽管Gallica曾表示愿意接受法图藏书以外的数字化图书,但来自合作图书馆的资料还是寥寥无几(7000份不到)。《报告》指出,如果想在图书数字化进程中充当主要角色的话,法图就需要重新思考其在目标定位、技术选择等方面与其它公有或私营机构的合作模式。《报告》建议,那些有意与法图合作的出版商和图书馆可以保留自由使用其数字图书的权力,分享已取得的数字化成果,分担数字化进程的某些方面工作,但相应的,能否得到数字化公共资助也将取决于是否加入Gallica,换句话说,就是允许Gallica直接或间接地对内容进行检索甚至片段浏览,在需要的情况下,可以对文件进行商业化使用。
2、与谷歌这样的私营机构合作
谷歌数字图书馆计划发展至今已积累了不少经验,图书藏量也很可观(其中相当一部分是出自合作方馆藏的法文资料)。《报告》建议,双方在分担数字化工作的同时,以“以书易书”的方式互换质量相等,格式兼容的数字图书文件;同时,在约定好的条件下,双方又对交换得来的文件拥有自由支配的权力。这样,一方面可以使双方的数字图书资源得到极大丰富;另一方面,各自的元数据和数字图书说明也可以得到改进。《报告》为这一方案设计了“三步走”的实施步骤:
第一步,就交换文件标准和质量以及兼容性评估在大范围内达成一致;
第二步,交换一个拥有一定数量资料的文件库(例如,10万本作品),并对网民的访问情况进行评估;
第三步,在更大范围内交换文件,并出台一个允许双方对交换所得的文件进行商业开发的协议。
(二)提升法国文字遗产的网络影响力
1、加大对法图旗下数字图书馆Gallica的技术建设,提升其网站及内容在网络的知名度和表现力
(1)改名。《报告》分析后认为,Gallica被各搜索引擎搜索到的几率不如人意。以司汤达名著《红与黑》为例,在各大搜索引擎的搜索结果无一直接出自Gallica,即便将二者捆绑搜索,也无法搜到直接出自Gallica的有关内容。
(2)提升网站的被引用率、网站内容的被检索率。《报告》指出,法图技术团队将从接入点多样化、网站特征优化和更易被搜索引擎辨识这3方面着手提升Gallica的网络表现力,网页命名、网址个性化、创建“登陆网页”,甚至购买关键词等都将可能是被采用的手段。
(3)增加新功能,提高Gallica的参与性和互动性。《报告》建议Gallica借鉴维基百科的模式,让网民自己添加内容(如照片、作品等)、辅助信息(有关该作品的论文、作者信息等)或相关评论,甚至向网民提供“贴标签”、“分享”等功能。这样既可以丰富网站内容,也可以提高在网民中的知名度。
2、提升Gallica的服务
(1)优化搜索引擎。Gallica目前使用的搜索引擎是在事先建立的单一目录上运行的,无法对其他数据库产生影响,与法图“整体数字化”的发展方向极不适应。《报告》指出,新的搜索引擎必须满足两个条件:一是向更先进的语义分析工具发展;二是提高搜索精确度,通过分拣、过滤、定位等工具,使读者能够精确查找到所需信息。《报告》特别指出,后者是与谷歌抗衡的重要因素。
(2)元数据标准化。元数据是“数据的数据”,是网民查询数字信息的基础。因此,避免元数据出错并纠正其漏洞就显得尤为重要。目前,Gallica和谷歌数字图书馆使用的都是相同标准的元数据(都柏林核心元数据),可以彼此通用,而不同标准的元数据则不行。由于信息源多种多样又各不相同,以哪种标准来统一数字图书的元数据尚未有定论,但《报告》指出,这是提高搜索精确度的关键。
3、与谷歌、必应、雅虎等搜索引擎合作,扩大法国文字遗产的网络可见率。
上文提过,《报告》建议Gallica与谷歌图书计划合作,交换数字图书文件以丰富各自资源。此外,与谷歌图书合作的另一个好处就是可以利用其搜索引擎功能,提高Gallica被检索到的几率,从而提升网络可见率。
(三)在欧洲范围寻找推动图书数字化进程的新动力
一如法国,其他许多欧洲图书馆或是出于经费原因,或是希望借助谷歌的搜索引擎龙头位置提高自身影响力,也纷纷与其达成了类似的合作协议。《报告》认为,有必要将欧洲联合起来,共同抗衡谷歌的数字图书馆计划。
1、联合有意向的图书馆,建立一个图书馆网络,共同推进数字化进程。该网络可以在以下几个方面发挥作用:数字化协调中心,负责协调数字化的方法、文件格式等,使各图书馆提供的数字图书能够相互通用;数字图书存储中心,可以使各图书馆互相分担数字存储的费用;数字文件交换中心,加入这一网络的图书馆可以相互交换数字图书文件,并在标明来源的情况下,允许对方在自己的数字图书馆发布。
2、推进欧洲数字图书馆Europeana的建设。由法图牵头,欧洲19个国家联合共建的欧洲数字图书馆启动于2008年11月。它的创立可以说是欧洲各国抗衡谷歌的结果。然而,其目前的状况却并不乐观:可提供的资料不多,仅600万份,其中数字图书不足20万,此外,资助与管理方式,如何更好地与私营机构合作,提升图书馆的影响力都是亟待解决的问题。《报告》认为,欧洲数字图书馆可以成为一个“交换场所”:联合各成员就数字图书的元数据、格式等进行合作;协助各成员就交换文件达成协议;协调各成员对无主图书、绝版图书的数字化进行探索。《报告》还提出,要对欧洲数字图书馆的资助方式、一些数字化项目的经费进行进一步的探讨。
3、就公立机构与私营机构合作进行数字化达成一个公共宪章,对公私合作中的几个关键问题加以规定,例如,必须尊重作者版权、数字文件专有权和专有期限不能过于偏向私营机构等,从而对单个图书馆的“公私合作”加以指导。
总体看来,《报告》以加快图书数字化进程和提升法国文字遗产的网络影响力为出发点,通过加强Gallica自身建设、与其他公立或私营机构合作并在欧洲范围寻找推动图书数字化进程的新动力,建立起一个面向世界的,可以与谷歌抗衡的法国文化门户网站,汇集各文化机构原本孤立的数字化成果,并使之成为任何搜索引擎都无法回避的,进入法国文化的必经之路。其根本目的就是要让法国文化在网络世界这一方兴未艾的新媒介中占据重要位置,进一步提升软实力,以免在网络时代全面来临时错失良机。
从上文的分析可以看出,合作,特别是与谷歌这样的私营机构合作,是《报告》所提建议中相当重要的一个方面,既是《报告》撰写的初衷,也是实现《报告》所提建议的关键。那么合作该遵循哪些原则呢?
1、必须在平等互惠的基础上实现合作,杜绝对数字文件的专有。目前,图书馆与私营机构(主要是谷歌)达成或商谈的合作协议中,后者是图书数字化的费用的承担者,数字化完成后,后者向前者提供文件副本,并在相当长的时期内限制前者对数字图书文件的使用。这样,本来对图书拥有完整使用权的图书馆反而成了图书的部分所有者。为了避免出现这样的情况,图书馆就必须成为数字化的主导者或对数字化提供资金,以平等的身份实现互利合作。
2、合作方必须按照法国的法律,尊重作者权益。版权问题是谷歌数字图书馆计划遭人诟病的一个重要方面。去年12月,在与法国马提尼埃(La Martière)集团、法国出版商协会(SNE)和法国文人协会(SGDL)的诉讼中,谷歌被裁决,其在没有得到出版商允许的情况下对图书进行数字化的行为属于侵犯版权。保护作者的权益就是维护民族的创造力,因此,《报告》将“尊重作者权益”列为合作的首要前提。此外,网民查阅有关资料时难免会留下一些个人信息数据,这部分隐私也必须受到保护。
随着科技的发展,网络在人们生活中扮演着日益重要的角色。得益于其便利性和快捷性,人们越来越习惯在网络上学习、交友、娱乐、购物、了解资讯、进行创作等。这在客观上加速了全球化进程,但同时也增大了文化趋同的危险,某些文化凭借其身后雄厚的经济基础和技术实力,迅速在网络世界蔓延扩张,有形成“一言堂”的隐忧。一向对自身文化视若珍宝的法国敏锐地察觉了这一趋势,并迅速作出反应:早在2004年谷歌初提“数字图书馆”计划时,法图前主席雅那耐就加大了Gallica的发展力度,自行对30万册书籍进行了数字处理,并且集合欧洲各大图书馆建立起欧洲数字图书馆Europeana,以期与谷歌抗衡;去年12月,法国政府宣布将从“大国债”计划中拨款7.5亿欧元用于文化遗产数字化工程,法图提出了1.4亿欧元的申请,这无疑将加快法图数字化建设的步伐。法国文化部长密特朗表示,法国图书遗产的数字化必须绝对遵从独立国家意志,并在保护知识产权的条件下进行,这一点事关身份认同,事关集体记忆,事关某些核心价值,其意义超出简单的技术考虑。也许,扩大法国文化的网络影响力,在互联网这一新兴媒介里筑起数字文化“长城”以抵御文化趋同,捍卫自身文化安全,维护文化多样性才是法国发展图书数字化工程的最终目的。(2010年3月27日)
参考资料:
1、法国文化部,Rapport sur la numérisation du patrimoine écrit,2010年1月12日
2、黄梅,《图书馆人看Google》,出自《数字图书馆论坛》2008年第5期
3、中国互联网络信息中心,《2009年中国搜索引擎用户行为研究报告》,2009年9月
4、Jean-Nöel Jeanneney, Quand Google défie l’Europe, 2010年2月第2版
5、张洪浩,《谷歌图书数字化计划进军法国受挫》,2009年9月5日
6、朱晓云,《“Google 图书”,法国文化背上的最后一棵稻草?》,2009年9月24日
7、教莹,《雄心勃勃的法国文化遗产数字化工程》,2009年12月20日
8、http://www.rfi.fr/culturefr/articles/116/article_83770.asp