我们如何获得这些文献资料?
任何数字化历史报刊的项目遇到的第一个令人头痛的问题是,我们使用哪个版本?不熟悉新闻史的人们可能会很惊讶地发现,没有哪种日报仅有一个版本。历史上,大部分的报纸每天都发行或仍在发行多个版本,包括晚间版、周末版和各种地区版本。尽管各种版本之间內容大体相同,但总会有一些差别,例如新闻报道、广告的选择,甚至是一些很小的细节,例如报头。那么,哪一个版本才是用于数字化的”权威“版本呢?理想情况下,我们也许应当数字化这份报纸的所有版本,这样研究者就能看到它的全貌。不出意料,在大部分情况下,这么做的成本会令它不可能获得成功,数字化一个版本的费用就已经非常高昂。但这其实也有用户体验的考虑在里面。人们在检索一套报纸档案时真的希望看到他们的检索结果因报纸的多个版本而变得数量巨大吗?无疑一些学者能从中获益,但我们的经验表明报纸档案的用户遍布各个研究领域,包括家族历史学家、理科院系和中小学校。让档案库更简单明了、清晰直观是非常重要的。
对于20世纪70年代以及微缩胶片盛行以前的內容,大部分的档案都数字化自报纸或期刊的年度或半年合订本。这些“图书馆版本”恰是出版商为保存和收藏的目的而出版的。正如Laurel Brake指出的,这些版本通常不包括“非正式、准文字的部分”,例如广告页、增刊,一些情况下甚至是封面。2图书馆版本必然是最被广泛参阅的印刷版报纸,但需要注意的是,它们并不比其他版本更权威。20世纪70年代以后,大部分的主流英国报纸启动了微缩胶片项目,为存档的目的保存他们的报纸。尽管很多报纸仍在出版图书馆合订本,但微缩胶片代表了保存方式的转变,单期的报纸每个月被制成微缩胶片。与此同时,大部分的报纸也将他们的图书馆合订本过刊制成了微缩胶片,因此他们所有的报纸都在微缩胶片上了。
对于“《每日邮报》历史典藏”,它也是这样被制成微缩胶片的,归属于联合报业公司,我们正是使用这些微缩胶片进行的数字化。在微缩胶片上,该报每天发行时间最晚的伦敦版成为了制作微缩胶片时使用的版本,因此大部分情况下,这也是我们的用户看到的版本。一些情况下,如果当天最晚的版本缺失,那么我们会使用较早的版本。
使用微缩胶片导致了一些问题,主要因为其介质。有很多期报纸,特别是较早期的报纸,我们确定微缩胶片图像不适合数字化,报纸原件撕裂或损坏,一开始就不应当用于制作微缩胶片,或者由装订紧实的合订本制作微缩胶片的一些报纸,边缘弯曲过大,文字模糊。在大部分这类情况下,我们用大英图书馆独立制作的另一套微缩胶卷代替了这些图像。需要强调,微缩胶片本身并不是数字化的不良介质。如果原始的微缩胶片制作良好,由保存良好的原件制成,即便是几十年之久的微缩胶片也能生成非常出色的数字化图像。
处理微缩胶片的过程中我们还发现了一些令人惊讶的不同寻常之处,表明了较早期的编辑们做出的选择。在1926年大罢工期间,舰队街没有发行任何报纸。在微缩胶片上,在巴黎发行的《每日邮报大陆版》(Daily Mail Continental Edition)填补了这个缺口。我们决定在数字化档案中保留这部分,而不是让报纸在罢工期间成为空白。
所有我们能收集到的增刊都包含在内。此处的“增刊”是指独立于报纸的主要部分标注了页码的报纸组成部分。在印刷版中,增刊有时出现在报纸的中间。作为纸质报纸的包装方式,这是合理的,让报纸更紧凑、更易于折叠。但在数字化版本中,完全重现这些增刊出现的位置是不必要的,因为它会让报纸的页面顺序变得极为混乱,有时会将一篇文章一分为二。用户无法像纸质版那样抽出这些附加的杂志和增刊,不受干扰地阅读报纸正文。因此我们将增刊放在了报纸的后面。
《周末》(The Weekend)杂志,包括1992年开始的星期日增刊,被不连续地制作成微缩胶片,因此我们在数字化档案中也没有完整收录它们。因为成本的原因,我们无法扫描缺失的杂志和增刊来填补这些空白。虽然很遗憾,但这个项目的主要目标是主刊。还有一些其他必要的缺省。该报有苏格兰版和爱尔兰版,以及《大陆每日邮报》( Continental Daily Mail)和从1944年到1946年每周发行的美国版,甚至还有布莱叶盲文版,最终都无法收录在档案库中。此外,还有1983年开始每周发行的《星期日邮报》(Mail on Sunday)。尽管归属于同一公司,是《每日邮报》的姊妹刊,但《星期日邮报》是一份独立的报纸,有自己的编辑和记者团队,历史也没有《每日邮报》悠久。因此,我们认为将其从这个项目中排除是合理的。如果很多用户对此感兴趣,《星期日邮报》可以在未来作为升级模块加入到这个档案库中。最后一点,阿尔弗雷德·哈姆斯沃思(Alfred Harmsworth)在《每日邮报》1896年5月4日正式创刊前制作了不少于63份“样本”报纸,以测试他在排版、视觉冲击力和內容均衡等方面的想法。这些“样本”报纸仅有一部分留存下来,从未对公众发行,因此也没有包括在以收录“正式”报纸为目的的这套档案库中。