栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > 学术 > 学术期刊 > 杂草学报

词库聚合类词典外壳App比较研究

词库聚合类词典外壳App比较研究

韩永多

摘要文章通过对当前主流的几种聚合类词典外壳软件的对比分析,探讨各软件对各类词库的读取状况、功能设计、应用,以及词库扩展性。此外,文章还结合当前“互联网+”的特征,对词典App的功能设计及发展提出一些参考性建议。

关键词聚合类词典软件EBWinGoldenDictEudic

一、 研究背景及视点

随着机器翻译研究的推进,电子词典在20世纪40年代登上了历史舞台,80年代起引起了人们的关注,并随着PC的普及获得了快速发展,产生了多种实体电子词典和非实体电子词典。实体电子词典把词典内容固化于芯片或内置的存储介质之内,再辅以相应的硬件及机器外壳。非实体电子词典并不依存于具体的芯片或硬件机器,而是以各类CDROM、App、類似于程序的词库格式、网络在线查询等形式存在。关于这类问题的相关研究,可参见冯建明(2008),高永伟、李洁(2000),李东、解建和(2000),张锦文(2001),章宜华(2001),张淑玲(2005)等。

近年来,随着智能手机、平板电脑的迅猛发展和普及,新型非实体电子词典如雨后春笋般涌现,其中具有代表性的是独立的词典App及各类词典外壳软件。

独立的词典App数量众多。大部分口碑不错的传统词典都被制作成了移动终端上的应用,有iOS及Android版App。

词典外壳类软件的特点是程序本身不带有任何内容,只是一个拥有多种功能的词典外壳,可以读取一种或多种格式的数字词典,并显示词典正文内容、单词或例句的发音、图像、影像等相关信息。目前主要有俄罗斯开发的ABBYY Lingvo、GoldenDict,中国开发的lingoes、StarDict、Mdict、Eudic、Bluedict,日本开发的EBWin series、DDWin、Logovista、Viewing、Logophile,以色列开发的Babylon等。这些软件中有很多都跨多平台,具有广泛的应用性。如EBWin series有windows版的EBWin,安卓和苹果版的EBPocket,Mac OS X版的EBMac;GoldenDict有电脑版和安卓版;Eudic跟EBWin一样支持各个平台。

不同的词典外壳支持不同的词库内容。部分软件只支持读取自家的词库格式,如lingoes、StarDict、Mdict、Bluedict、ABBYY Lingvo、Logovista等。也有软件支持两种以上词库格式,这就是本文要探讨的对象——聚合类软件,目前主要有EBWin series(以下简称EB)、GoldenDict(以下简称GD)和Eudic(以下简称ED)。

关于词典软件的研究,李锡江、包薇(2012)对大学生使用手机App词典做了调查,林皓(2016)对五大ELD词典App做了详尽的论述。本文将选取上文提到的三种聚合类词典App(EB、GD、ED),探讨其对各类词库的读取状况、功能设计,以及词库扩展性。参考词库主要选取与外语教学密切相关的日中、中日、英日、英英词典,软件将选取安卓平台的App。

二、 聚合类词典外壳App的多词库支持与功能设计

(一) 三大聚合类App的词库读取状况

聚合类词典App一般都是在支持自家词库格式的基础之上,逐步增加对其他既有词库格式的读取与检索的,而且不同国家开发的软件对不同语种词库的支持也有偏重。EB偏重于支持日本辞书标准格式EPWING及老牌词典软件厂商LogoVista旗下的词典格式,后来又增加了对StarDict和Mdict的支持。GD除了支持ABBYY Lingvo出版发行的词库之外,还广泛地支持StarDict、Lingoes、Babylon、Dictd files等词库。ED有自己独特的词典规格Eudic,此外支持拥有大量词库以及受众的Mdict、StarDict和Lingoes。

这些词库中,既有与纸质版词典无异的权威词库,如EPWING、ABBYY Lingvo和Babylon,也有民间开发的自定义词库,如Mdict、Lingoes和StarDict等。此外,有些词库软件还提供了制作工具,以便使用者自己制作词库,且制作成的词库不受平台约束,只要有相应的电脑软件或者手机App支持,就可以应用于各个终端。

当然,受软件开发顺序、进度及原始受众的影响,三大App对于在多种词库的支持上有可能出现不完全兼容的情况,比如对某些词典的CSS文件(Cascading Style Sheets的简称,用来控制HTML元素的显示状况,比如HTML内容的颜色、字体、换行、缩进等)、Javascript文件(一种直译式脚本语言,用来给HTML网页增加动态功能,比如给HTML词典文本添加折叠与展开功能、锚点跳转等)无法读取,导致该词库的某些特色功能无法使用。但是三大App都有反馈平台,出现问题之后一般都可以较为快速地得到解决。三大聚合类词典外壳App对各类词库的支持情况如表1所示。

从数量上来看,三大App中EB和GD支持的词库较多,ED次之。从词库质量及权威性来看,EB和GD也要优于ED,前两者包括了大量出版机构正式发布的权威词库,辞书数据的完整性、规范性、权威性都有保障;而ED除了出版机构正式发布的词库格式Eudic之外,所支持的Mdict及Lingoes、StarDict都是民间开发的词典,在权威性、规范性上稍逊一筹。从词库语种来看,EB偏重于日语类词典,独家支持日本电子词典出版规格EPWING,后期的开发中逐步加入了对StarDict和Mdict的读取,这使其多语种性得到增强;GD的词库主要源于出版机构发布的ABBYY Lingvo和Babylon,以俄语、英语、法语、德语等西方主流语言为主;ED自身的词库有多种语言,主要以汉语、英语为主。从所支持词库的扩展性上来看,EB支持的EPWING和Logovista都是主流的词典出版格式,只要词典出版商继续发布此类词典,那么EB的可扩展性就会持续下去;GD具有跟EB类似的特征;ED除法语、德语之外,在其他语种方面存在不足,但是其兼容支持的StarDict和Mdict的易扩展性、词库多样性,让其并不逊色。endprint

(二) 三大聚合类App的功能设计与应用

三大聚合类App具有词典软件共有的基础功能,诸如检索框、词库载入与管理、显示字体种类与大小的设定、关键词高亮显示、检索历史显示等。此外由于App原始支持语种的不同,软件本身也具有某些独特功能。各个App的启动与功能界面截图如图1—图6。

就界面设计来说,EB最为简洁,除了检索框之外,其他的功能按钮都隐藏了起来,点击右上角的标签就可以进行各种功能设定;GD次之,启动时除了检索窗口之外,下方依次有词典管理、上下毗邻词典的词条跳转、发音和其他功能设定菜单;ED最为丰富,启动时App下方提供了词典、翻译、生词本、单词复习、我的(个人自定义菜单,可以下载与词典联动的App“每日英语听力”等,也可以提交反馈意见,更新词库及软件版本)选项,右上角标签包含App的其他各种设定。

1. EB的特色功能与应用

EB初始界面虽然简洁,但是功能并不逊色。尤其在词头的检索机制上,EB具有其他App无法比拟的优势。该App拥有前方、后方匹配检索,精确、交叉、全文检索等众多的检索方式(参见图7)。这些检索方式不但可以精确地找到目标单词,还可以模糊性地找到众多跟目标词条有关联的词汇(参见图8,contra前方匹配模式下的结果共计197条),如查询同词根、词缀的单词等,这样可以对单词进而进行比较分析与记忆,提高学习效率。其中的全文检索功能更为实用。外语的学习与研究离不开大量的例句,全文检索(参见图9,使用全文检索模式查找“精通”一词,截图显示的是《小学馆日中中日词典》中所有包含该内容的词条及词典正文中出现该词的结果,共计66条)则把词典变成了一个小型的语料库。通过全文检索,可以查询单部或多部词典中出现的与目标一致的所有例句。这对外语学习与研究大有裨益。

众所周知,日语表记方式较多,同一个单词可以用平假名、片假名、汉字及罗马字方式表示。比如“秋”这个单词,可以写成“あき”“アキ”“秋”“aki”这四种形式(当然由于词汇种类的不同,有些单词只具有其中的部分写法)。这就对词典软件提出了较高的要求,同一个词条要保证用任何一种表记方式输入,都可以定位到该词条。EB可以直接在输入框进行这种操作,无需像其他软件那样在词典内容上加入超链接(如英语词头索引一般输入字母即可实现,日语表记的多样性导致词典软件采用某一种索引模式之后,其他表记方式的输入无法直接查询到结果,只能在词典内容上添加链接来指向目标词头。比如输入“アキ”“aki”都链接到“秋”来实现查询)来进行词头索引上的跳转(参见图10、图11)。此外,EB支持的原始词库EPWING格式本身是严格按照纸质辞书顺序排列词条、完整收录包含多媒体资料在内的权威词库,在EB安装之后借助于往下滑动的手势或下一页按钮就可以实现如纸质辞书般的阅读感受,这是目前其他App不具備的独特功能(参见图12)。

EB支持的词库众多,所以在实际使用中为了节省运行内存,提高查询速度,需要对词库进行分组,而EB最大支持12个分组,完全可以满足不同的使用场景(参见图13)。另外EB还配备了书签,支持查询分享功能(参见图14),可以将词典内容分享到微信、微博,甚至AnkiDroid(一款优秀的间隔重复学习软件,可以用来记忆与复习单词与表达方式)上,以便利用闲散时间复习巩固所查询的内容,强化记忆。EB还可以与电子书阅读软件“読書尚友”(EB软件研制者开发的安卓系统文本阅读器)及支持分享功能的各类阅读器连动,在阅读时复制目标内容而后切换后台至EB界面,不用输入即可实现查询,这很大程度上提高了阅读与查询的效率。此外,所有本地词库都无法查询到的内容还可以进行网络查询,如某些俗语、谚语、流行语等。EB默认的网络词典有yahoo、google、wikipedia等,并允许用户自定义网络词典的增减,比如添加Oxford、Longman、Cambridge等各大英文在线词典,还可以添加有道词典、金山词霸等网站(参见图15)。当用户想查询更多的网络词典解释时,可以点击Web Dictionary下的任何一个网址,该网址的查询内容将在App内部或通过移动终端的默认浏览器进行显示,较为方便。

由此来看,EB作为一款词典外壳已经高度具备了词典软件所需具有的绝大部分功能,并且针对日语的特殊性做了优化,其在体验上与查询纸质版辞书基本无异,但是在功能上远远超越了纸质辞书,具有较大的发展潜力。

2. GD的特色功能与应用

GD界面较EB而言稍微丰富些。App下方有几个常用功能选项,其他设定都隐藏在右下方最后一个菜单里,包含词典扫描与管理、页面搜索,其他包括诸如字体、显示模式、历史记录处理等词典App的基础功能。与EB相比,GD的功能较为单薄,而其最为独特之处是即点即译功能,即当用户点击词典内容中任何一个词时,GD会自动跳出该单词或者包括该单词在内的单词组合,再次点击之后将自动以该单词为关键词进行查询,十分便利。当然,GD对英文单词的解析最为彻底,基本可以完美地实现即点即译功能,但是对汉语及日语的解析存在欠缺,很多情况下跳出的备选词跟目标词并不完全一致(参见图16—图18)。

从图中可以看出,只需手指点击目标单词“fear”,就能准确识别,再次点击Look up弹出的“fear”即可实现查询。但是日语识别时单词前方出现了“~”,中文则整句识别,这样两者都无法达到即点即译的目的。原因在于GD独家支持Hunspell morphologies格式,这使得其安装了英语的Hunspell之后,不管即点即译功能也好,检索时输入单词的各种变形也罢,都可以准确定位到该单词(参见图19)。GD读取词库时会加载所有词头并写入缓存,所以查询速度较快。此外还支持拼写渐进提示功能,当用户输入单词的前一部分时,下拉窗口就会出现相关的供选词汇,这样在提高查询速度的同时,也在一定程度上规避了拼写错误的产生(参见图20)。endprint

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/xueshu/18049.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号