语料库是按照一定采样标准采集的电子文本集合,常用来研究一种语言或者语言变体。上个世纪80年代,语料库开始应用于词典编纂,并取得了显著的成果,其代表作是柯林斯系列词典。到目前为止,大部分词典的编纂都使用到了语料库。除了词典编纂之外,语料库在外语教学和科研中也得到了广泛的应用。

在大数据时代,语料库的规模也不断扩大,柯林斯语料库(Collins Corpus)的规模已经突破了45亿词。随着语料库数据规模的增大,传统的语料库软件已经难以满足需求,大数据语料的检索和挖掘成为迫切需要解决的问题。另外,语料库的建设和研究往往需要定制化的技术服务和专家指导。

在这样的背景下,汇智明德(北京)教育科技有限公司与柯林斯出版集团、北京外研在线教育科技有限公司通力合作,推出了集语料库建设与共享、语料库检索与挖掘、语料库科研支持与服务于一身的大数据语料库平台——语料云(Corpus Cloud)。

产品功能

  • 语料库
  • 服务
  • 检索
  • 统计
  • 搭配
  • 词表
  • 关键词计算
  • 文本分析
  • 实用工具
  • BNC、BROWN、FROWN、CROWN 等多种免费语料库

  • 版权引进Bank of English、Collins Corpus 等多种大型商用语料库

  • 多种学习者语料库

  • 大量用户共享的语料库