语料库在线
网站用户
登录
注册
语料库检索
现代汉语语料库
古代汉语语料库
语料库字词索引
语料分析处理
分词和词性标注
汉语拼音标注
字词频率统计
研究资源
资源下载
相关网站
关于网站
欢迎访问语料库在线网站!
用户: [ 游客 ] ,未登录!
登录
语料库检索:
现代汉语语料库
古代汉语语料库
网站动态
修正了关键词显示错乱等问题,提升了检索速度。 _2016/08/29
资源下载:字频、词频统计软件更新,提升处理速度。 _2014/07/16
资源下载:支持加入用户自定义词表的自动分词工具可下载。 _2014/07/15
语料库检索:增加了关键词居中(KWIC)排序和直接显示语料出处功能。
语料分析处理:增加了可在线使用的分词和词性自动标注、汉语拼音自动标注、语料字词频率统计等功能。
现代汉语语料库检索
语料库:国家语委现代汉语平衡语料库
语料库样本数:9487个(样本数即篇章数)
语料库字符数:19455328个(含汉字、字母、数字、标点等)
语料库总词语数:12842116个(含单字词、多字词、字母词、外文词、数字串、标点符号等)
语料库总词语个数:162875(指语料库出现的分词单位的个数)
语料库总汉字词语个数:151300(含汉字的词语个数,不包括外文词、标点、数字串等)
语料库说明:国家语委现代汉语语料库是一个大规模的平衡语料库,语料选材类别广泛,时间跨度大。在线提供检索的语料经过分词和词性标注,可以进行按词检索和分词类的检索。
更多信息请参考:
现代汉语语料库数据及使用说明
古代汉语语料库检索
语料库:古籍语料库
语料库字数: 约7000万字
语料库说明:古代汉语语料库包含自周至清各朝代的文本语料,含四库全书中的大部分古籍资料。 部分书目如下:诗经、尚书、周易、老子、论语、孟子、左传、楚辞、礼记、大学、中庸、吕氏春秋、尔雅、淮南子、史记、战国策、三国志、世说新语、文心雕龙、全唐诗、朱子语类、封神演义、三国演义、水浒传、西游记、红楼梦、儒林外史等。
语料库检索:语料库未经标注,支持全文检索、模糊检索,支持语料出处、关键词居中(KWIC)排列显示。
语料库字词索引
语料库:国家语委现代汉语平衡语料库(在线部分)
语料库检索:提供在线语料库字词索引表的检索,带有词类标记和词频信息。
语料分析处理
语料分词和词性标注
: 在线使用的语料分词和词性标注工具。
语料汉语拼音自动标注
: 在线使用的语料汉语拼音自动标注工具。
语料字词频率统计
: 在线使用的语料字词频率统计工具。
语料分析处理软件的单机版可在研究资源页面下载。
研究资源
资源下载
: 提供语料库相关文档、语料处理软件工具、语料字词表等研究资源的下载。
相关网站
: 提供语料库研究相关网站的链接。
声明
本网站是非营利性学术网站,网站语料资源中可能存在错误,请使用者自行甄别。
本网站所有资源仅限于用作学术研究目的,不得用于营利性开发等用途。
语料库在线 © 2011~2023
京ICP备11040934-8号
教育部语言文字应用研究所计算语言学研究室