一、访问网址:www.inindex.com
二、试用时间:2021年11月18日-2022年2月28日
三、访问方式:IP范围内免登录
四、数据库介绍:
【概要介绍】
引得数字人文平台是基于哈佛大学中国历代人物传记资料库(CBDB)项目合作,并结合中国社会科学类科研院所的科研实际不断升级构建而成。CBDB是全球较早进行数据结构化的大型中国历代人物关系传记数据库,是新文科建设中的里程碑式的研究成果,亦是数字人文研究发展的重要路径。
引得数字人文平台包括四大子系统:中国历代人物传记资料库(CBDB)、中国通用古籍文库、数字人文可视化挖掘系统、数字人文文本处理基础工具系统。通过四大子系统提供的服务,可以帮助相关高校、科研院所的专家学者、教师学生构建、优化数字人文素养训练环境、教学环境和研究环境。
【数据库组成】
引得数字人文平台包含“两库、两工具”。
1.传记查询:中国历代人物传记资料库(CBDB)
中国历代人物传记资料库CBDB是由哈佛大学费正清中国研究中心、台湾中央研究院历史语言研究所、北京大学中国古代研究中心及中文在线四方共同合作打造的记录中国古典数据的数字人文资源平台。CBDB是全球较早进行数据结构化的大型中国历代人物关系传记数据库,目前收录从先秦到晚清约49万人的传记、著作资料,约4亿字,每年新增4万条传主和100万条信息。收录人物主要出自七世纪至十九世纪,其中以唐、宋、明、清的人物传记资料最为充实。该数据除了可以作为人物研究的参考资料之外,引得平台亦可提大数据挖掘,进行可视化呈现,可广泛用于群体传记研究、地理空间分析、社会交往网络分析等。
注:试用期间无法批量下载数据
2.通用文献:中国通用古籍文库
引得平台中国通用古籍文库与CBDB互通,是一款可在线实时全文检索的大型古籍资源库数据。文库收录中国公私机构现存从先秦至民国撰写并经写抄本、刻本、印本、影印的历代汉文古籍资源约2万种31亿文字。该数据库可以做到字字可检索,可按照部、属、书名、著者、高级检索等功能。
注:试用期间无法批量下载数据
3. 人文工具:数字人文文本处理基础工具
为学者提供文本识别、批量标注、简繁转换、自动句读、命名实体、文本比对的全流程、一站式文本处理工具箱服务,大幅提高文献数字化、结构化效率。截至目前,古籍在线OCR工具对竖排古籍识别正确率接近92%,横排简体识别正确率接近98%。
4. 元引图表:数据可视化挖掘工具
数字人文可视化挖掘系统包括100余款多样化基础图表,可以接入多种数据源,利用知识图表工具、大数据和相关概念构建可视化图表,实现从数据置入、存储、展现、挖掘的全流程管理,帮助数字人文领域的专家学者用可视化手段分析,生动呈现研究过程中的结构化数据。无需编程便可轻松制作专业图表。数据可视化挖掘工具助力学者视野更宽更广,发现研究新方向。