项目1. 人工智能历史老师语料库
(1)可以加入历史文献、论文资料等等
(2)为了贴近语言习惯,可以加入一些基本语料
(3)要加入课本中的内容,同时把各种对史实的评价也跟着加入
(4)可以对录入信息的性质进行区分,如《三国演义》中的虚构段落可加上备注标签,告诉使用者这不是史实
项目2.关于一个B站UP主的语料库
首先,这应该是一个可以实时爬取信息的语料库,这样才可以跟上最新的信息 、动态
以@在下曼妥思(以下称阿思)为例 我们可以加入他的基础信息 同时应该加入一些保证对话通顺的基础语料
那么,在此基础上就可以给AI限制一个爬取信息的范围,比如阿思的动态等等
同时,要确定这个AI的用处是关于阿思的问答,那么针对部分问题AI需要做出对他的一些评价
这就需要加入关于人物评价的语料了
AI还可以爬取他的视频,提取语料作为自主训练
因为阿思是一个文物修复区UP,如果提关于专业手法的问题,AI应该做出详尽完整的答复
这就需要把领域内的专业信息录入进去了